Amazon ECS 관리형 인스턴스, 이제 AWS Trainium과 AWS Inferentia 지원
Amazon Elastic Container Service(Amazon ECS) 관리형 인스턴스가 이제 AWS Trainium과 AWS Inferentia를 지원합니다. 이 두 전용 AI 액셀러레이터는 광범위한 생성형 AI 워크로드 전반에 걸쳐 훈련과 추론을 위한 확장 가능한 성능과 비용 효율성을 제공하도록 설계되었습니다. Amazon ECS 관리형 인스턴스는 인프라 관리 부담을 없애면서도 Amazon EC2의 모든 기능을 활용할 수 있도록 설계된 완전관리형 컴퓨팅 옵션입니다. ECS 관리형 인스턴스는 인프라 운영을 AWS로 오프로드함으로써 워크로드의 신속한 시작 및 확장을 지원하며, 성능을 향상시키고 총 소유 비용을 절감합니다.
ECS 관리형 인스턴스를 사용하면 원하는 애플리케이션 성능과 필요한 단순성을 모두 얻을 수 있습니다. 이제 ECS 관리형 인스턴스 용량 공급자를 생성하고 Inferentia2, Trainium1, Trainium2를 포함한 원하는 가속 인스턴스 유형을 선택한 다음 태스크 정의의 리소스 요구 사항 섹션에 NEURON_CORE=all 구성을 추가할 수 있습니다. 그러면 Amazon ECS가 지정한 인스턴스를 시작하고 인스턴스당 단일 태스크를 배치하여 최적의 성능을 위해 액셀러레이터의 모든 리소스를 워크로드에 자동으로 할당하도록 지시합니다.
ECS 관리형 인스턴스를 시작하려면 AWS Console, Amazon ECS MCP 서버 또는 선호하는 코드형 인프라 도구를 사용하여 신규 또는 기존 Amazon ECS 클러스터에서 활성화하면 됩니다. 일반 Amazon EC2 비용에 더해 프로비저닝된 컴퓨팅 관리 비용이 부과됩니다. ECS 관리형 인스턴스에 대한 자세한 내용은 기능 페이지, 설명서, AWS 뉴스 출시 블로그에서 확인하세요.