게시된 날짜: Feb 4, 2019
오늘, AWS는 EC2 GPU 인스턴스에서 기계 학습 및 고성능 컴퓨팅 애플리케이션을 원활하게 실행할 수 있도록 Amazon Elastic Container Service(ECS)의 지원 기능이 향상되었다고 발표했습니다. 이제 ECS 작업 정의를 통해 다수의 GPU를 지정하여 ECS가 워크로드 격리 및 성능 최적화를 위해 적절히 고정할 특정 컨테이너에 할당할 수 있습니다.
ECS에서 GPU를 활용할 수 있기 이전에는 물리적 GPU를 특정 컨테이너에 할당하려면 사용자 지정 방식으로 구성된 자체 AMI를 가져와서 사용자 지정 vCPU 배치 로직을 프록시로 사용해야 했습니다. 또한, 고정 작업이나 격리 작업도 수행할 수 없었습니다. 하지만 이제는 사전에 구성된 Nvidia 커널 드라이버, 적절한 Docker GPU 런타임 및 CUDA의 기본 버전이 함께 제공되는 ECS GPU 최적화 AMI를 p2 및 p3 인스턴스와 함께 사용할 수 있습니다. 이제 작업 정의를 통해 다수의 GPU를 지정하여 ECS가 일정 예약 메커니즘으로 사용할 특정 컨테이너에 할당할 수 있습니다. 컨테이너가 이러한 인스턴스에 배치되므로, ECS는 워크로드를 격리하고 성능을 최적화하기 위해 물리적 GPU를 특정 컨테이너에 고정합니다.