게시된 날짜: Mar 20, 2019

AWS Deep Learning AMI를 이제 Amazon Linux 및 Ubuntu 외에도 차세대 Amazon Linux인 Amazon Linux 2에서 사용할 수 있습니다. 또한 AWS Deep Learning AMI는 이제 소스에서 바로 맞춤식으로 제작되고 Amazon EC2 인스턴스에서의 고성능 교육에 맞게 조정된 MXNet 1.4.0, Chainer 5.3.0, PyTorch 1.0.1 및 TensorFlow 1.13.1과 함께 제공됩니다.  

CPU 인스턴스에서 TensorFlow 1.13은 EC2 C5 인스턴스를 구동하는 Intel Xeon Platinum 프로세서의 성능을 가속화하도록 소스에서 바로 맞춤식으로 제작됩니다. Deep Learning AMI를 사용하여 ResNet-50 모델을 합성 ImageNet 데이터로 교육하면 스톡 TensorFlow 1.13 바이너리보다 처리량이 9.4배 빨라집니다. GPU 인스턴스는 NVIDIA CUDA 10 및 cuDNN 7.4로 구성된 TensorFlow 1.13의 최적화 빌드와 함께 제공되어 Volta V100 GPU 구동 EC2 P3 인스턴스에서 혼합 정밀 교육 기능을 활용합니다. TensorFlow 교육을 다중 GPU로 확장하려는 개발자를 위해, Deep Learning AMI에는 Horovod 분산 교육 프레임워크가 함께 제공됩니다. 이 프레임워크는 Amazon EC2 P3 인스턴스로 구성된 분산 교육 클러스터 토폴로지를 효율적으로 사용하도록 완벽하게 최적화되어 있습니다. Deep Learning AMI에서 TensorFlow 1.13 및 Horovod를 사용하여 ResNet-50 모델을 교육하면 8개 노드에서 스톡 TensorFlow 1.13보다 처리량이 27%가 빨라집니다.

AWS Deep Learning AMI는 이제 성능 및 사용 편의성이 개선된 Apache MXNet 1.4의 최신 릴리스와 함께 제공됩니다. MXNet 1.4는 추론용 Java 바인딩, Julia 바인딩, 실험적 제어 흐름 연산자, JVM 메모리 관리를 비롯해 다양한 부분이 추가로 향상되었습니다. 또한 이 릴리스에서는 향상된 그래픽 최적화 및 양자화를 바탕으로 Intel MKL-DNN에 대한 MXNet 지원 수준을 개선합니다. 이 기능은 메모리 사용량을 줄이는 것은 물론, 정확도를 크게 떨어뜨리지 않으면서 추론 시간을 개선합니다.

시작 안내서와 개발자 안내서의 초급~상급 자습서를 사용하면 AWS Deep Learning AMI를 빠르게 시작할 수 있습니다. Conda 환경을 활성화하면 Deep Learning AMI가 선택한 EC2 인스턴스에 맞게 최적화된 프레임워크의 고성능 빌드를 자동으로 배포합니다. AWS Deep Learning AMI에서 지원하는 프레임워크 및 버전의 전체 목록은 출시 정보를 참조하십시오. 토론 포럼을 구독하면 출시 공지를 확인하고 질문을 게시할 수도 있습니다.