게시된 날짜: May 15, 2018
Ubuntu 및 Amazon Linux용 AWS Deep Learning AMI는 이제 TensorFlow 1.8를 위한 고급 최적화 기능을 통해 Amazon EC2 C5 및 P3 인스턴스에 대한 고성능 훈련을 제공합니다.
CPU 기반 훈련 시나리오에서, AMI는 이제 Intel의 고급 벡터 지침(AVX), SSE 및 FMA 지침 세트를 탑재한 TensorFlow 1.8을 포함하여 벡터 및 부동점 계산을 가속화합니다. 또한 AMI는 Intel MKL-DNN이 완전히 구성되어, Amazon EC2 C5 인스턴스에서 신경망 훈련에 사용되는 수학 루틴을 가속화합니다. ImageNet 데이터세트를 사용한 ResNet-50 벤치마크 훈련은 배치 크기 32의 c5.18xlarge 인스턴스 유형에서 최적화된 빌드를 사용할 경우 기존 TensorFlow 1.8 바이너리에서의 훈련보다 7배 더 빠릅니다.
그 뿐 아니라 GPU 기반 시나리오에서 훈련 성능을 개선하기 위해 AMI는 NVIDIA CUDA 9 및 cuDNN 7이 완전히 구성된 TensorFlow 1.8의 최적화된 빌드를 통해 Amazon EC2 P3를 구동하는 Volta V100 GPU의 혼합 정밀 훈련을 활용합니다.
가상 환경을 활성화할 때 Deep Learning AMI는 고성능 빌드의 TensorFlow뿐 아니라 원하는 EC2 인스턴스에 최적화된 Chainer 및 CNTK 등의 다른 딥 러닝 프레임워크도 자동으로 배포합니다.
AWS의 빠른 시작하기 자습서를 사용하여 AWS Deep Learning AMI를 시작하고 개발자 안내서에서 다양한 자습서 및 리소스를 참조하십시오. 토론 포럼을 구독하면 출시 발표 소식을 받고 질문을 게시할 수도 있습니다.