Publicado en: Apr 10, 2018
Las AMI de aprendizaje profundo de AWS para Ubuntu y Amazon Linux incluyen ahora optimizaciones avanzadas para TensorFlow 1.7, adaptadas para ofrecer entrenamiento de alto desempeño en instancias C5 y P3 de Amazon EC2.
En entrenamientos basados en CPU, las AMI incluyen ahora TensorFlow 1.7 integrado con extensiones vectoriales avanzadas (AVX) de Intel, SSE y conjuntos de instrucciones de FMA, para acelerar los cálculos de vectores y coma flotante. Las AMI están también totalmente configuradas con Intel MKL-DNN, para acelerar las rutinas matemáticas usadas en el entrenamiento de redes neuronales con los procesadores Intel Xeon Platinum que operan las instancias C5 de Amazon EC2. El entrenamiento de modelo para análisis comparativo ResNet-50 con el conjunto de datos sintético ImageNet fue 9,8 veces más rápido que el entrenamiento sobre los archivos binarios normales de TensorFlow 1.7 usando nuestra compilación optimizada en un tipo de instancia c5.18xlarge.
Además, para mejorar el desempeño del entrenamiento en escenarios basados en GPU, las AMI incluyen una compilación optimizada de TensorFlow 1.7, completamente configurada con NVIDIA CUDA 9 y cuDNN 7, para aprovechar el entrenamiento de precisión mixta en las GPU Volta V100 que operan las instancias P3 de Amazon EC2.
Por último, esta versión también incluye TensorBoard 1.7, para ayudarle a visualizar y depurar el entrenamiento de su modelo, y TensorFlow Serving 1.6, para crear rápidamente el prototipo de un punto de conexión de inferencia para sus modelos entrenados. Las AMI también incluyen Microsoft Cognitive Toolkit 2.5, con mejoras de desempeño y correcciones de errores.
Consulte la guía del desarrollador para dar sus primeros pasos con las AMI de aprendizaje profundo de AWS. También se puede suscribir a nuestro foro de debate, donde anunciamos nuestros lanzamientos y podrá publicar sus preguntas.