Publicado en: May 15, 2018
Las AMI de aprendizaje profundo de AWS para Ubuntu y Amazon Linux incluyen ahora optimizaciones avanzadas de TensorFlow 1.8, adaptadas para ofrecer entrenamiento de alto desempeño en instancias C5 y P3 de Amazon EC2.
En entrenamientos basados en CPU, las AMI incluyen ahora TensorFlow 1.8 integrado con extensiones vectoriales avanzadas (AVX) de Intel, SSE y conjuntos de instrucciones de FMA, para acelerar los cálculos de vectores y coma flotante. Las AMI están también totalmente configuradas con Intel MKL-DNN, para acelerar las rutinas matemáticas usadas en el entrenamiento de redes neuronales en instancias C5 de Amazon EC2. Tardamos 7 veces menos en entrenar un modelo ResNet-50 con el conjunto de datos de ImageNet que en entrenarlo con los binarios almacenados de TensorFlow 1.8. Para ello, usamos una compilación optimizada en un tipo de instancia c5.18xlarge con un tamaño de lote de 32.
Además, para mejorar el desempeño del entrenamiento en escenarios basados en GPU, las AMI incluyen una compilación optimizada de TensorFlow 1.8, completamente configurada con NVIDIA CUDA 9 y cuDNN 7, para aprovechar el entrenamiento de precisión mixta en las GPU Volta V100 que operan las instancias P3 de Amazon EC2.
Cuando se activa el entorno virtual, las AMI de aprendizaje profundo implementan automáticamente las compilaciones de mayor desempeño de TensorFlow, así como otros marcos de aprendizaje profundo como Chainer y CNTK, optimizados para la instancia de EC2 que elija.
Dé sus primeros pasos con las AMI de aprendizaje profundo de AWS mediante nuestro tutorial de inicio rápido y nuestra guía del desarrollador, para acceder a más tutoriales y recursos. También se puede suscribir a nuestro foro de debate, donde anunciamos nuestros lanzamientos y podrá publicar sus preguntas.