Publicado: Apr 10, 2018
As AMIs do AWS Deep Learning para Ubuntu e Amazon Linux agora são fornecidas com otimizações avançadas, adaptadas ao TensorFlow 1.7 para entregar um treinamento de alto desempenho nas instâncias C5 e P3 do Amazon EC2.
Para cenários de treinamento com base em CPU, as AMIs agora incluem o TensorFlow 1.7 integrado aos conjuntos de instruções Advanced Vector Instructions (AVX) da Intel, SSE e FMA para acelerar a computação de vetor e ponto de flutuação. As AMIs também estão totalmente configuradas com o Intel MKL-DNN para acelerar as rotinas matemáticas usadas no treinamento de rede neural nos processadores Intel Xeon Platinum que alimentam instâncias C5 do Amazon EC2. O treinamento de uma referência ResNet-50 com o conjunto de dados ImageNet sintético era 9,8X mais rápido do que o treinamento em binários do estoque TensorFlow 1.7 usando nossa compilação otimizada em um tipo de instância c5.18xlarge.
Além disso, para melhorar a performance do treinamento para cenários com base em GPU, as AMIs incluem uma compilação otimizada do TensorFlow 1.7 totalmente configurada com o NVIDIA CUDA 9 e o cuDNN 7 para aproveitar o treinamento de precisão misto em GPUs do Volta V100 que alimentam instâncias P3 do Amazon EC2.
Por fim, esta release ainda inclui o TensorBoard 1.7 para ajudá-lo a visualizar e a depurar seu treinamento de modelos, e o TensorFlow Serving 1.6 para prototipagem acelerada de um endpoint de inferência para seus modelos treinados. As AMIs também incluem o Microsoft Cognitive Toolkit 2.5 com melhorias de performance e correções de erros.
Conheça mais sobre as AMIs do AWS Deep Learning no guia do desenvolvedor. Você também pode assinar nosso fórum de discussão para obter anúncios de lançamentos e publicar suas perguntas.