Publicado: May 15, 2018
As AMIs do AWS Deep Learning para Ubuntu e Amazon Linux agora são fornecidas com otimizações avançadas para o TensorFlow 1.8, para entregar um treinamento de maior performance nas instâncias C5 e P3 do Amazon EC2.
Para cenários de treinamento com base em CPU, as AMIs agora incluem o TensorFlow 1.8 integrado aos conjuntos de instruções Advanced Vector Instructions (AVX) da Intel, SSE e FMA para acelerar a computação de vetor e ponto de flutuação. As AMIs também estão totalmente configuradas com o Intel MKL-DNN para acelerar as rotinas matemáticas usadas no treinamento de rede neural em instâncias C5 do Amazon EC2. O treinamento de uma referência ResNet-50 com o conjunto de dados ImageNet era 7X mais rápido do que o treinamento em binários do estoque TensorFlow 1.8 usando nossa compilação otimizada em um tipo de instância c5.18xlarge com tamanho de lote de 32.
Além disso, para melhorar a performance do treinamento para cenários com base em GPU, as AMIs incluem uma compilação otimizada do TensorFlow 1.8 totalmente configurada com o NVIDIA CUDA 9 e o cuDNN 7 para aproveitar o treinamento de precisão misto em GPUs do Volta V100 que alimentam instâncias P3 do Amazon EC2.
Quando você ativa o ambiente virtual, as AMIs do Deep Learning implantam automaticamente compilações de maior performance do TensorFlow, bem como outras estruturas de aprendizado profundo, como Chainer e CNTK otimizados para a instância do EC2 de sua escolha.
Comece agora a usar as AMIs do AWS Deep Learning com nosso tutorial de conceitos básicos e nosso guia do desenvolvedor para consultar mais tutoriais e recursos. Você também pode assinar nosso fórum de discussão para obter anúncios de lançamentos e publicar suas perguntas.