Publicado: Dec 3, 2019
Hoje, anunciamos a disponibilidade geral das instâncias Inf1 do Amazon EC2, criadas do zero para oferecer suporte a aplicativos de inferência de machine learning. As instâncias Inf1 contam com até 16 chips AWS Inferentia, chips de machine learning de alta performance projetados e fabricados pela AWS. Além disso, combinamos os chips Inferentia com os mais recentes processadores Intel® Xeon® Scalable de segunda geração personalizados e redes de até 100 Gbps para inferência com alto throughput. Essa configuração poderosa permite que as instâncias Inf1 ofereçam throughput até três vezes mais alto e custo por inferência até 40% menor do que as instâncias G4 do Amazon EC2, que já eram a instância de menor custo para inferência de machine learning disponível na nuvem.
As instâncias Inf1 do Amazon EC2 oferecem alta performance e a menor inferência de machine learning na nuvem. Usando instâncias Inf1, os clientes podem executar aplicativos de inferência de machine learning em larga escala (como reconhecimento de imagem, reconhecimento de fala, processamento de linguagem natural, personalização e detecção de fraude) pelo menor custo na nuvem.
A AWS facilita a implantação do aplicativo de machine learning nas instâncias Inf1 do Amazon EC2. Após o treinamento do modelo, você poderá usar AWS Neuron, um SDK para execução de inferência usando chips AWS Inferentia que consiste em um compilador, tempo de execução e ferramentas de criação de perfil. O Neuron é pré-integrado a estruturas populares de machine learning, incluindo TensorFlow, Pytorch e MXNet, para oferecer performance ideal às instâncias Inf1 do EC2. Instâncias Inf1 podem ser implantadas usando AWS Deep Learning AMIs e estarão disponíveis por meio de serviços gerenciados, como Amazon SageMaker, EKS e ECS.
As instâncias Inf1 do Amazon EC2 vêm em 4 tamanhos e estão disponíveis nas seguintes regiões da AWS Leste dos EUA (Norte da Virgínia) e Oeste dos EUA (Oregon) como Instâncias spot, sob demanda e reservadas ou como parte de um Savings Plan. Para saber mais sobre as instâncias Inf1, acesse a página das instâncias Inf1.