Publicado: Nov 19, 2020
A AWS expandiu a disponibilidade das instâncias Inf1 do Amazon EC2 para Oeste dos EUA (Norte da Califórnia), Canadá (Central), Europa (Londres), Ásia-Pacífico (Hong Kong, Seul) e Oriente Médio (Bahrein). As instâncias Inf1 são desenvolvidas por chips do AWS Inferentia, que a AWS projetou de forma personalizada para fornecer alto desempenho e inferência de machine learning de menor custo na nuvem.
Essas instâncias oferecem taxa de transferência até 30% mais alta e custo por inferência até 45% menor do que as instâncias G4 do Amazon EC2, que já eram a instância de menor custo para inferência de machine learning na nuvem. As instâncias do Inf1 são ideais para aplicações como reconhecimento de imagem, processamento de linguagem natural, personalização e detecção de anomalias.
Os desenvolvedores podem gerenciar suas próprias plataformas de desenvolvimento de aplicações de machine learning executando instâncias Inf1 com AMIs do AWS Deep Learning, que incluem o SDK Neuron, ou usando instâncias Inf1 pelo Amazon Elastic Kubernetes Service (EKS) ou pelo Amazon Elastic Container Service (ECS) para aplicações de ML em contêineres. O suporte do SageMaker para instâncias Inf1 nessas novas regiões estará disponível em breve.
As instâncias Inf1 do Amazon EC2 estão disponíveis em 4 tamanhos, fornecendo até 16 chips do Inferentia, 96 vCPUs, 192 GB de memória, 100 Gbps de largura de banda de rede e 19 Gbps de largura de banda do Elastic Block Store (EBS). Essas instâncias podem ser adquiridas sob demanda como instâncias reservadas ou como instâncias spot, ou como parte de Savings Plans. Elas estão disponíveis globalmente em 17 regiões, incluindo Leste dos EUA (Norte da Virgínia, Ohio), Oeste dos EUA (Oregon, Norte da Califórnia), Canadá (Central), Europa (Frankfurt, Irlanda, Londres, Paris), Ásia-Pacífico (Hong Kong), Mumbai, Seul, Singapura, Sydney, Tóquio) Oriente Médio (Bahrein) e América do Sul (São Paulo).
Para começar a usar, visite o guia de conceitos básicos. Para saber mais visite a página da instância Inf1 do Amazon EC2.