Publicado: Mar 23, 2021
A AWS expandiu a disponibilidade das instâncias Inf1 do Amazon EC2 para as regiões Europa (Milão), Europa (Estocolmo) e AWS GovCloud (EUA). As instâncias Inf1 são desenvolvidas por chips do AWS Inferentia, que a AWS projetou de forma personalizada para fornecer alto desempenho e inferência de machine learning de menor custo na nuvem.
Essas instâncias oferecem taxa de transferência até 30% mais alta e custo por inferência até 45% menor do que as instâncias G4dn do Amazon EC2, que já eram a instância de menor custo para inferência de machine learning na nuvem. As instâncias do Inf1 são ideais para aplicações como reconhecimento de imagem, processamento de linguagem natural, personalização e detecção de anomalias. Os desenvolvedores podem gerenciar suas próprias plataformas de desenvolvimento de aplicações de machine learning executando instâncias Inf1 com AMIs do AWS Deep Learning, que incluem o SDK Neuron, ou usando instâncias Inf1 pelo Amazon Elastic Kubernetes Service (EKS) ou pelo Amazon Elastic Container Service (ECS) para aplicações de ML em contêineres. O suporte do SageMaker, do EKS e do ECS para instâncias Inf1 nessas novas regiões estará disponível em breve.
As instâncias Inf1 do Amazon EC2 estão disponíveis em 4 tamanhos, fornecendo até 16 chips do Inferentia, 96 vCPUs, 192 GB de memória, 100 Gbps de largura de banda de rede e 19 Gbps de largura de banda do Elastic Block Store (EBS). Essas instâncias podem ser adquiridas Sob demanda, como instâncias reservadas, como instâncias Spot ou como parte de Savings Plans e agora estão disponíveis em 21 regiões em todo o mundo, entre elas: Leste dos EUA (Norte da Virgínia, Ohio), Oeste dos EUA (Oregon, Norte da Califórnia ), AWS GovCloud (EUA-Leste, EUA-Oeste), Canadá (Central), Europa (Frankfurt, Irlanda, Londres, Milão, Paris, Estocolmo), Ásia-Pacífico (Hong Kong, Mumbai, Seul, Cingapura, Sydney, Tóquio), Oriente Médio (Bahrein) e América do Sul (São Paulo).
Para começar a usar, visite o guia de conceitos básicos. Para saber mais visite a página da instância Inf1 do Amazon EC2.