Publicado en: Mar 23, 2021
AWS ha ampliado la disponibilidad de las instancias Inf1 de Amazon EC2 a las regiones UE (Milán), UE (Estocolmo) y AWS GovCloud (EE. UU.). Las instancias Inf1 utilizan tecnología de chips de AWS Inferentia, con diseño personalizado de AWS, para brindar un alto rendimiento y el menor costo por inferencia para machine learning en la nube.
Estas instancias ofrecen un rendimiento hasta un 30 % mayor y un costo por inferencia hasta un 45 % menor en comparación con las instancias G4dn de Amazon EC2, que eran las instancias de menor costo en la nube para inferencias de machine learning. Las instancias Inf1 son ideales para aplicaciones como el reconocimiento de imágenes, el procesamiento de lenguaje natural, la personalización y la detección de anomalías. Los desarrolladores pueden gestionar sus propias plataformas de desarrollo de aplicaciones de machine learning; para ello, pueden lanzar instancias Inf1 con AMI de AWS Deep Learning, que incluyen Neuron SDK, o usar instancias Inf1 a través de Amazon Elastic Kubernetes Service (EKS) o Amazon Elastic Container Service (ECS) para aplicaciones de machine learning en contenedores. El soporte de EKS, ECS y SageMaker para instancias Inf1 en estas nuevas regiones estará disponible pronto.
Las instancias Inf1 de Amazon EC2 están disponibles en 4 tamaños y ofrecen hasta 16 chips de Inferentia, 96 CPU virtuales, 192 GB de memoria, 100 Gbps de ancho de banda de red y 19 Gbps de ancho de banda de Elastic Block Store (EBS). Estas instancias pueden adquirirse bajo demanda, como instancias reservadas, como instancias de spot o como parte de Savings Plans, y están disponibles ahora en 21 regiones de todo el mundo, incluidas EE. UU. Este (Norte de Virginia, Ohio), EE. UU. Oeste (Oregón, Norte de California), AWS GovCloud (EE. UU.-Este, EE. UU.-Oeste), Canadá (Central), UE (Fráncfort, Irlanda, Londres, Milán, París, Estocolmo), Asia-Pacífico (Hong Kong, Mumbai, Seúl, Singapur, Sídney, Tokio), Medio Oriente (Baréin) y América del Sur (São Paulo).
Para comenzar, consulte nuestra Guía de introducción. Para obtener más información, visite la página de instancias Inf1 de Amazon EC2.