Instancias Inf1 de Amazon EC2: nuevas características, rendimiento mejorado y precios más bajos

Publicado en: Jun 25, 2021

Las instancias Inf1 de Amazon EC2 y AWS Neuron ya son compatibles con los modelos de aprendizaje profundo YOLOv5 y ResNext, así como con los últimos transformadores de Hugging Face de código abierto. También hemos optimizado el compilador de Neuron para mejorar el rendimiento. Ahora puede lograr un rendimiento inmediato 12 veces mayor que las instancias basadas en GPU comparables en los modelos BERT base preentrenados. Con estas mejoras podrá cumplir los requisitos de inferencia de alto rendimiento e implementar modelos de aprendizaje profundo de última generación de forma eficaz a un costo bajo.

Las instancias Inf1 de EC2 están powered by AWS Inferentia, un chip personalizado desarrollado por AWS para acelerar la inferencia de machine learning. Estas instancias ofrecen el costo más bajo para la inferencia de aprendizaje profundo en la nube. Puede entrenar fácilmente sus modelos de machine learning en marcos de machine learning populares, como TensorFlow, PyTorch y MXNet, e implementarlos en instancias Inf1 de EC2 con el SDK de Neuron. Puesto que Neuron está integrado con marcos de machine learning populares, puede implementar sus modelos existentes en instancias Inf1 con muy pocos cambios en el código. Esto le brinda flexibilidad a la hora de mantener la portabilidad del hardware y aprovechar las últimas tecnologías sin tener que limitarse a una solución específica del proveedor.

Las instancias Inf1 han tenido gran aceptación entre clientes, como Snap, Autodesk y Conde Nast, y servicios de Amazon, como Alexa y Rekognition. Están disponibles en 23 regiones de AWS en todo el mundo. Nuestras inversiones en ingeniería, junto con nuestra escala y habilidad para gestionar la capacidad, de eficacia demostrada a lo largo del tiempo, nos permiten identificar y legar los ahorros a nuestros clientes. Para que pueda escalar todavía más sus aplicaciones de aprendizaje profundo en producción en instancias Inf1 de Amazon EC2, anunciamos una reducción del 38 % en nuestros precios de servicios en diferido que estará en vigor desde el 1 de junio de 2021. Para los clientes que quieran aprovechar los Savings Plans o las instancias reservadas para reducir aún más los costos, disminuiremos los precios de las instancias reservadas y los Savings Plans de 1 año en un 38 % y, los de 3 años, en un 31 %. Estos precios más bajos también serían efectivos para aquellos clientes que usen instancias Inf1 de EC2 mediante servicios de organización de contenedores, como Amazon ECS en EKS.

Para aquellos clientes que prefieran usar un servicio de machine learning completamente gestionado, también reduciremos el precio de las instancias ml.Inf1 en Amazon SageMaker. Amazon SageMaker es un servicio completamente gestionado que brinda a todos los científicos de datos y desarrolladores la capacidad de crear, entrenar e implementar modelos de machine learning. Desde el 1 de junio de 2021, los clientes de Amazon SageMaker pueden beneficiarse de la reducción en un 38 % de los precios de las instancias en diferido. Desde hoy, bajamos los precios de Saving Plans (1 año) de Amazon SageMaker en hasta un 38 % y los de Saving Plans (3 años) en hasta un 25 %. Estos precios reducidos aumentan la relación calidad-precio de las instancias Inf1 para poder abordar sus necesidades de inferencia en tiempo real. Para más información sobre los precios de las instancias ml.Inf1, visite la página de precios de Amazon SageMaker.

Las instancias Inf1 de Amazon EC2 están disponibles en 23 regiones, incluidas EE. UU. Este (Norte de Virginia y Ohio), EE. UU. Oeste (Oregón, Norte de California), AWS GovCloud (EE. UU. Este y EE. UU. Oeste), Canadá (Central), UE (Fráncfort, Irlanda, Londres, Milán, París y Estocolmo), Asia-Pacífico (Hong Kong, Mumbai, Seúl, Singapur, Sídney, Tokio), Medio Oriente (Baréin) y América del Sur (São Paulo) y China (Pekín y Ningxia). Puede beneficiarse de las instancias Inf1 de Amazon EC2 en la región que mejor cumplirará sus requisitos de latencia en tiempo real para la inferencia de machine learning, ahora con una mayor optimización del rendimiento y costos más bajos.

Para obtener más información, visite la página de instancias Inf1 de Amazon EC2.

Instancias Inf1 de Amazon EC2: nuevas características, rendimiento mejorado y precios más bajos

Finalización de la compatibilidad con Internet Explorer