Publicado en: Dec 3, 2019
Hoy presentamos la disponibilidad general de las instancias Inf1 de Amazon EC2, que se crean desde cero para admitir las aplicaciones de inferencia de aprendizaje automático. Las instancias Inf1 ofrecen hasta 16 chips de AWS Inferentia, chips de inferencia de aprendizaje automático de alto rendimiento diseñados y creados por AWS. Además, hemos asociado los chips de Inferentia a los últimos procesadores personalizados Intel® Xeon® escalables de segunda generación y a redes hasta 100 Gbps para lograr una inferencia de alto rendimiento. Esta potente configuración permite que las instancias Inf1 ofrezcan un rendimiento hasta 3 veces mayor y un costo por inferencia hasta 40 % menor en comparación con las instancias G4 de Amazon EC2, que eran las instancias de menor costo para la inferencia de aprendizaje automático disponibles en la nube hasta el momento.
Las instancias Inf1 de Amazon EC2 ofrecen alto rendimiento y la inferencia de aprendizaje automático de menor costo en la nube. Con las instancias Inf1, los clientes pueden ejecutar aplicaciones de inferencia de aprendizaje automático a gran escala, como el reconocimiento de imagen, el reconocimiento de voz, el procesamiento de lenguaje natural, la personalización y la detección de fraudes, al costo más bajo en la nube.
AWS le facilita implementar las aplicaciones de aprendizaje automático en las instancias inf1 de Amazon EC2. Una vez que se entrena su modelo, puede utilizar AWS Neuron, un SDK para ejecutar inferencia utilizando chips de AWS Inferentia que consiste de un compilador, tiempo de ejecución y herramientas de generación de perfiles. Neuron está preintegrado en marcos de aprendizaje automático populares, que incluyen TensorFlow, Pytorch y MXNet para ofrecer un rendimiento óptimo de las instancias Inf1 de EC2. Las instancias Inf1 se pueden implementar mediante el uso de las AMI de aprendizaje profundo de AWS y estarán disponibles a través de los servicios de administración como los de Amazon SageMaker, EKS y ECS.
Las instancias Inf1 de Amazon EC2 se presentan en 4 tamaños y están disponibles en las regiones de AWS de EE. UU Este (Norte de Virginia) y EE. UU Oeste (Oregón) como instancias de spot, bajo demanda y reservadas o como parte de un Savings Plan. Para obtener más información acerca de las instancias Inf1, visite la página de Inf1.