Amazon Elastic Inference presenta nuevos aceleradores con mayor memoria de GPU

Publicado en: Oct 25, 2019

Amazon Elastic Inference presenta los nuevos aceleradores de Elastic Inference llamados EIA2, con hasta 8 GB de memoria de GPU. Ahora, los clientes pueden usar Amazon Elastic Inference en modelos más grandes o modelos que tienen tamaños de entrada más grandes para el procesamiento de imágenes, la detección de objetos, la clasificación de imágenes, el procesamiento de voz automatizado y el procesamiento del lenguaje natural, y otros casos de uso de aprendizaje profundo.

Amazon Elastic Inference le permite adjuntar la cantidad justa de aceleración impulsada por GPU a cualquier instancia de Amazon EC2, instancia de Amazon SageMaker o tareas de Amazon ECS para reducir el costo de ejecución de la inferencia de aprendizaje profundo hasta un 75 %. Con Amazon Elastic Inference, puede elegir el tipo de instancia que mejor se adapte a las necesidades generales del CPU y la memoria de su aplicación, y configurar por separado la cantidad de aceleración de inferencia que necesita sin cambios de código. Hasta ahora, podía aprovisionar un máximo de 4 GB de memoria de GPU en Elastic Inference. Ahora, puede elegir entre 3 nuevos tipos de acelerador, que tienen 2 GB, 4 GB y 8 GB de memoria GPU respectivamente. Próximamente, Amazon Elastic Inference admitirá modelos TensorFlow, Apache MXNet y ONNX con más marcos de trabajo.

Los nuevos aceleradores de Elastic Inference están disponibles en EE. UU. Este (Virginia), EE. UU. Oeste (Oregón), EE. UU. Este (Ohio), Asia Pacífico (Seúl) y UE (Irlanda). Próximamente se incorporarán otras regiones.

Para obtener más información, consulte la página del producto.

Amazon Elastic Inference presenta nuevos aceleradores con mayor memoria de GPU

Finalización de la compatibilidad con Internet Explorer