Publicado en: Oct 17, 2023
Nos complace anunciar las versiones preliminares de las instancias ml.p4d, ml.trn1 y ml.g5, en nuevas regiones, para ofrecer la inferencia asíncrona y en tiempo real de modelos de machine learning (ML) en Amazon SageMaker. Por lo general, estas instancias también están disponibles en otras regiones para su inferencia.
- Las instancias ml.p4d.24xlarge, ahora disponibles como versión preliminar en las regiones AWS GovCloud (Oeste de EE. UU.), Europa (Irlanda), Asia-Pacífico (Tokio) y Asia-Pacífico (Singapur), ofrecen un alto rendimiento para los modelos de deep learning. Con 40 GB de memoria por GPU Nvidia A100, las instancias P4d habilitan inferencias de machine learning de alto rendimiento en modelos de gran tamaño y casos de uso de IA generativa.
- Las instancias ml.trn1, ahora disponibles como versión preliminar en la región Oeste de EE. UU. (Oregón), admiten cargas de trabajo de inferencia de alto rendimiento en modelos de deep learning e IA generativa de más de 100 000 millones de parámetros, que abarcan aplicaciones como el resumen de textos, la generación de código y la respuesta a preguntas.
- Las instancias ml.g5, ahora disponibles como versión preliminar en Asia-Pacífico (Seúl) y América del Sur (São Paulo), son ideales para casos de uso como recomendaciones, chatbots, asistentes inteligentes y reconocimiento de imágenes.
Para acceder a estas versiones preliminares, simplemente solicite un aumento del límite mediante las Service Quotas de AWS. Para obtener información sobre estas instancias, consulte nuestra página de precios. Si quiere obtener más información sobre los modelos de implementación con SageMaker, consulte la descripción general aquí y la documentación aquí. Para obtener más información sobre las versiones preliminares de las instancias, consulte las páginas de los productos G5, la Trn1 y P4.