Publicado en: Oct 17, 2023
Nos complace anunciar la versión preliminar de las instancias ml.p5.48xlarge para implementar modelos de machine learning (ML) para la inferencia asíncrona y en tiempo real en Amazon SageMaker.
Con 80 GB de memoria por GPU NVIDIA H100 Tensor Core (640 GB en total), 30 TB de almacenamiento SSD NVMe local, 192 vCPU y 2 TiB de memoria de instancia, las instancias ml.p5.48xlarge están diseñadas para permitir la inferencia de machine learning de alto rendimiento en cargas de trabajo de IA con uso intensivo de recursos informáticos, como la respuesta a preguntas, la , la generación de videos e imágenes y el reconocimiento de voz.
Las instancias ml.p5.48xlarge ya están disponibles para su uso en SageMaker en el este de EE. UU.(Norte de Virginia) y oeste de EE. UU. (Oregón).
Para acceder a la versión preliminar, solo tiene que solicitar un aumento del límite a través de AWS Service Quotas. Para obtener información sobre estas instancias, consulte nuestra página de precios. Si quiere obtener más información sobre los modelos de implementación con SageMaker, consulte la descripción general aquí y la documentación aquí. Visite la página del producto P5 para obtener más información sobre las instancias P5 en general.