Publicado en: Aug 4, 2023
Los trabajos de entrenamiento de Amazon SageMaker ahora admiten instancias ml.p5, con chips H100 de NVIDIA, que están diseñadas específicamente para aplicaciones de entrenamiento de ML de alto rendimiento en la nube. Puede usar instancias ml.p5 en SageMaker para entrenar algunos de los modelos más exigentes. Esto incluye modelos de lenguaje de gran tamaño (LLM) y modelos de difusión que impulsan las aplicaciones de IA generativa más exigentes. Estas aplicaciones incluyen la respuesta a preguntas, la generación de código, la generación de video e imágenes y el reconocimiento de voz.
Las instancias ml.p5 incluyen actualmente hasta 8 de las últimas GPU H100 Tensor Core de NVIDIA. Las instancias P5 complementan las GPU Tensor Core H100 de NVIDIA con el doble de rendimiento de la CPU, el doble de memoria del sistema y el cuádruple de almacenamiento local en comparación con las instancias basadas en GPU de la generación anterior. Ofrecen capacidades de escalabilidad horizontal líderes en el mercado para el entrenamiento distribuido y combinan estrechamente las cargas de trabajo de HPC con hasta 3200 Gbps de redes mediante la tecnología Elastic Fabric Adapter (EFA) de segunda generación.
Actualmente, SageMaker Model Training admite instancias ml.p5 en las regiones de AWS Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón) en el tamaño ml.p5.48xlarge.
Para obtener más información sobre las instancias ml.p5, visite la página de instancias P5. Para comenzar a utilizar las instancias ml.p5, inicie sesión en la consola de Amazon SageMaker. Para obtener más información acerca del entrenamiento de modelos de Amazon SageMaker, visite nuestra página web.