Las instancias de cuaderno de SageMaker ahora admiten los tipos de instancia P5en.48xl
Nos complace anunciar la disponibilidad general de las instancias P5en.48xl de Amazon EC2 en las instancias de cuadernos de SageMaker.
Las instancias P5en de Amazon EC2 cuentan con 8 GPU H200 que tienen un tamaño de memoria GPU 1,7 veces mayor y un ancho de banda de memoria de GPU 1,4 veces mayor que las GPU H100 incluidas en las instancias P5. Las instancias P5en combinan las GPU H200 con procesadores escalables Intel Xeon de cuarta generación personalizados de alto rendimiento, lo que permite utilizar PCIe Gen5 entre la CPU y la GPU, lo que proporciona hasta 4 veces más ancho de banda entre la CPU y la GPU y aumenta el rendimiento de inferencia y entrenamiento de la IA. El P5en, con hasta 3200 Gbps de tercera generación de EFA que utiliza Nitro v5, muestra una mejora de la latencia de hasta un 35 % en comparación con el P5, que utiliza la generación anterior de EFA y Nitro. Esto ayuda a mejorar el rendimiento de las comunicaciones colectivas para cargas de trabajo de entrenamiento distribuido, como el aprendizaje profundo, la IA generativa, el procesamiento de datos en tiempo real y las aplicaciones de computación de alto rendimiento (HPC).
Las instancias P5en.48xl de Amazon EC2 están disponibles en las instancias de cuadernos de SageMaker en las regiones de AWS este de EE. UU. (norte de Virginia y Ohio), oeste de EE. UU. (Oregón) y Asia-Pacífico (Tokio).
Consulte las guías para desarrolladores a fin de obtener instrucciones sobre la configuración y el uso de las aplicaciones JupyterLab y CodeEditor en las instancias de cuadernos de SageMaker Studio y SageMaker.