Amazon EC2 UltraClusters
Ejecute aplicaciones de HPC y ML a escala
¿Por qué elegir UltraClusters de Amazon EC2?
Los UltraClusters de Amazon Elastic Compute Cloud (Amazon EC2) pueden ayudarlo a escalar a miles de GPU o chips de ML e IA personalizados, como AWS Trainium, para obtener acceso bajo demanda a una supercomputadora. Democratizan el acceso a un rendimiento de supercomputación para los desarrolladores de machine learning (ML), IA generativa y computación de alto rendimiento (HPC) mediante un modelo de uso simple de pago por uso sin costos de configuración o mantenimiento. Las instancias de Amazon EC2 que se implementan en EC2 UltraClusters incluyen las instancias P6e-GB200, P6-B200, P5en, P5e, P5, P4d, Trn2 y Trn1.
Los UltraClusters de EC2 constan de miles de instancias de EC2 aceleradas que se ubican en una zona de disponibilidad de AWS determinada y se interconectan mediante redes de Elastic Fabric Adapter (EFA) en una red sin bloqueos a escala de petabits. Los UltraClusters de EC2 también brindan acceso a Amazon FSx for Lustre, un almacenamiento compartido totalmente administrado que se basa en el sistema de archivos paralelo de alto rendimiento más popular para procesar rápidamente conjuntos de datos masivos bajo demanda y a escala con latencias inferiores a los milisegundos. Los UltraClusters de EC2 brindan capacidades de escalado horizontal para el entrenamiento de ML distribuido y cargas de trabajo de HPC estrechamente acopladas.
Beneficios
Tiempo de solución más rápido para el entrenamiento distribuido y la HPC
Acceso bajo demanda a una supercomputadora a exaescala
Flexibilidad para optimizar el rendimiento y los costos
Características
Redes de alto rendimiento
Almacenamiento de alto rendimiento
Compatibles con instancias y servidores UltraServer
Servidores UltraServers P6e-GB200
Las instancias P6e-GB200, aceleradas con NVIDIA GB200 NVL72, en una configuración UltraServer ofrecen el rendimiento de inferencia y entrenamiento de IA de GPU más alto de Amazon EC2.
Instancias P6-B200
Las instancias P6-B200 de Amazon EC2, aceleradas con las GPU NVIDIA Blackwell, ofrecen instancias de alto rendimiento para el entrenamiento de IA, la inferencia y la HPC.
Instancias Trn2 y servidores UltraServer
Las instancias Trn2, con la tecnología de los chips de IA de AWS Trainium2, ofrecen una relación entre precio y rendimiento entre un 30 % y un 40 % superior que las instancias basadas en GPU comparables.
Instancias P5en, P5e y P5
Las instancias P5en y P5e, con la tecnología de las GPU Tensor Core de NVIDIA H200, proporcionan un alto rendimiento de Amazon EC2 para aplicaciones de HPC y entrenamiento de ML. Las instancias P5 funcionan con las GPU Tensor Core H100 de NVIDIA.
Instancias P4d
Las instancias P4d, con la tecnología de las GPU Tensor Core de NVIDIA A100, proporcionan un alto rendimiento para el entrenamiento de ML y las aplicaciones de HPC.
Instancias Trn1
Las instancias Trn1, con la tecnología de los chips de IA de AWS Trainium, se crearon específicamente para el entrenamiento de ML de alto rendimiento. Ofrecen hasta un 50 % de ahorro en el costo del entrenamiento con respecto a otras instancias de Amazon EC2 comparables.
¿Ha encontrado lo que buscaba hoy?
Ayúdenos a mejorar la calidad del contenido de nuestras páginas compartiendo sus comentarios