Instancias P4 de Amazon EC2

El mejor rendimiento en entrenamiento de ML y aplicaciones de HPC en la nube

Las instancias P4d de Amazon EC2 ofrecen el mayor rendimiento para la formación del machine learning (ML) y las aplicaciones de computación de alto rendimiento (HPC) en la nube. Las instancias P4d cuentan con la última tecnología de las GPU A100 Tensor Core de NVIDIA y brindan un rendimiento líder de la industria y redes de baja latencia. Estas instancias son las primeras en la nube en admitir una red de instancias de 400 Gbps. Las instancias P4d ofrecen un costo hasta un 60 % más bajo de formación de modelos de ML, además de un rendimiento 2,5 veces mejor en promedio para los modelos de aprendizaje profundo, en comparación con las instancias P3 y P3dn de las generaciones anteriores.

Las instancias P4d de Amazon EC2 se implementan en clústeres de hiperescala llamados UltraClusters EC2, que se componen de la informática, las redes y el almacenamiento de mejor rendimiento de la nube. Cada UltraCluster EC2 es uno de las supercomputadoras más poderosos del mundo, que les permite a los clientes ejecutar su formación de ML de varios nodos y cargas de trabajo HPC distribuidas más complejas. Los clientes pueden escalar fácilmente de unos pocos a miles de GPU NVIDIA A100 en los UltraClusters EC2, según las necesidades de su proyecto de ML o HPC.

Tanto investigadores, como científicos de datos y desarrolladores pueden aprovechar las instancias P4d para formar modelos de ML para casos de uso, como el procesamiento de lenguaje natural, la detección y clasificación de objetos, y los motores de recomendación, además de ejecutar aplicaciones HPC, como descubrimiento farmacéutico, análisis sísmico y modelos financieros. A diferencia de los sistemas en las instalaciones, los clientes pueden acceder virtualmente a una capacidad informática y de almacenamiento ilimitada, escalar su infraestructura según las necesidades de su negocio y poner en marcha una formación de ML de varios nodos o una aplicación HPC distribuida estrechamente asociada en minutos, sin costos de instalación ni de mantenimiento.

Anuncio de las nuevas instancias P4d de Amazon EC2 (2:00)

¿Tiene alguna pregunta o necesita ayuda con los UltraClusters EC2?

Solicitar ayuda »

Formación de ML y HPC a gran escala con UltraClusters P4d de EC2

Los UltraClusters EC2 de las instancias P4d combinan informática, redes y almacenamiento de alto rendimiento con una de las supercomputadoras más poderosas del mundo. Cada UltraCluster EC2 de instancias P4d ofrece más de 4000 de las GPU NVIDIA A100 más recientes, una infraestructura de red sin bloqueo a escala de petabits y almacenamiento de baja latencia y alto rendimiento con FSx for Lustre. Cualquier desarrollador, investigador o científico de datos de ML puede poner en marcha instancias P4d en UltraClusters EC2 para obtener acceso a un rendimiento de nivel de supercomputadora con un modelo de uso de pago por uso para ejecutar sus cargas de trabajo de varios nodos de formación de ML y HPC.

Si tiene más preguntas o necesita asistencia con los UltraClusters EC2, solicite ayuda.

Solo disponible en algunas regiones. Para obtener más información sobre las regiones que son compatibles y más detalles sobre los UltraClusters EC2, contáctese con nosotros.

Beneficios

Reduzca el tiempo de formación de ML de días a minutos

Con las GPU NVIDIA A100 Tensor Core de última generación, cada instancia P4d de Amazon EC2 ofrece, en promedio, un rendimiento de aprendizaje profundo 2,5 veces mejor, en comparación con las instancias P3 de generaciones anteriores. Los UltraClusters EC2 de instancias P4d les permiten a los desarrolladores, científicos de datos e investigadores ejecutar sus cargas de trabajo de ML y HPC más complejas, y les permite acceder a un rendimiento de nivel de supercomputadora sin costos anticipados ni compromisos a largo plazo. El tiempo reducido de formación con las instancias P4d mejora la productividad, lo que les permite a los desarrolladores enfocarse en su misión principal de incorporar inteligencia de ML en aplicaciones empresariales.

Ejecute la formación de ML de varios nodos con alta eficiencia

Los desarrolladores pueden escalar fácilmente hasta miles de GPU con UltraClusters EC2 de instancias P4d. Alto rendimiento, conexión de red de baja latencia con compatibilidad con conexión de red de instancias de 400 Gbps, Elastic Fabric Adapter (EFA) y tecnología GPUDirect RDMA ayudan a formar rápidamente los modelos de ML mediante técnicas escalables/distribuidas. Elastic Fabric Adapter (EFA) utiliza NVIDIA Collective Communications Library (NCCL) para escalar a miles de GPU, y la tecnología GPUDirect RDMA habilita GPU de baja latencia para la comunicación de GPU entre instancias P4d.

Reduzca los costos de infraestructura para HPC y la formación de ML

Las instancias P4d de Amazon EC2 ofrecen un costo hasta un 60 % menor para formar modelos de ML, en comparación con las instancias P3. Además, las instancias P4d están disponibles para comprar como instancias de spot. Las instancias de spot aprovechan la capacidad no utilizada de instancias EC2 y pueden reducir significativamente los costos de Amazon EC2 con un descuento de hasta el 90 % sobre los precios bajo demanda. Con el costo más bajo de la formación de ML con instancias P4d, usted puede reasignar los presupuestos para incorporar más inteligencia en aplicaciones empresariales.

Comience y escale fácilmente con servicios de AWS

Las AMI de aprendizaje profundo y los deep learning containers facilitan la implementación de entornos de aprendizaje profundo P4d en minutos, ya que contienen las bibliotecas y herramientas requeridas de los marcos de aprendizaje profundo. También puede agregar fácilmente sus propias bibliotecas y herramientas a esas imágenes. Las instancias P4d son compatibles con marcos populares de ML, como TensorFlow, PyTorch y MXNet. Además, las instancias P4d de Amazon EC2 son compatibles con importantes servicios de AWS para ML, administración y orquestación, como Amazon SageMaker, Amazon Elastic Kubernetes Service (EKS), Amazon Elastic Container Service (ECS), AWS Batch y AWS ParallelCluster.

Características

Con tecnología de GPU NVIDIA A100 Tensor Core

Las GPU NVIDIA A100 Tensor Core ofrecen una aceleración sin precedentes a escala para ML e informática de alto rendimiento (HPC). Los Tensor Cores de tercera generación de NVIDIA A100 aceleran todas las cargas de trabajo de precisión, con lo que se agiliza el tiempo de obtención de información y el tiempo de comercialización. Cada GPU A100 ofrece más de 2,5 veces el rendimiento de computación en comparación con la GPU V100 de la generación anterior y viene con 40 GB HBM2 (en instancias P4d) u 80 GB HBM2e (en instancias P4de) de memoria de alto rendimiento para la GPU. Una mayor memoria de la GPU beneficia especialmente a las cargas de trabajo que se entrenan con grandes conjuntos de datos de alta resolución. Las GPU NVIDIA A100 aprovechan el rendimiento de la interconexión de las GPU NVSwitch de modo que cada GPU se pueda comunicar con cualquier otra en la misma instancia, con el mismo rendimiento bidireccional de 600 GB/s y con latencia de un solo salto.

Redes de alto rendimiento

Las instancias P4d ofrecen redes de 400 Gbps para ayudar a los clientes a escalar horizontalmente mejor sus cargas de trabajo distribuidas, como por ejemplo hacer una formación de varios nodos de manera más eficiente con redes de alto rendimiento entre instancias P4d, además de entre instancias P4d y servicios de almacenamiento, como Amazon S3 y FSx for Lustre. Elastic Fabric Adapter (EFA) es una interfaz de red personalizada y diseñada por AWS para ayudar a escalar las aplicaciones de ML y HPC a miles de GPU. Para reducir aún más la latencia, EFA se combina con NVIDIA GPUDirect RDMA para permitir comunicación de GPU a GPU de baja latencia entre servidores con omisión de sistema operativo.

Alto rendimiento, almacenamiento de baja latencia

Los clientes pueden acceder a un almacenamiento a escala de PetaByte, de alto rendimiento y baja latencia, con FSx for Lustre o a almacenamiento virtualmente ilimitado y rentable con Amazon S3 a velocidades de 400 Gbps. Para cargas de trabajo que necesitan acceso rápido a conjuntos de datos grandes, cada instancia P4d también incluye almacenamiento DDS basado en NVMe de 8 TB con rendimiento de lectura de 16 Giga-bytes por segundo.

Creación en el sistema Nitro de AWS

Las instancias P4d se incorporan al sistema Nitro de AWS, que es una amplia colección de bloques funcionales que descargan muchas de las funciones de virtualización tradicionales a hardware y software dedicados para ofrecer alto rendimiento, alta disponibilidad y alta seguridad, al tiempo que reduce la sobrecarga de la virtualización.

Historias de clientes

Toyota Research Institute (TRI), fundado en 2015, trabaja para desarrollar la conducción automatizada, robótica y otras tecnologías de amplificación humana para Toyota.

“En TRI, trabajamos para crear un futuro en el que todos tengan la libertad de moverse”, dijo Mike Garrison, director técnico de Ingeniería de Infraestructuras en TRI. "Las instancias P3 de la generación anterior nos ayudaron a reducir nuestro tiempo de formación de modelos de machine learning de días a horas, y estamos ansiosos por utilizar las instancias P4d, ya que la memoria GPU adicional y los formatos flotantes más eficientes le permitirán a nuestro equipo de machine learning formarse con modelos más complejos a una velocidad aún mayor".

"En TRI-AD, estamos trabajando para crear un futuro en el que todos tengan la libertad de moverse y explorar con un enfoque en la reducción de lesiones y muertes en vehículos gracias a la conducción adaptada y la ciudad inteligente. Mediante el uso de instancias P4d de Amazon EC2, podemos reducir nuestro tiempo de formación para el reconocimiento de objetos en un 40 % en comparación con las instancias GPU de generaciones anteriores, sin modificaciones a los códigos existentes", dijo Junya Inada, director de Conducción automatizada (Reconocimiento) en TRI-AD.

Jack Yan, director sénior de Ingeniería de Infraestructura en TRI-AD dijo: "Mediante el uso de instancias P4d de Amazon EC2, podemos reducir de inmediato el costo de formación en comparación con las instancias GPU de las generaciones anteriores, lo que nos permite aumentar la cantidad de equipos que trabajan en la formación de modelos. Las mejoras de red en P4d nos permitieron escalar eficientemente a docenas de instancias, lo que nos dio una agilidad importante para optimizar, volver a formar e implementar rápidamente docenas de modelos en autos de prueba o entornos de simulación para hacer más pruebas".

GE Healthcare es un innovador líder a nivel mundial de tecnología médica y soluciones digitales. GE Healthcare les permite a los médicos tomar decisiones más rápidas e informadas gracias a dispositivos inteligentes, análisis de datos, aplicaciones y servicios, compatibles con su plataforma Edison Intelligence.

“En GE Healthcare, les proporcionamos a los médicos herramientas que los ayudan a agregar datos, aplicar IA y análisis a esos datos y acceder a información que mejore los resultados de los pacientes, generar eficiencia y eliminar los errores”, dijo Karley Yoder, VP y gerenta general de Inteligencia Artificial. “Nuestros servicios de imágenes médicas generan enormes cantidades de datos que deben procesar nuestros científicos de datos. Con clústeres GPU anteriores, nos tomaba días formar modelos de IA completos, como GAN progresivas, para hacer simulaciones y ver resultados. Al utilizar las nuevas instancias P4d, redujimos el tiempo de procesamiento de días a horas. Notamos una velocidad dos o tres veces mayor en los modelos de entrenamiento con varios tamaños de imágenes, mientras que logramos un mejor rendimiento con tamaños mayores de lotes y más productividad con un ciclo de desarrollo de modelo más veloz”.

HEAVY.AI es pionera en los análisis acelerados. La plataforma HEAVY.AI se usa en los negocios y el Gobierno para encontrar información en los datos más allá de los límites de las herramientas analíticas generales.

“En HEAVY.AI estamos trabajando para crear un futuro en el que la ciencia de datos y el análisis se unan para desglosar y fusionar silos de datos. Los clientes están aprovechando las enormes cantidades de datos, que pueden incluir datos de localización y horarios, para generar un panorama completo, no solo de lo que está sucediendo, sino de cuándo y dónde, a través de la visualización pormenorizada de los datos espacio-temporal. Nuestra tecnología permite ver tanto el bosque como los árboles”, dijo (Ray Falcione), vicepresidente del área de Public Sector de EE. UU. en HEAVY.AI. “Al usar instancias P4d de Amazon EC2, pudimos reducir significativamente el costo de implementación de nuestra plataforma en comparación con las instancias GPU de generaciones anteriores, lo cual nos permite escalar conjuntos masivos de datos de manera rentable. Las mejoras de red en A100 aumentaron nuestra eficiencia en la forma en la que escalamos a miles de millones de filas de datos y les permitió a nuestros clientes obtener información aún más rápido”.

Zenotech Ltd está redefiniendo la ingeniería online mediante el uso de nubes de HPC que ofrecen modelos de licencia bajo demanda además de beneficios extremos de rendimiento al aprovechar las GPU.

“En Zenotech estamos desarrollando herramientas que les permitan a los diseñadores crear productos más eficientes y sostenibles con el medioambiente. Trabajamos con varias industrias. Nuestras herramientas proporcionan mayor información sobre rendimiento de los productos mediante el uso de la simulación a gran escala”, dijo Jamil Appa, director de Zenotech. “El uso de instancias P4d de AWS nos permite llevar a cabo nuestras simulaciones 3,5 veces más rápido en comparación con la generación anterior de GPU. Este aumento de la velocidad disminuye el tiempo de resolución de forma significativa y les permite a nuestros clientes llevar sus diseños al mercado más rápido o hacer simulaciones de mayor fidelidad que lo que hubiera sido posible antes”.

Aon es una empresa de servicios profesionales líder en el mundo que ofrece una gran variedad de soluciones de riesgos, jubilación y salud. Aon PathWise es una solución de administración de riesgos HPC basada en GPU y escalable que pueden utilizar las aseguradoras, las reaseguradoras, los bancos y los fondos de retiro para abordar los desafíos principales de la actualidad, como la prueba de estrategias de cobertura, el pronóstico regulatorio y económico, y la generación de presupuestos. 

“En PathWise Solutions Group LLC, nuestro producto les permite a las empresas aseguradoras, las reaseguradoras y los fondos de retiro acceder a tecnología de última generación para resolver rápidamente los principales desafíos de la actualidad en la industria de los seguros, como el machine learning, las pruebas de estrategias de cobertura, los informes regulatorios y económicos, los pronósticos de planificación comercial y económica, y el desarrollo y la asignación de precios de nuevos productos”, dijo Peter Phillips, presidente y director ejecutivo (CEO) de PathWise Solutions Group. "A través del uso de las instancias P4d de Amazon EC2, podemos ofrecer increíbles mejoras en velocidad para los cálculos de precisión individual y doble, en comparación con instancias GPU de generaciones anteriores para los cálculos más demandantes, lo que permite que los clientes hagan nuevos cálculos y pronósticos por primera vez. La velocidad es importante”, dice Phillips, “y seguimos ofreciéndoles un valor significativo y la tecnología más reciente a nuestros clientes gracias a las nuevas instancias de AWS”.

Compuesta por expertos en IA y radiología, Rad AI desarrolla productos que maximizan la productividad de los radiólogos, lo que, en última instancia, hace que la sanidad sea mucho más accesible y que mejoren los resultados de los pacientes.

“En Rad AI, nuestra misión es aumentar el acceso a la sanidad y la calidad para todos. Con un enfoque en el flujo de trabajo de las imágenes médicas, Rad AI les ahorra tiempo a los radiólogos, reduce el agotamiento y mejora la precisión”, dijo Doktor Gurson, cofundador de Rad AI. “Utilizamos IA para automatizar los flujos de trabajo de la radiología y ayudar a optimizar la generación de informes radiológicos. Con las nuevas instancias P4d de EC2, hemos notado una inferencia más veloz y la capacidad de formar modelos 2,4 veces más rápido, con una mayor precisión que en las instancias P3 de generaciones anteriores. Esto permite hacer diagnósticos más rápidos y precisos, y ayuda a nuestros clientes de EE. UU. a ofrecer un mayor acceso a servicios radiológicos de alta calidad“.

Lea el caso práctico para obtener más información »

Detalles del producto

Tamaño de la instancia vCPU Memoria de la instancia (GiB) GPU: A100 Memoria de GPU Ancho de banda de la red (Gbps) GPUDirect RDMA GPU de pares Almacenamiento de instancias (GB) Ancho de banda de EBS (Gbps) Precio de la instancia bajo demanda por hora Por hora real en una instancia reservada por 1 año* Por hora real en una instancia reservada por 3 años*
p4d.24xlarge 96 1152 8 320 GB
HBM2
400 ENA y EFA 600 GB/s NVSwitch 8 x 1000 SSD NVMe 19 32,77 USD 19,22 USD 11,57 USD
p4de.24xlarge (versión preliminar) 96 1152 8 640 GB
HBM2e
400 ENA y EFA 600 GB/s NVSwitch 8 x 1000 SSD NVMe 19 40,96 USD 24,01 USD 14,46 USD
* Los precios indicados corresponden a Linux/Unix en la región de AWS del Este de EE. UU. (Norte de Virginia) y se redondean al céntimo más bajo. Para ver los detalles completos de los precios, consulte la página de precios de Amazon EC2.

Las instancias P4d de Amazon EC2 se encuentran disponibles en las regiones del Este de EE. UU. (Norte de Virginia y Ohio), Oeste de EE. UU. (Oregón), Europa (Irlanda y Fráncfort) y Asia-Pacífico (Tokio y Seúl), mientras que las instancias P4de de Amazon EC2 se encuentran disponibles en las regiones de AWS del Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón).

Los clientes pueden adquirir instancias P4d y P4de como instancias bajo demanda, instancias reservadas, instancias de spot, hosts dedicados o como parte de Savings Plan.

Comience a utilizar las instancias P4d de Amazon EC2 para el machine learning

Utilice Amazon SageMaker

Amazon SageMaker es un servicio completamente administrado que sirve para crear, formar e implementar modelos de ML. Cuando se usa con las instancias P4d de Amazon EC2, los clientes pueden escalar rápidamente decenas, cientos o miles de GPU para formar rápidamente un modelo a cualquier escala sin preocuparse por configurar clústeres ni canalización de datos.

Use AWS Deep Learning AMIs o Deep Learning Containers

Las AWS Deep Learning AMIs (DLAMI) les ofrecen a los investigadores y profesionales de ML la infraestructura y las herramientas necesarias para agilizar las tareas de aprendizaje profundo en la nube a cualquier escala. AWS Deep Learning Containers son imágenes de Docker preinstaladas con marcos de aprendizaje profundo que facilitan la implementación rápida de entornos de ML personalizados porque le permiten omitir el complejo proceso de crear y optimizar sus entornos desde cero.

Utilice Amazon Elastic Kubernetes Service (EKS) o Elastic Container Service (ECS)

Los clientes que prefieren administrar sus propias cargas de trabajo en contenedores mediante servicios de orquestación de contenedores pueden implementar instancias P4d de Amazon EC2 con Amazon EKS o ECS.

Introducción al uso de las instancias P4d de Amazon EC2 para informática de alto rendimiento

Las instancias P4d de Amazon EC2 son una plataforma ideal para ejecutar simulaciones de ingeniería, finanzas en ordenadores, análisis sísmicos, modelado molecular, genómica, representaciones y otras cargas de trabajo de informática de alto rendimiento (HPC) basadas en GPU. Con frecuencia, las aplicaciones de HPC exigen un alto nivel de rendimiento de red, almacenamiento ágil, gran capacidad de memoria, capacidades informáticas altas o todas estas características juntas. Las instancias P4d son compatibles con Elastic Fabric Adapter (EFA), que permite que las aplicaciones HPC que utilizan Message Passing Interface (MPI) escalen a miles de GPU. AWS Batch y AWS ParallelCluster les permiten a los desarrolladores de HPC crear y escalar rápidamente aplicaciones HPC distribuidas.

Más información »

Artículos y publicaciones de blog

Recursos adicionales

UltraClusters EC2 de instancias P4d (1:59)
Amazon EC2 P4d vs. P3: Procesamiento de lenguaje natural (0:34)
Amazon EC2 P4d vs. P3: Conversión de voz en texto (0:33)
Amazon EC2 P4d vs. P3: Clasificación de imágenes (0:37)

Introducción a AWS

Regístrese para obtener una cuenta de AWS

Regístrese para obtener una cuenta de AWS

Obtenga acceso instantáneo a la capa gratuita de AWS.

Aprenda con tutoriales sencillos

Aprenda con tutoriales de 10 minutos

Explore y aprenda con tutoriales sencillos.

Comience a crear con EC2 en la consola

Comience a crear en la consola

Comience a crear soluciones con las guías paso a paso, que lo ayudarán a lanzar un proyecto en AWS.