Instancias P3 de Amazon EC2

Acelere el machine learning y las aplicaciones de informática de alto rendimiento con GPU eficientes

Las instancias P3 de Amazon EC2 ofrecen informática de alto rendimiento en la nube con hasta 8 GPU con núcleo NVIDIA® V100 Tensor y con hasta 100 Gbps de red para aprendizaje automático y las aplicaciones de HPC. Estas instancias ofrecen hasta un petaflop de rendimiento de precisión combinada por instancia para agilizar significativamente las aplicaciones de informática de alto rendimiento y aprendizaje automático. Se ha comprobado que las instancias P3 de Amazon EC2 reducen los tiempos de entrenamiento de modelos de aprendizaje automático de días a minutos, además de incrementar la cantidad de simulaciones completadas para la obtención de resultados en informática de alto rendimiento mediante 3-4x.
Con hasta 4x de ancho de banda de red de las instancias P3.16xlarge, las instancias P3dn.24xlarge de Amazon EC2 son el último agregado a la familia de P3, optimizado para el aprendizaje automático distribuido y las aplicaciones de HPC. Estas instancias ofrecen hasta 100 Gbps de desempeño de red, 96 CPU virtuales Intel® Xeon® Scalable (Skylake) personalizadas, 8 GPU de núcleo NVIDIA® V100 Tensor con 32 GB de memoria cada una y 1.8 TB de almacenamiento SSD local basado en NVMe.

Presentamos Amazon EC2 P3dn.24xlarge, la instancia P3 con la mayor capacidad hasta la fecha

Optimizado para la formación de aprendizaje automático distribuido y la informática de alto desempeño

ReInvent_HA_P3_EDITORIAL

Beneficios

REDUZCA EL TIEMPO DE ENTRENAMIENTO DE MODELOS DE APRENDIZAJE AUTOMÁTICO DE DÍAS A MINUTOS

Para los científicos de datos, los investigadores y los desarrolladores que necesitan acelerar las aplicaciones aprendizaje automático, las instancias P3 de Amazon EC2 son las más rápidas en la nube para la capacitación de ML. Las instancias P3 de Amazon EC2 incluyen ocho GPU de núcleo NVIDIA V100 Tensor de última generación y ofrecen hasta un petaflop de rendimiento de precisión combinada para agilizar significativamente las cargas de trabajo de aprendizaje automático. Modelos de entrenamiento más ágiles pueden permitir que los científicos de datos y los ingenieros de aprendizaje automático iteren más rápido, entrenen más modelos e incrementen el nivel de precisión.

LA SOLUCIÓN MÁS RENTABLE DE LA INDUSTRIA PARA LA CAPACITACIÓN DE ML

Una de las instancias de GPU más poderosas en la nube combinadas con los planes de precio flexible generan una solución excepcionalmente rentable para la capacitación de machine learning. Como sucede con las instancias de Amazon EC2, las instancias P3 están disponibles como instancias bajo demanda, instancias reservadas o instancias de spot. Las instancias de spot aprovechan la capacidad de instancia EC2 no usadas y pueden reducir sus costos de Amazon EC2 de manera significativa para obtener un 70 % de descuento en los precios bajo demanda.

INFORMÁTICA FLEXIBLE Y EFICIENTE DE ALTO RENDIMIENTO

A diferencia de los sistemas locales, ejecutar tareas de informática de alto rendimiento en las instancias P3 de Amazon EC2 ofrece capacidad prácticamente ilimitada para escalar su infraestructura y la flexibilidad para cambiar los recursos con facilidad y tan a menudo como lo requiera su carga de trabajo. Puede configurar sus recursos para cumplir con las demandas de su aplicación y lanzar un clúster de alto rendimiento en minutos y pagar solo por lo que usa.

INTEGRACIÓN CON LOS SERVICIOS DE APRENDIZAJE AUTOMÁTICO DE AWS

Las instancias P3 de Amazon EC2 trabajan conjunta y continuamente con Amazon SageMaker para ofrecerle una plataforma de aprendizaje automático completa, eficiente e intuitiva. Amazon SageMaker es una plataforma de aprendizaje automático completamente administrada que le permite crear, entrenar e implementar modelos de aprendizaje automático rápida y fácilmente. Además, las instancias P3 de Amazon EC2 se pueden integrar con imágenes de máquina de Amazon (AMI) de aprendizaje profundo de AWS que están preinstaladas con marcos conocidos de aprendizaje profundo. Esto facilita y simplifica comenzar a usar la capacitación y la inferencia de machine learning.

COMPATIBILIDAD CON LOS PRINCIPALES MARCOS DE APRENDIZAJE AUTOMÁTICO

Las instancias P3 de Amazon EC2 admiten los principales marcos de aprendizaje automático, incluidos TensorFlow, PyTorch, Apache MXNet, Caffe, Caffe2, Microsoft Cognitive Toolkit (CNTK), Chainer, Theano, Keras, Gluon y Torch. Posee la flexibilidad para elegir el marco que mejor funcione para su aplicación.

Entrenamiento de modelos de aprendizaje automático escalable con nodos múltiples

Puede usar múltiples instancias P3 de Amazon EC2 con hasta 100 Gbps de desempeño de red para capacitar rápidamente los modelos de machine learning. El desempeño más alto de red permite que los desarrolladores quiten los atascos de la transferencia de datos y escalen de forma eficiente sus trabajos de modelo de capacitación en múltiples instancias P3. Los clientes han podido capacitar ResNet-50, un modelo de clasificación de imagen, para la precisión industrial estándar en solo 18 minutos usando 16 instancias P3. Este nivel de rendimiento anteriormente era inalcanzable por la vasta mayoría de clientes de ML ya que necesitaban una gran inversión de capital para crear clústeres de GPU en las instalaciones. Con instancias P3 y su disponibilidad mediante el modelo de uso bajo pedido, este nivel de rendimiento ahora está accesible para todos los desarrolladores e ingenieros de machine learning.

Historias de clientes

200x100_AirBNB_Logo

Airbnb está usando el aprendizaje automático para optimizar las recomendaciones de búsqueda y para mejorar las indicaciones sobre precios dinámicos para los anfitriones, lo que se traduce en un mayor número de reservas concretadas. Con las instancias P3 de Amazon EC2, Airbnb puede ejecutar cargas de trabajo de entrenamiento con mayor rapidez para iterar más, crear mejores modelos de aprendizaje automático y reducir los costos.

salesforce_logo_200x100

Salesforce utiliza el aprendizaje automático para respaldar Einstein Vision, lo que permite a los desarrolladores aprovechar el poder del reconocimiento de imágenes para casos prácticos como las búsquedas visuales, la detección de marcas y la identificación de productos. Las instancias P3 de Amazon EC2 permiten que los desarrolladores entrenen los modelos de aprendizaje automático mucho más rápido para que puedan alcanzar sus objetivos de aprendizaje automático con mayor celeridad.

western-digital_200x100

Western Digital usa informática de alto rendimiento (HPC) para ejecutar decenas de miles de simulaciones para las ciencias de materiales, flujos de calor, magnética y transferencia de datos para mejorar la calidad y el rendimiento de soluciones de almacenamiento y disco duro. Con base en las primeras evaluaciones, las instancias P3 de Amazon EC2 permiten que los equipos de ingeniería ejecuten simulaciones al menos tres veces más rápido que las soluciones implementadas anteriormente.  

schrodinger-200x100

Schrödinger usa la informática de alto rendimiento (HPC) para desarrollar modelos predictivos a los fines de ampliar la escala de descubrimiento y optimización y brindar a sus clientes la capacidad de ofrecer medicamentos vitales al mercado más rápidamente. Las instancias P3 de Amazon EC2 permiten que Schrödinger desarrolle cuatro veces más de simulaciones al día que con las instancias P2.  

Instancias P3 de Amazon EC2 y Amazon SageMaker

La manera más rápida de entrenar y ejecutar modelos de aprendizaje automático

Amazon SageMaker es un servicio completamente administrado para crear, entrenar e implementar modelos de aprendizaje automático. Cuando se usan con las instancias P3 de Amazon EC2, los clientes pueden escalar rápidamente decenas, cientos o miles de GPU para entrenar un modelo rápidamente a cualquier escala sin preocuparse por configurar clústeres y canalizaciones de datos. También puede acceder fácilmente a los recursos de Amazon Virtual Private Cloud (Amazon VPC) para entrenar y alojar los flujos de trabajo en Amazon SageMaker. Con esta característica, puede usar buckets de Amazon Simple Storage Service (Amazon S3) que solo son accesibles mediante su VPC para almacenar datos de entrenamiento, como así también para almacenar y alojar los artefactos de modelo derivados del proceso de entrenamiento. Además de S3, los modelos pueden acceder a todos los demás recursos de AWS contenidos en la VPC. Más información.

Creación

Amazon SageMaker facilita la creación de modelos de machine learning y los prepara para la capacitación. Ofrece todo lo que necesita para conectarse rápidamente a sus datos de capacitación y seleccionar y optimizar el mejor algoritmo y marco para su aplicación. Amazon SageMaker incluye cuadernos de Jupyter alojados que facilitan el análisis y la visualización de los datos de entrenamiento almacenados en Amazon S3.  También puede usar una instancia de bloc de notas para escribir el código a los fines de crear trabajos de entrenamiento de modelos, implementar modelos para el alojamiento de Amazon SageMaker y evaluar o validar sus modelos.

Entrenamiento

Puede comenzar a entrenar su modelo con un solo clic en la consola o con una llamada a la API. Amazon SageMaker viene preconfigurado con las versiones más recientes de TensorFlow y Apache MXNet, con compatibilidad para bibliotecas CUDA9 a los fines de lograr un nivel de rendimiento óptimo con las GPU NVIDIA. Además, la optimización de los hiperparámetros se puede adaptar automáticamente a su modelo al ajustar de manera inteligente diferentes combinaciones de parámetros de modelo para alcanzar rápidamente las predicciones más precisas. Para necesidades de mayor escala, puede aumentar la escala a decenas de instancias para respaldar la creación más ágil de modelos.

Implementación

Después de la capacitación, puede usar un clic para implementar su modelo en instancias de Amazon EC2 de escalado automático en múltiples zonas de disponibilidad. En producción, Amazon SageMaker administra la infraestructura de informática por usted para realizar comprobaciones de estado, implementar parches de seguridad y realizar otros mantenimientos de rutina, todo con registros y control de Amazon CloudWatch integrados.

 

Instancias P3 de Amazon EC2 y AMI de aprendizaje profundo de AWS

Entornos de desarrollo preconfigurados para comenzar rápidamente a crear aplicaciones de aprendizaje profundo

Las AMI de aprendizaje profundo de AWS, una alternativa a Amazon SageMaker para los desarrolladores que tienen requisitos más personalizados, ofrecen a los profesionales de aprendizaje automático y a los investigadores la infraestructura y las herramientas para agilizar las tareas de aprendizaje profundo en la nube a cualquier escala. Puede lanzar rápidamente instancias P3 de Amazon EC2 con marcos de aprendizaje profundo conocidos instalados con anterioridad, como TensorFlow, PyTorch, Apache MXNet, Microsoft Cognitive Toolkit, Caffe, Caffe2, Theano, Torch, Chainer, Gluon y Keras para entrenar modelos de inteligencia artificial personalizados y sofisticados, probar algoritmos nuevos o aprender nuevas técnicas y habilidades. Más información

Instancias P3 de Amazon EC2 e informática de alto rendimiento

Resuelva problemas informáticos a gran escala y obtenga nueva información con la capacidad de HPC en AWS

Las instancias P3 de Amazon EC2 son una plataforma ideal para ejecutar simulaciones de ingeniería, finanza computacional, análisis sísmico, modelado molecular, genómica, representaciones y otras cargas de trabajo informáticas con GPU. La informática de alto rendimiento (HPC) les permite a los científicos e ingenieros resolver estos problemas complejos que exigen una gran capacidad informática. Con frecuencia, las aplicaciones de HPC exigen un alto nivel de rendimiento de red, almacenamiento ágil, gran capacidad de memoria, altas capacidades informáticas o todas estas características juntas. AWS permite agilizar las investigaciones y disminuir los plazos de obtención de resultados mediante la ejecución de HPC en la nube y el escalado de un mayor número de tareas paralelas del que sería posible en la mayoría de los entornos locales. AWS ayuda a reducir costos al ofrecer soluciones optimizadas para las aplicaciones específicas y sin la necesidad de realizar grandes inversiones de capital. Más información

Instancias P3dn.24xlarge de Amazon EC2

Tamaño de instancia nueva, más rápida, poderosa y grande optimizado para aprendizaje automático distribuido y la informática de alto rendimiento

Las instancias P3dn.24xlarge de Amazon EC2 son el tamaño de instancia P3 más rápido, eficiente y grande disponible. Cuentan con una capacidad de procesamiento de red de hasta 100 Gbps, 8 GPU de núcleo NVIDIA® V100 Tensor con 32 GB de memoria cada uno, 96 CPU virtuales (Skylake) escalables Intel® Xeon® y 1.8 TB almacenamiento SSD local basado en NVMe. La mayor agilidad de red, los procesadores nuevos, la duplicación de la memoria para GPU y las CPU virtuales adicionales permiten a los desarrolladores disminuir el tiempo necesario para entrenar sus modelos de aprendizaje automático o ejecutar más simulaciones de informática de alto rendimiento mediante el ajuste de la escala de sus trabajos en varias instancias (p. ej., 16, 32 o 64 instancias). Los modelos de machine learning necesitan una gran cantidad de datos para la capacitación y, además de incrementar el rendimiento de los datos que pasan entre las instancias, el desempeño de red adicional de las instancias P3dn.24xlarge también se puede usar para acelerar el acceso a grandes cantidades de datos de capacitación mediante la conexión a Amazon S3 o a las soluciones de los sistemas de archivo compartido.

ELIMINE LOS ATASCOS Y REDUZCA EL TIEMPO DE ENTRENAMIENTO DE MODELOS DE MACHINE LEARNING

Con 100 Gbps de desempeño de red, los desarrolladores pueden usar de manera eficiente una gran cantidad instancias P3dn.24xlarge (p. ej.: 16, 32 0 64 instancias) para la capacitación distribuida y una reducción significativa en el tiempo para capacitar sus modelos. Las 96 vCPU de los procesadores Intel Skylake personalizados de AWS con instrucciones AVX-512 que funcionan a 2.5 GHz para ayudar a optimizar el procesamiento previo de los datos. Además, las instancias P3dn.24xlarge usan el sistema Nitro de AWS, una combinación de hardware dedicado e hipervisor ligero que proporciona prácticamente todos los recursos de informática y memoria del hardware del host a sus instancias.

 

Menor costo total de propiedad al optimizar la utilización de GPU

Red mejorada que usa la última versión de Elastic Network Adapter con hasta 100 Gbps de ancho de banda de red agregada que se puede usar no solo para compartir los datos en muchas instancias P3dn.24xlarge sino también en el acceso de datos de alto rendimiento mediante Amazon S3 o la solución de sistemas de archivo compartido como Amazon EFS. El acceso de datos de alto desempeño es muy importante para optimizar la utilización de las GPU y ofrecer un rendimiento máximo de las instancias informáticas.

Más soporte y modelos más complejos

Las instancias P3dn.24xlarge ofrecen GPU con núcleo NVIDIA V100 Tensor con 32 GB de memoria que ofrecen la flexibilidad para capacitar más modelos avanzados y grandes de aprendizaje automático y también lotes de datos más grandes del proceso, tal como imágenes 4k para la clasificación de imágenes y los sistemas de detección de objetos.

 

Detalles de producto de la instancia P3 de Amazon EC2

Tamaño de instancia GPU – Tesla V100 GPU de pares Memoria de GPU (GB) vCPU Memoria (GB) Ancho de banda de la red Ancho de banda de EBS Precio de la instancia bajo demanda por hora* Por hora real en una instancia reservada por 1 año* Por hora real en una instancia reservada por 3 años*
p3.2xlarge 1 N/D 16 8 61 Hasta 10 Gbps 1,5 Gbps 3,06 USD 1,99 USD 1,05 USD
p3.8xlarge 4
NVLink 64 32 244 10 Gbps 7 Gbps 12,24 USD 7,96 USD 4,19 USD
p3.16xlarge 8 NVLink 128 64 488 25 Gbps 14 Gbps 24,48 USD 15,91 USD 8,39 USD
p3dn.24xlarge 8 NVLink 256 96 768 100 Gbps 14 Gbps 31,218 USD 18,30 USD 9,64 USD

* - Los precios que se muestran son para Linux/Unix en la región EE.UU. Este (Norte de Virginia) de AWS y se redondea al céntimo más cercano. Para ver la información sobre precios completa, consulte la página de precios de Amazon EC2.

Los clientes pueden adquirir instancias P3 como instancias bajo demanda, instancias reservadas, instancias de Spot o hosts dedicados.

FACTURACIÓN AL SEGUNDO

Una de las numerosas ventajas de la informática en la nube es la característica elástica de los recursos de aprovisionamiento y desaprovisionamiento, según los requiera. Al usar la facturación al segundo, los clientes pueden nivelar su elasticidad, ahorrar dinero y permitir optimizar la asignación de los recursos para alcanzar sus objetivos de aprendizaje automático.

PRECIOS DE INSTANCIAS RESERVADAS

Las instancias reservadas ofrecen un descuento importante (hasta del 75%) en comparación con los precios de las instancias bajo demanda. Además, cuando se asignan instancias reservadas a una zona de disponibilidad específica, se proporciona una reserva de capacidad, lo que le aporta confianza adicional en relación con la posibilidad de lanzar instancias cuando las necesita.

PRECIOS DE LAS INSTANCIAS DE SPOT

Con las instancias de spot, paga el precio de spot vigente durante el período de tiempo que sus instancias se ejecuten. Amazon EC2 define los precios de las instancias de spot y estos se ajustan gradualmente en función de las tendencias a largo plazo de la oferta y la demanda de capacidad de instancias de spot. Las instancias de spot están disponibles con un descuento de hasta el 90 % en comparación con los precios de las instancias bajo demanda.

La más amplia disponibilidad global

1856-Updated Map Image-P3 Instances-transparentBG_1024x543

Las instancias P3.2xlarge, P3.8xlarge and P3.16xlarge de Amazon EC2 están disponibles en 14 regiones de AWS para que los clientes tengan la flexibilidad de entrenar e implementar sus modelos de aprendizaje automático donde sus datos estén almacenados. Las regiones de AWS disponibles para P3 son EE.UU. Este (Norte de Virginia), EE.UU. Este (Ohio), EE.UU. Oeste (Oregón), Canadá (Central), Europa (Irlanda), Europa (Londres), Asia Pacífico (Tokio), Asia Pacífico (Seúl), Asia Pacífico (Sídney), Asia Pacífico (Singapur), China (Pekín), China (Ningxia) y AWS GovCloud (EE.UU.).

Las instancias P3dn.24xlarge están disponibles en las regiones de EE.UU. Este (Norte de Virginia) y EE.UU. Oeste (Oregón).

Comience a usar las instancias P3 en Amazon EC2 para tareas de aprendizaje automático

Para poder comenzar en minutos, obtenga más información sobre Amazon SageMaker o use la AMI de aprendizaje profundo de AWS, preinstalada con marcos de aprendizaje profundo conocidos como Caffee2 y MXNet. Opcionalmente, también puede utilizar la AMI de NVIDIA con un controlador de GPU y un conjunto de herramientas CUDA instalados con anterioridad.

Artículos y publicaciones de blog

amrraga
 
Amr Ragab, Chetan Kapoor, Rahul Huilgol, Jarvis Lee, Tyler Mullenbach y Yong Wu
20 de julio de 2018

Acerca de Amazon SageMaker

Haga clic aquí para obtener más información

Acerca de Aprendizaje profundo en AWS

Haga clic aquí para obtener más información

Acerca de Informática de alto desempeño (HPC)

Haga clic aquí para obtener más información
¿Listo para comenzar?
Inscribirse
¿Tiene más preguntas?
Contacte con nosotros