Instances Amazon EC2 P3

Accélérez le machine learning et les applications de calcul haute performance avec des GPU puissants.

Les instances Amazon EC2 P3 offrent des calculs hautes performances dans le cloud avec jusqu'à 8 GPU NVIDIA® Tesla® V100 et un débit réseau allant jusqu'à 100 Gb/s pour les applications HPC et de machine learning. Ces instances fournissent jusqu'à un pétaflop de performances de précision mixte par instance, ce qui accélère considérablement les applications de machine learning et de calcul hautes performances. Il a été prouvé que les instances Amazon EC2 P3 réduisaient le temps de formation machine learning de quelques jours à quelques minutes, et augmentaient de 3 à 4 fois le nombre de simulations effectuées pour le calcul haute performance.
Avec jusqu'à 4 fois la bande passante réseau des instances P3.16xlarge, les instances Amazon EC2 P3dn.24xlarge seront le dernier ajout à la famille P3, optimisées pour les applications HPC et de machine learning. Ces instances fournissent un débit réseau allant jusqu'à 100 Gb/s, 96 vCPU Intel® Xeon® Scalable (Skylake) personnalisés, 8 GPU NVIDIA® Tesla® V100 avec 32 Go de mémoire chacun et 1,8 To de stockage SSD local basé sur NVMe.

Bientôt disponible: Amazon EC2 P3dn.24xlarge - l'instance P3 la plus puissante à ce jour

Optimisé pour la formation machine learning et l'informatique haute performance

ReInvent_HA_P3_EDITORIAL

Avantages

RÉDUIRE LE TEMPS DE MACHINE LEARNING DE QUELQUES JOURS À QUELQUES MINUTES

Pour les scientifiques des données, les chercheurs et les développeurs qui ont besoin d'accélérer les applications ML, les instances Amazon EC2 P3 sont les plus puissantes disponibles dans le cloud pour la formation ML. Les instances Amazon EC2 P3 comportent jusqu'à huit GPU NVIDIA Tesla V100 de dernière génération et délivrent jusqu'à un pétaflop de performances de précision mixte pour accélérer significativement les charges de travail ML. Une formation plus rapide sur les modèles peut permettre aux scientifiques des données et aux ingénieurs de machine learning d'itérer plus rapidement, de former un plus grand nombre de modèles et d'accroître la précision.

LA SOLUTION LA PLUS RENTABLE DE L'INDUSTRIE POUR LA FORMATION ML

Une des instances de GPU les plus puissantes du cloud, associée à des plans de tarification flexibles, offre une solution extrêmement rentable pour la formation machine learning. Comme pour les instances Amazon EC2 en général, les instances P3 sont disponibles en tant qu'instances à la demande, instances réservées ou instances Spot. Les instances Spot tirent parti de la capacité inutilisée des instances EC2 et peuvent réduire considérablement vos coûts Amazon EC2, avec un rabais pouvant aller jusqu'à 70% par rapport aux prix à la demande.

UN CALCUL HAUTE PERFORMANCE, FLEXIBLE ET PUISSANT

Contrairement aux systèmes sur site, l'exécution d’un calcul haute performance sur des instances Amazon EC2 P3 offre une capacité pratiquement illimitée pour faire évoluer votre infrastructure et la flexibilité de changer les ressources facilement et aussi souvent que votre charge de travail l'exige. Vous pouvez configurer vos ressources pour répondre aux exigences de votre application et lancer un cluster HPC en quelques minutes, en ne payant que ce que vous utilisez.

INTÉGRATION AVEC LES SERVICES DE MACHINE LEARNING D'AWS

Les instances Amazon EC2 P3 fonctionnent de manière transparente avec Amazon SageMaker pour fournir une plate-forme d'apprentissage automatique complète, puissante et intuitive. Amazon SageMaker est une plate-forme de machine learning entièrement gérée qui vous permet de construire, former et déployer rapidement et facilement des modèles de machine learning. De plus, les instances Amazon EC2 P3 peuvent être intégrées avec les AWS Deep Learning Amazon Machine Images (AMIs) qui sont pré-installées avec des structures de machine learning Cela facilite et accélère la prise en main de la formation et de l'inférence par machine learning.

PRISE EN CHARGE DE L’ENSEMBLE DES PRINCIPALES STRUCTURES DE MACHINE LEARNING

Les instances Amazon EC2 P3 prennent en charge l’ensemble des principales structures de machine learning, y compris TensorFlow, PyTorch, Apache MXNet, Caffe, Caffe2, Microsoft Cognitive Toolkit (CNTK), Chainer, Theano, Keras, Gluon et Torch. Vous avez la possibilité de choisir le framework qui convient le mieux à votre application.

Formation au machine learning multi-nœuds évolutive

Vous pouvez utiliser plusieurs instances Amazon EC2 P3 avec un débit réseau allant jusqu'à 100 Gb/s pour former rapidement des modèles machine learning. Un débit réseau supérieur permet aux développeurs d’éliminer les goulots d'étranglement du transfert de données et de faire évoluer efficacement leurs tâches de formation de modèle sur plusieurs instances P3. Les clients ont été en mesure de former ResNet-50, un modèle de classification d'image commun, conforme à la précision standard du secteur en seulement 18 minutes, avec 16 instances P3. Ce niveau de performance était auparavant inaccessible pour la grande majorité des clients de ML, car il nécessitait un investissement important en CapEx pour créer des clusters de GPU sur site. Avec les instances P3 et leur disponibilité via un modèle d’utilisation à la demande, ce niveau de performance est désormais accessible à tous les développeurs et ingénieurs de machine learning.

Témoignages de clients

200x100_AirBNB_Logo

AirBnB utilise le machine learning pour optimiser les recommandations de recherche et améliorer nos conseils de tarification dynamiques pour les hôtes, ces deux aspects menant à un taux de conversion accru pour les réservations. Avec les instances Amazon EC2 P3, Airbnb peut exécuter des charges de travail de formation plus rapidement, effectuer davantage d’itérations, créer de meilleurs modèles de machine learning et réduire les coûts.

salesforce_logo_200x100

Salesforce utilise l'apprentissage automatique pour alimenter Einstein Vision, ce qui permet aux développeurs d'exploiter la puissance de la reconnaissance d'images pour des cas d'utilisation tels que la recherche visuelle, la détection de marque et l'identification de produit. Les instances Amazon EC2 P3 permettent aux développeurs de former des modèles d'apprentissage profond beaucoup plus rapidement afin qu'ils puissent atteindre rapidement leurs objectifs d'apprentissage automatique.

western-digital_200x100

Western Digital utilise le calcul haute performance (HPC) pour exécuter des dizaines de milliers de simulations pour les sciences des matériaux, les flux de chaleur, le magnétisme et le transfert de données afin d'améliorer les performances et la qualité des solutions de stockage et des disques durs. Basé sur des tests précoces, les instances Amazon EC2 P3 permettent aux équipes d'ingénierie d'exécuter des simulations au moins trois fois plus rapidement que les solutions précédemment déployées.  

schrodinger-200x100

Schrodinger utilise le calcul haute performance (HPC) pour développer des modèles prédictifs afin d'étendre l'échelle de découverte et d'optimisation et de donner à ses clients la possibilité de commercialiser plus rapidement les médicaments qui sauvent des vies. Les instances Amazon EC2 P3 permettent à Schrodinger d'effectuer quatre fois plus de simulations par jour qu'avec des instances P2.  

Instances Amazon EC2 P3 et Amazon SageMaker

Le moyen le plus rapide de former et d’exécuter des modèles d’apprentissage automatique

Amazon SageMaker est un service entièrement géré pour la création, la formation et le déploiement de modèles d'apprentissage automatique. Lorsqu'ils sont utilisés avec les instances Amazon EC2 P3, les clients peuvent facilement mettre à l'échelle des dizaines, des centaines ou des milliers de GPU pour former rapidement un modèle à n'importe quelle échelle sans se soucier de la mise en place de clusters et de pipelines de données. Vous pouvez également accéder aux ressources Amazon Virtual Private Cloud (Amazon VPC) pour la formation et l'hébergement des flux de travail dans Amazon SageMaker. Grâce à cette fonctionnalité, vous pouvez utiliser des compartiments Amazon Simple Storage Service (Amazon S3) accessibles uniquement via votre VPC pour stocker des données de formation, ainsi que pour stocker et héberger les artefacts de modèles dérivés du processus de formation. En plus du compartiment S3, les modèles peuvent accéder à toutes les autres ressources AWS contenues dans le VPC. En savoir plus.

Création

Amazon SageMaker facilite la création de modèles de machine learning et leur préparation pour la formation. Il fournit tout ce dont vous avez besoin pour vous connecter rapidement à vos données d'entraînement, ainsi que pour sélectionner et optimiser le meilleur algorithme et le meilleur framework pour votre application. Amazon SageMaker inclut des bloc-notes Jupyter hébergés qui simplifient l'exploration et la visualisation de vos données de formation stockées dans Amazon S3.  Vous pouvez également utiliser l'instance de notebook pour écrire du code pour créer des tâches de formation de modèles, déployer des modèles sur l'hébergement Amazon SageMaker et tester ou valider vos modèles.

Formation

Vous pouvez commencer la formation de votre modèle d'un simple clic dans la console ou à l'aide d'un appel d'API. Amazon SageMaker intègre les dernières versions de TensorFlow et d'Apache MXNet, avec la prise en charge de bibliothèques CUDA9 pour des performances optimales avec les GPU NVIDIA. De plus, l'optimisation des hyper-paramètres peut automatiquement adapter votre modèle en ajustant intelligemment différentes combinaisons de paramètres du modèle pour arriver rapidement aux prédictions les plus précises. Pour les besoins à plus grande échelle, vous pouvez mettre à l'échelle des dizaines d'instances pour accélérer la construction de modèles.

Déploiement

Après la formation, vous pouvez déployer votre modèle en un seul clic sur des instances Amazon EC2 à mise à l’échelle automatique dans plusieurs zones de disponibilité. En production, Amazon SageMaker gère l’infrastructure de calcul à votre place et réalise des vérifications de l'état, applique des correctifs de sécurité et effectue d'autres tâches courantes d'entretien grâce à la surveillance et à la journalisation intégrées d'Amazon CloudWatch.

 

Instances Amazon EC2 P3 et AMI AWS Deep Learning

Environnements de développement préconfigurés pour commencer rapidement à développer des applications d'apprentissage en profondeur

Une alternative à Amazon SageMaker pour les développeurs qui ont des exigences plus personnalisées, les AWS Deep Learning AMIs fournissent aux praticiens et aux chercheurs de machine learning l'infrastructure et les outils pour accélérer l'apprentissage en profondeur dans le cloud, à n'importe quelle échelle. Vous pouvez rapidement lancer des instances Amazon EC2 P3 préinstallées avec des structures d’apprentissage en profondeur fréquemment utilisées, telles que TensorFlow, PyTorch, Apache MXNet, Microsoft Cognitive Toolkit, Caffe, Caffe2, Theano, Torch, Chainer, Gluon et Keras, pour former des modèles d'IA sur mesure sophistiqués, expérimenter de nouveaux algorithmes ou apprendre de nouvelles compétences et techniques. En savoir plus

Instances Amazon EC2 P3 et calcul haute performance

Résoudre de nombreux problèmes informatiques et obtenir de nouvelles informations grâce à toute la puissance du HPC sur AWS

Les instances Amazon EC2 P3 sont une plate-forme idéale pour exécuter des simulations d'ingénierie, des calculs financiers, des analyses sismiques, des modélisations moléculaires, de la génomique, du rendu et d'autres charges de travail de calcul GPU. Le calcul haute performance (HPC) permet aux scientifiques et aux ingénieurs de résoudre ces problèmes informatiques complexes nécessitant une importante capacité de calcul. Les applications HPC exigent souvent des performances réseau élevées, un stockage rapide, d'importantes capacités de mémoire, des capacités de calcul élevées ou tous ces éléments. AWS vous permet d'accélérer les recherches et l'obtention de résultats en exécutant le HPC dans le cloud et en assurant un dimensionnement vers un nombre de tâches en parallèle plus élevé que ce que permettent la plupart des environnements sur site. AWS permet de réduire les coûts en fournissant des solutions optimisées pour des applications spécifiques, et sans investissement initial important. En savoir plus

Instances Amazon EC2 P3dn.24xlarge

À venir : Une nouvelle taille d'instance plus rapide, plus puissante et plus grande optimisée pour le machine learning distribué et le calcul haute performance

Les instances Amazon EC2 P3dn.24xlarge représentent les instances les plus rapides, les plus puissantes et les plus volumineuses et elles offrent un débit de réseau pouvant atteindre 100 Gbit/s, 8 GPU NVIDIA® Tesla® V100 dotés chacun de 32 Go de mémoire, 96 processeurs virtuels personnalisés Intel® Xeon® Scalable (Skylake) et 1.8 To de stockage local sur SSD basé sur NVMe. La mise en réseau plus rapide, les nouveaux processeurs, le doublement de la mémoire GPU et les processeurs virtuels supplémentaires permettent aux développeurs de réduire considérablement le temps nécessaire à la formation de leurs modèles de machine learning ou à l'exécution de simulations HPC supplémentaires en dimensionnant leurs tâches sur plusieurs instances (16, 32 ou 64 instances, par exemple). Les modèles de machine learning nécessitent une grande quantité de données pour la formation. Outre l’augmentation du débit de transmission des données entre les instances, le débit réseau supplémentaire des instances P3dn.24xlarge peut également être utilisé pour accélérer l’accès à de grandes quantités de données de formation en se connectant à Amazon S3 ou à des solutions de systèmes de fichiers partagés tels que Amazon EFS.

ÉLIMINER LES GOULOTS D’ÉTRANGLEMENT ET RÉDUIRE LE TEMPS DE FORMATION MACHINE LEARNING

Avec un débit de réseau de 100 Gb/s, les développeurs peuvent utiliser efficacement un grand nombre d'instances P3dn.24xlarge (par exemple, 16, 32 ou 64 instances) pour une formation distribuée et réduire considérablement le temps nécessaire à la formation de leurs modèles. Les 96 vCPOU des processeurs Intel Skylake AWS personnalisés avec les instructions AVX-512 fonctionnant à 2,5 GHz aident à optimiser le traitement préalable des données. De plus, les instances P3dn.24xlarge utilisent le système AWS Nitro, une combinaison de matériel dédié et d’un hyperviseur léger, qui fournit pratiquement toutes les ressources de calcul et de mémoire du matériel hôte à vos instances.

 

Diminution du coût total de possession en optimisation l’utilisation du GPU

La mise en réseau améliorée utilisant la dernière version de la carte réseau Elastic avec une bande passante réseau globale allant jusqu'à 100 Gb/s peut être utilisée non seulement pour partager des données sur plusieurs instances P3dn.24xlarge, mais également pour un accès à haut débit aux données via Amazon S3 ou des systèmes de fichiers partagés solution telle que Amazon EFS. L'accès aux données à haut débit est essentiel pour optimiser l'utilisation des GPU et offrir des performances maximales à partir des instances de calcul.

Prenez en charge des modèles plus grands et plus complexes

Les grandes instances P3dn.24x offrent des GPU NVIDIA Tesla V100 dotés de 32 Go de mémoire qui permettent de former des modèles machine learning plus avancés et plus volumineux, ainsi que de traiter des lots plus importants de données, telles que des images 4k pour la classification des images et la détection d’objets.

 

Instance Amazon EC2 P3 - Détails du produit

Taille d'instance GPU - Tesla V100 Pair à pair GPU Mémoire de GPU (Go) Processeurs virtuels Mémoire (Go) Bande passante réseau Bande passante EBS Prix/heure pour les instances à la demande* Tarif horaire effectif des instances réservées sur 1 an* Tarif horaire effectif des instances réservées sur 3 ans*
p3.2xlarge 1 N/A 16 8 61 Jusqu'à 10 Go/s 1,5 Go/s 3,06 USD 1,99 USD 1,23 USD
p3.8xlarge 4
NVLink 64 32 244 10 Go/s 7 Go/s 12,24 USD 7,96 USD 4,93 USD
p3.16xlarge 8 NVLink 128 64 488 25 Go/s 14 Go/s 24,48 USD 15,91 USD 9,87 USD
p3dn.24xlarge* 8 NVLink 256 96 768 100 Gb/s 14 Gb/s À venir À venir À venir

*À venir.

Prix pratiqués sous Linux/Unix dans la région AWS USA Est (Virginie du Nord) et arrondis au 0,01 USD le plus près. Pour consulter l'ensemble des informations de tarification, consultez la page de tarification d'Amazon EC2.

Les clients peuvent acheter des instances P3 sous forme d'instances à la demande, d'instances réservées, d'instances Spot ou d'hôtes dédiés.

FACTURATION À LA SECONDE

L'un des nombreux avantages du cloud computing est la nature élastique du provisionnement ou du déprovisionnement des ressources au fur et à mesure que vous en avez besoin. En facturant l'utilisation à la seconde près, nous permettons aux clients d'augmenter leur élasticité, d'économiser de l'argent et d'optimiser l'allocation des ressources en vue d'atteindre leurs objectifs d'apprentissage automatique.

TARIFICATION DES INSTANCES RÉSERVÉES

Les instances réservées vous permettent de bénéficier d'une remise conséquente (jusqu'à 75 %) par rapport aux tarifs des instances à la demande. De plus, lorsque des instances réservées sont attribuées à une zone de disponibilité spécifique, elles fournissent une réservation de capacité, ce qui vous conforte dans l'idée que vous pouvez lancer des instances quand vous en avez besoin.

TARIFICATION SPOT

Avec les instances Spot, vous payez le prix Spot en vigueur pendant la durée d'exécution de vos instances. Les prix des instances Spot sont définis par Amazon EC2 et sont ajustés graduellement en fonction des tendances à long terme en matière d'offre et de demande de capacité d'instance Spot. Les instances Spot sont disponibles avec une réduction allant jusqu'à 90 % par rapport au tarif à la demande.

La plus grande disponibilité mondiale

1856-Updated Map Image-P3 Instances-transparentBG_1024x543

Les instances Amazon EC2 P3.2xlarge, P3.8xlarge and P3.16xlarge sont disponibles dans 14 régions AWS afin que les clients aient la flexibilité de former et de déployer leurs modèles de machine learning où que leurs données soient stockées. Les régions pour lesquelles Amazon P3 est disponible sont les suivantes : USA Est (Virginie du Nord), USA Est (Ohio), USA Ouest (Oregon), Canada (Centre), Europe (Irlande), Europe (Francfort), Europe (Londres), Asie-Pacifique (Tokyo), Asie-Pacifique (Séoul), Asie-Pacifique (Sydney), Asie-Pacifique (Singapour), Chine (Beijing), Chine (Ningxia) et AWS GovCloud (US).

La disponibilité régionale de P3dn.24xlarge sera annoncée lorsque les instances seront généralement disponibles.

Commencez avec les instances Amazon EC2 P3 pour le machine learning

Pour commencer en quelques minutes, apprenez-en plus sur Amazon SageMaker ou utilisez l'AWS Deep Learning AMI, préinstallé avec des structures d'apprentissage en profondeur fréquemment utilisées telles que Caffe2 et Mxnet. Vous pouvez également utiliser l'AMI NVIDIA avec pilote de GPU et boîte à outils CUDA préinstallés.

Articles et publications de blog

À propos de Amazon SageMaker

Cliquez ici pour en savoir plus

À propos de l’apprentissage profond sur AWS

Cliquez ici pour en savoir plus

À propos du Calcul Haute Performance (HPC)

Cliquez ici pour en savoir plus
Prêt à vous lancer ?
S'inscrire
D'autres questions ?
Contactez-nous