Les instances Amazon EC2 P5en, optimisées pour l’IA générative et le HPC, sont généralement disponibles

Publié le: 2 déc. 2024

AWS annonce aujourd’hui la disponibilité générale des instances Amazon Elastic Compute Cloud (Amazon EC2) P5en, alimentées par les derniers GPU NVIDIA H200 Tensor Core. Ces instances offrent les performances les plus élevées d'Amazon EC2 pour les applications de deep learning et de calcul haute performance (HPC).

Vous pouvez utiliser les instances Amazon EC2 P5en pour l’entraînement et le déploiement de grands modèles de langage (LLM) et de modèles de diffusion de plus en plus complexes qui alimentent les applications d’IA générative les plus exigeantes. Les instances P5en vous permettent également de déployer à grande échelle des applications HPC complexes dans les domaines de la découverte pharmaceutique, de l’analyse sismique, des prévisions météorologiques et de la modélisation financière.

Les instances P5en sont équipées de 8 GPU H200 qui ont une taille de mémoire GPU et une bande passante mémoire de GPU respectivement 1,7 fois et 1,5 fois supérieures à celles des GPU H100 présents dans les instances P5. Les instances P5en associent les GPU H200 à des processeurs Intel Xeon Scalable personnalisés de 4e génération à hautes performances, ce qui permet d’utiliser le PCIe Gen5 entre le processeur et le GPU, ce qui fournit jusqu’à 4 fois la bande passante entre le processeur et le GPU et améliore les performances d’entraînement et d’inférence de l’IA. Le P5en, avec jusqu’à 3 200 Gbit/s de troisième génération d’EFA utilisant Nitro v5, présente une amélioration de la latence allant jusqu’à 35 % par rapport au P5 qui utilise la génération précédente d’EFA et de Nitro. Ainsi, les performances de communication collective sont améliorées pour les charges de travail d’entraînement distribué telles que le deep learning, l’IA générative, le traitement des données en temps réel et les applications de calcul haute performance (HPC). Pour répondre aux besoins des clients en matière de déploiement à grande échelle avec une faible latence, les instances P5en sont déployées dans Amazon EC2 UltraClusters et fournissent des fonctionnalités d’évolutivité de pointe pour l’entraînement distribué et les charges de travail HPC étroitement couplées.

Les instances P5en sont désormais disponibles dans les régions AWS USA Est (Ohio), USA Ouest (Oregon) et Asie-Pacifique (Tokyo) et dans la zone locale USA Est (Atlanta) us-east-1-atl-2a au format p5en.48xlarge.

Pour en savoir plus sur les instances P5en, consultez la section Instances Amazon EC2 P5en.