Les instances Amazon EC2 P5en sont désormais disponibles dans les régions USA Est (Virginie du Nord) et Asie-Pacifique (Jakarta)
À compter d'aujourd'hui, les instances Amazon Elastic Compute Cloud (Amazon EC2) P5en équipées de GPU NVIDIA H200 sont disponibles dans les régions USA Est (Virginie du Nord) et Asie-Pacifique (Jakarta). Ces instances sont optimisées pour les applications d'IA générative et de calcul haute performance (HPC).
Les instances P5en sont équipées de 8 GPU H200 qui ont une taille de mémoire GPU et une bande passante mémoire de GPU respectivement 1,7 fois et 1,4 fois supérieures à celle des GPU H100 présents dans les instances P5. Les instances P5en associent les GPU H200 à des processeurs Intel Xeon Scalable personnalisés de 4e génération à hautes performances, ce qui permet d’utiliser le PCIe Gen5 entre le processeur et le GPU, ce qui fournit jusqu’à 4 fois la bande passante entre le processeur et le GPU et améliore les performances d’entraînement et d’inférence de l’IA. Le P5en, avec jusqu’à 3 200 Gbit/s de troisième génération d’EFA utilisant Nitro v5, présente une amélioration de la latence allant jusqu’à 35 % par rapport au P5 qui utilise la génération précédente d’EFA et de Nitro. Ainsi, les performances de communication collective sont améliorées pour les charges de travail d’entraînement distribué telles que le deep learning, l’IA générative, le traitement des données en temps réel et les applications de calcul haute performance (HPC). Pour répondre aux besoins des clients en matière de déploiement à grande échelle avec une faible latence, les instances P5en sont déployées dans Amazon EC2 UltraClusters et fournissent des fonctionnalités d’évolutivité de pointe pour l’entraînement distribué et les charges de travail HPC étroitement couplées.
Grâce à ces régions supplémentaires, les instances P5en sont désormais disponibles dans les régions AWS USA Est (Virginie du Nord, Ohio), USA Ouest (Oregon), Europe (Espagne) et Asie-Pacifique (Jakarta, Mumbai, Séoul, Tokyo et Séoul) et la zone locale USA Est (Atlanta) us-east-1-atl-2a au format p5en.48xlarge.
Pour en savoir plus sur les instances P5en, consultez la section Instances Amazon EC2 P5en.