Publié le: Jul 26, 2023

AWS annonce aujourd'hui la disponibilité générale des instances Amazon Elastic Compute Cloud (Amazon EC2) P5, alimentées par les derniers GPU NVIDIA H100 Tensor Core. Ces instances offrent les performances les plus élevées d'Amazon EC2 pour les applications de deep learning et de calcul haute performance (HPC). Ils vous permettent de réduire le délai de mise en œuvre de la solution jusqu'à 6 fois et de réduire les coûts d'entraînement des modèles de machine learning jusqu'à 40 % par rapport aux instances basées sur GPU de génération précédente.

Vous pouvez utiliser les instances Amazon EC2 P5 pour la formation et le déploiement de grands modèles de langage (LLM) et de modèles de diffusion de plus en plus complexes qui alimentent les applications d'IA générative les plus exigeantes. Cela inclut la réponse aux questions, la génération de code, la génération de vidéos et d'images, la reconnaissance vocale, etc. Vous pouvez également utiliser les instances P5 pour déployer des applications HPC exigeantes à grande échelle dans les domaines de la découverte pharmaceutique, de l'analyse sismique, des prévisions météorologiques et de la modélisation financière.

Pour améliorer les performances et réduire les coûts, les instances P5 associent des GPU NVIDIA H100 Tensor Core à des performances de processeur deux fois supérieures, à une mémoire système deux fois plus élevée et à un stockage local quatre fois plus élevé que les instances basées sur des GPU de génération précédente. Ils offrent des capacités évolutives de pointe pour la formation distribuée et les charges de travail HPC étroitement couplées avec un réseau pouvant atteindre 3 200 Gbit/s grâce à la technologie Elastic Fabric Adapter (EFA) de deuxième génération. Pour répondre aux besoins des clients à grande échelle avec une faible latence, les instances P5 sont déployées dans Amazon EC2 UltraClusters. Ils fournissent une interconnexion non bloquante à l'échelle du pétabit entre jusqu'à 20 000 GPU H100, offrant jusqu'à 20 exaflops de capacité de calcul globale.

Les instances P5 sont désormais disponibles dans les régions AWS USA Est (Virginie du Nord) et USA Ouest (Oregon) dans les tailles p5.48xl.

Pour en savoir plus sur les instances P5, consultez la section Instances P5 Amazon EC2.