Publié le: Sep 28, 2023

Les instances P5 Amazon EC2, qui offrent les performances les plus élevées d'Amazon EC2 pour les applications de deep learning et de calcul haute performance (HPC), sont désormais disponibles dans la région USA Est (Ohio).

Vous pouvez utiliser les instances P5 pour l'apprentissage et le déploiement des grands modèles de langage (LLM) et modèles de diffusion de plus en plus complexes qui sous-tendent les applications d'IA générative les plus exigeantes : réponse aux questions, génération de code, génération de vidéos et d'images, reconnaissance vocale, etc. Les instances P5 vous permettent également de déployer à grande échelle des applications HPC complexes dans les domaines de la découverte pharmaceutique, de l'analyse sismique, des prévisions météorologiques et de la modélisation financière.

Les instances P5 comportent des GPU NVIDIA H100 Tensor Core. Elles offrent des performances de processeur deux fois supérieures, une mémoire système deux fois plus élevée et un stockage local multiplié par quatre par rapport aux instances basées sur des GPU de génération précédente. Leurs capacités de montée en puissance de pointe sont adaptées à l'entraînement distribué et aux charges de travail HPC étroitement couplées, à travers des performances réseau pouvant atteindre 3 200 Gbit/s grâce à la technologie Elastic Fabric Adapter (EFA) de deuxième génération. Pour répondre aux besoins des clients en matière de mise à l'échelle et de réduction de la latence, les instances P5 sont déployées dans des clusters UltraCluster Amazon EC2 qui fournissent une interconnexion non bloquante à l'échelle du pétaoctet, entre 20 000 GPU H100 au maximum.

Grâce à cette expansion régionale, les instances P5 Amazon EC2 sont désormais disponibles dans les régions USA Est (Ohio), USA Est (Virginie du Nord) et USA Ouest (Oregon).

Pour en savoir plus sur les instances P5, consultez la section Instances P5 Amazon EC2.