UltraClusters Amazon EC2
Exécutez des applications HPC et ML à grande échelle
Pourquoi utiliser les UltraClusters Amazon EC2 ?
Les UltraClusters Amazon Elastic Compute Cloud (Amazon EC2) permettent une mise à l’échelle à des milliers de GPU ou à des puces AI de ML conçus à cet effet, tels qu’AWS Trainium, pour accéder à la demande à un superordinateur. Il démocratise l'accès à des performances d'un superordinateur pour les développeurs de machine learning (ML), d'IA générative et de calcul haute performance (HPC) grâce à un modèle de tarification à l'usage simple sans aucun coût de configuration ou de maintenance. Les instances Amazon EC2 déployées dans EC2 UltraClusters incluent les instances P6e-GB200, P6-B200, P5en, P5e, P5, P4d, Trn2 et Trn1.
Les UltraClusters EC2 sont composés de milliers d'instances EC2 accélérées qui sont co-localisées dans une zone de disponibilité AWS donnée et interconnectées via le réseau Elastic Fabric Adapter (EFA) dans un réseau non bloquant à l'échelle du pétabit. EC2 UltraClusters donne également accès à Amazon FSx for Lustre, un stockage partagé entièrement géré basé sur le système de fichiers parallèle hautes performances le plus populaire pour traiter rapidement des ensembles de données volumineux à la demande et à grande échelle avec des latences inférieures à la milliseconde. Les UltraClusters EC2 fournissent des fonctionnalités de mise à l'échelle horizontale pour l'entraînement distribué de ML et les charges de travail HPC étroitement couplées.
Avantages
Délai de résolution plus rapide pour l'entraînement distribué et le HPC
Accès à la demande à un superordinateur exascale
Flexibilité pour optimiser les performances et les coûts
Fonctions
Mise en réseau haute performance
Systèmes à haute performance
Instances et UltraServers pris en charge
UltraServer P6e-GB200
Accélérées par le GPU NVIDIA GB200 NVL72, les instances P6e-GB200 dans une configuration UltraServer offrent les meilleures performances d’entraînement et d’inférence d’IA avec GPU sur Amazon EC2.
Instances P6-B200
Les instances Amazon EC2 P6-B200, accélérées par les GPU NVIDIA Blackwell, offrent des instances hautes performances pour l’entraînement de l’IA, l’inférence et le HPC.
Instances Trn2 et UltraServers
Animées par les puces IA AWS Trainium2, les instances Trn2 offrent un rapport prix/performances de 30 à 40 % supérieur à celui des instances basées sur des GPU comparables.
Instances P5en, P5e et P5
Animées par les GPU NVIDIA H200 Tensor Core, les instances P5en et P5e offrent les meilleures performances dans Amazon EC2 pour l’entraînement du ML et les applications HPC. Les instances P5 sont alimentées par des GPU NVIDIA H100 Tensor Core.
Instances P4d
Alimentées par les GPU NVIDIA A100 Tensor Core, les instances P4D offrent des performances élevées pour l'entraînement de ML et les applications HPC.
Instances Trn1
Alimentées par les puces IA AWS Trainium, les instances Trn1 sont spécialement conçues pour l’entraînement de ML à haute performance. Elles permettent d'économiser jusqu'à 50 % sur les coûts d'entraînement par rapport aux instances EC2 comparables.
Avez-vous trouvé les informations que vous recherchiez ?
Faites-nous part de vos commentaires afin que nous puissions améliorer le contenu de nos pages