Pourquoi utiliser les UltraClusters Amazon EC2 ?
Les UltraClusters Amazon Elastic Compute Cloud (Amazon EC2) permettent une mise à l’échelle à des milliers de GPU ou à des puces AI de ML conçus à cet effet, tels qu’AWS Trainium, pour accéder à la demande à un superordinateur. Il démocratise l'accès à des performances d'un superordinateur pour les développeurs de machine learning (ML), d'IA générative et de calcul haute performance (HPC) grâce à un modèle de tarification à l'usage simple sans aucun coût de configuration ou de maintenance. Les instances Amazon EC2 déployées dans EC2 UltraClusters incluent les instances P6e-GB200, P6-B200, P5en, P5e, P5, P4d, Trn2 et Trn1.
Les UltraClusters EC2 sont composés de milliers d'instances EC2 accélérées qui sont co-localisées dans une zone de disponibilité AWS donnée et interconnectées via le réseau Elastic Fabric Adapter (EFA) dans un réseau non bloquant à l'échelle du pétabit. EC2 UltraClusters donne également accès à Amazon FSx for Lustre, un stockage partagé entièrement géré basé sur le système de fichiers parallèle hautes performances le plus populaire pour traiter rapidement des ensembles de données volumineux à la demande et à grande échelle avec des latences inférieures à la milliseconde. Les UltraClusters EC2 fournissent des fonctionnalités de mise à l'échelle horizontale pour l'entraînement distribué de ML et les charges de travail HPC étroitement couplées.
Avantages
Fonctions
Instances et UltraServers pris en charge
Avez-vous trouvé les informations que vous recherchiez ?
Faites-nous part de vos commentaires afin que nous puissions améliorer le contenu de nos pages