Amazon SageMaker AI prend désormais en charge les UltraServers P6e-GB200

Publié le: 12 août 2025

Amazon SageMaker AI annonce aujourd'hui la prise en charge des UltraServers P6e-GB200 dans SageMaker HyperPod et les tâches d’entraînement. Avec les UltraServers P6e-GB200, vous pouvez exploiter jusqu'à 72 GPU NVIDIA Blackwell dans un domaine NVLink pour accélérer l’entraînement et le déploiement de modèles fondamentaux à une échelle de plusieurs milliards de paramètres. Les Ultraservers P6e-GB200 sont disponibles en deux tailles : ml.u-p6e-gb200x72 (72 GPU dans NVLink) et ml.u-p6e-gb200x36 (36 GPU dans NVLink).

Les UltraServers P6e-GB200 fournissent plus de 20 fois plus de calcul et plus de 11 fois plus de mémoire sous une seule instance NVIDIA NVLink par rapport aux instances P5en. Dans chaque domaine NVLink, vous pouvez exploiter 360 pétaflops de calcul FP8 (sans éparpillement) et 13,4 To de mémoire totale à bande passante élevée (HBM3e). Lorsque vous utilisez les UltraServers P6e-GB200 sur SageMaker AI, vous bénéficiez des performances supérieures du GB200 associées à l'infrastructure gérée de SageMaker, notamment en matière de sécurité, de tolérance aux pannes intégrée, de planification tenant compte de la topologie (SageMaker HyperPod EKS et Slurm), de fonctionnalités de surveillance intégrées et d'intégration native avec d'autres services SageMaker AI et AWS.

Les UltraServers sont disponibles via les plans d’entraînement flexibles de SageMaker dans la zone locale de Dallas (« us-east-1-dfw-2a »), une extension de la région AWS USA Est (Virginie du Nord). Pour la réservation à la demande des UltraServers GB200, veuillez contacter votre responsable de compte. Amazon SageMaker AI vous permet d’entraîner facilement des modèles de machine learning à grande échelle à l'aide d'une infrastructure entièrement gérée optimisée en termes de performances et de coûts. Pour commencer à utiliser UltraServers sur SageMaker AI, consultez la documentation.

Amazon SageMaker AI prend désormais en charge les UltraServers P6e-GB200

Apprendre

Ressources

Développeurs

Aide