Amazon SageMaker HyperPod
Mettez à l’échelle et accélérez le développement de modèles d’IA générative à l’aide de milliers d’accélérateurs d’IA
Qu’est-ce qu’Amazon SageMaker HyperPod ?
Amazon SageMaker HyperPod permet d’éliminer les tâches fastidieuses liées à la création de modèles d’IA générative. Il permet de rapidement mettre à l’échelle les tâches de développement de modèles telles que l’entraînement, le peaufinage ou l’inférence sur un cluster de centaines ou de milliers d’accélérateurs d’IA. SageMaker HyperPod permet une gouvernance centralisée de toutes vos tâches de développement de modèles, vous offrant ainsi une visibilité et un contrôle complets sur la priorisation des différentes tâches et sur la manière dont les ressources de calcul sont allouées à chaque tâche, ce qui vous permet d’optimiser l’utilisation du GPU et d’AWS Trainium de votre cluster, mais aussi d’accélérer l’innovation.
Spécialement conçu pour l’entraînement distribué à grande échelle
Avec SageMaker HyperPod, vous pouvez répartir et paralléliser efficacement votre charge de travail d’entraînement sur tous les accélérateurs. SageMaker HyperPod applique automatiquement les meilleures configurations d’entraînement pour les modèles les plus courants disponibles au public afin de vous aider à atteindre rapidement des performances optimales. Il surveille également en permanence votre cluster pour détecter tout défaut d’infrastructure, répare automatiquement le problème et restaure vos charges de travail sans intervention humaine, ce qui vous permet d’économiser jusqu’à 40 % du temps d’entraînement.
Avantages de SageMaker HyperPod
Réduisez les coûts grâce à une gouvernance centralisée de toutes les tâches de développement de modèles
L’innovation de SageMaker HyperPod en matière de gouvernance des tâches offre une visibilité et un contrôle complets sur l’allocation des ressources de calcul entre les tâches de développement de modèles d’IA générative, telles que l’entraînement et l’inférence. SageMaker HyperPod gère automatiquement les files de tâches, ce qui garantit que les tâches les plus stratégiques sont traitées en priorité, et achevées dans les délais et dans les limites du budget tout en utilisant plus efficacement les ressources de calcul pour réduire les coûts de développement des modèles jusqu’à 40 %.
Obtenez des performances de pointe grâce à des recettes et à des outils
Grâce aux recettes SageMaker HyperPod, les scientifiques des données et les développeurs de tous niveaux bénéficient de performances de pointe tout en commençant à entraîner et à peaufiner des modèles d’IA générative accessibles au public en quelques minutes. En outre, vous pouvez personnaliser les modèles de fondation (FM) Amazon Nova, notamment Nova Micro, Nova Lite et Nova Pro, en fonction de cas d’utilisation spécifiques à votre entreprise en utilisant les recettes pour améliorer la précision de vos applications d’IA générative, tout en préservant le rapport qualité-prix inégalé de Nova et sa faible latence. SageMaker HyperPod propose également des outils d’expérimentation et d’observabilité intégrés pour vous aider à améliorer les performances des modèles.
Mettez à l’échelle et parallélisez efficacement l’entraînement des modèles sur des milliers d’accélérateurs d’IA
Supprimez les interruptions grâce à un environnement de développement résilient
Accélérer le déploiement des modèles « open-weight »
SageMaker HyperPod permet d’accélérer les déploiements des modèles « open-weight » à partir de SageMaker JumpStart et des modèles ajustés à partir d’Amazon S3 et d’Amazon FSx. Vous pouvez rationaliser les tâches de déploiement des modèles grâce à l’approvisionnement automatique, à la gestion des ressources informatiques via la gouvernance des tâches, à la surveillance des performances en temps réel et à une observabilité accrue.
Présentation de la gouvernance des tâches dans SageMaker HyperPod
Optimisez l’utilisation et bénéficiez d’une visibilité complète des ressources de calcul, tout en réduisant les coûts.