Amazon SageMaker HyperPod valide désormais les Service Quotas avant de créer des clusters sur la console
La console Amazon SageMaker HyperPod valide désormais les Service Quotas pour votre compte AWS avant de lancer la création du cluster, ce qui vous permet de confirmer la disponibilité d’un quota suffisant avant de commencer le provisionnement. SageMaker HyperPod vous aide à mettre en place des clusters résilients pour exécuter des charges de travail de machine learning (ML) et développer des modèles de pointe tels que des grands modèles de langage (LLM), des modèles de diffusion et des modèles de fondation (FM).
Lorsque vous créez des clusters AI/ML à grande échelle, vous devez vous assurer que votre compte dispose de quotas suffisants pour les instances, le stockage et les ressources réseau, mais la validation des quotas nécessitait auparavant des vérifications manuelles sur plusieurs services AWS, ce qui entraînait souvent des échecs lors des tentatives de création de clusters et une perte de temps si vous ne demandiez pas d’augmentation des limites de quota. La nouvelle fonctionnalité de validation des quotas de la console SageMaker HyperPod compare automatiquement vos quotas au niveau du compte par rapport à la configuration de votre cluster, y compris les limites de type d’instance, la taille des volumes EBS et les quotas liés au VPC lors de la création de nouvelles ressources. La validation affiche un tableau clair indiquant l’utilisation attendue, les valeurs de quota appliquées et l’état de conformité de chaque quota. Lorsque les quotas peuvent être dépassés, vous recevez une alerte d’avertissement contenant des liens directs vers la console Service Quotas pour demander des augmentations.
Cette fonctionnalité est disponible dans toutes les régions AWS dans lesquelles Amazon SageMaker HyperPod est proposé. Pour obtenir la liste complète des contrôles de validation des quotas de service effectués, consultez le Guide de l’utilisateur d’Amazon SageMaker HyperPod.