SageMaker HyperPod prend désormais en charge l'allocation précise des quotas de ressources informatiques

Publié le: 14 août 2025

La gouvernance des tâches pour SageMaker HyperPod permet désormais une allocation précise des quotas de calcul entre le GPU, l'accélérateur Trainium, le processeur virtuel et la mémoire du processeur virtuel au sein d'une instance. Les administrateurs peuvent allouer des quotas de calcul précis entre les équipes, optimisant ainsi la distribution des ressources de calcul et respectant le budget.

Les scientifiques des données exécutent souvent des tâches LLM, telles que l’entraînement ou l'inférence, qui ne nécessitent pas d'instances HyperPod complètes, ce qui entraîne une sous-utilisation des ressources de calcul accélérées. La gouvernance des tâches HyperPod permet aux administrateurs de gérer l'allocation des quotas de calcul entre les équipes. Grâce à cette fonctionnalité, les administrateurs peuvent désormais allouer stratégiquement les ressources de calcul, garantir un accès équitable, empêcher la monopolisation des ressources et optimiser l'utilisation des clusters. Cette fonctionnalité permet une allocation précise des quotas de calcul en plus de l'allocation au niveau de l'instance, en fonction des exigences de charge de travail de l'organisation.

La gouvernance des tâches pour SageMaker HyperPod est disponible dans toutes les régions AWS où HyperPod est disponible : USA Est (Virginie du Nord), USA Ouest (Californie du Nord), USA Ouest (Oregon), Asie-Pacifique (Mumbai), Asie-Pacifique (Singapour), Asie-Pacifique (Sydney) et Asie-Pacifique (Tokyo), Europe (Francfort), Europe (Irlande), Europe (Londres), Europe (Stockholm) et Amérique du Sud (São Paulo).

Pour en savoir plus, consultez la page Web de SageMaker HyperPod et la documentation sur la gouvernance des tâches HyperPod.