Amazon SageMaker HyperPod prend désormais en charge les groupes d'instances flexibles
Amazon SageMaker HyperPod prend désormais en charge des groupes d'instances flexibles, ce qui permet aux clients de spécifier plusieurs types d'instances et plusieurs sous-réseaux au sein d'un même groupe d'instances. Les clients qui exécutent des charges de travail de formation et d'inférence sur HyperPod doivent souvent couvrir plusieurs types d'instances et zones de disponibilité pour des raisons de résilience des capacités, d'optimisation des coûts et d'utilisation des sous-réseaux, mais devaient auparavant créer et gérer un groupe d'instances distinct pour chaque combinaison de type d'instance et de zone de disponibilité, ce qui entraînait des frais opérationnels liés à la configuration, à la mise à l'échelle, à l'application de correctifs et à la surveillance du cluster.
Grâce aux groupes d'instances flexibles, vous pouvez définir une liste ordonnée de types d'instances à l'aide du nouveau paramètre InstanceRequirements et fournir plusieurs sous-réseaux dans les zones de disponibilité au sein d'un seul groupe d'instances. HyperPod provisionne les instances en utilisant d'abord le type le plus prioritaire et revient automatiquement aux types les moins prioritaires lorsque la capacité n'est pas disponible, évitant ainsi aux clients d'avoir à réessayer manuellement sur des groupes d'instances individuels. Les clients participant à l’entraînement bénéficient d'une distribution multi-sous-réseaux au sein d'une zone de disponibilité afin d'éviter l'épuisement des sous-réseaux. Les clients d'inférence effectuant une mise à l'échelle manuelle bénéficient d'une solution de repli automatique basée sur les priorités pour tous les types d'instances sans avoir à réessayer chaque groupe d'instances individuellement, tandis que ceux qui utilisent la mise à l'échelle automatique de Karpenter peuvent référencer un seul groupe d'instances flexible. Karpenter détecte automatiquement les types d'instances pris en charge dans le groupe d'instances flexible et fournit le type et la zone de disponibilité optimaux en fonction des besoins des pods. Vous pouvez créer des groupes d'instances flexibles à l'aide des API CreateCluster et UpdateCluster, de l'AWS CLI ou de la console de gestion AWS.
Des groupes d'instances flexibles sont disponibles pour les clusters SageMaker HyperPod utilisant l'orchestrateur EKS dans toutes les régions AWS où SageMaker HyperPod est pris en charge. Pour en savoir plus, consultez la section Groupes d'instances flexibles.