Amazon SageMaker HyperPod prend désormais en charge les instances Spot
Amazon SageMaker HyperPod prend désormais en charge les instances Spot, ce qui permet aux clients de réduire les coûts de calcul du GPU jusqu'à 90 % par rapport aux instances à la demande sur HyperPod. À mesure que les charges de travail liées à l'IA évoluent, l'optimisation des coûts d'infrastructure se révèle essentielle. L'intégration des instances Spot à SageMaker HyperPod répond à cette interrogation en permettant aux clients de tirer automatiquement parti de la capacité EC2 disponible avec des remises importantes, tout en offrant l'expérience d'IA gérée dont les clients bénéficient sur HyperPod.
Grâce aux instances Spot, les entreprises peuvent exécuter des charges de travail tolérantes aux pannes de manière rentable et à grande échelle. Vous pouvez associer les instances Spot à des instances à la demande pour trouver un équilibre entre l'optimisation des coûts et la garantie de disponibilité. La fonctionnalité est disponible sur les clusters HyperPod EKS et s'intègre à Karpenter pour une mise à l'échelle automatique intelligente, la découverte automatique de la capacité Spot disponible et la gestion des interruptions d'instance.
Vous pouvez activer les instances Spot lors de la création de groupes d'instances via l'API CreateCluster ou la console AWS. Cette fonctionnalité prend en charge tous les types d'instances disponibles sur HyperPod, y compris les processeurs et les GPU. La disponibilité de la capacité dépend de l'approvisionnement d'EC2 et varie selon la région et le type d'instance. La prise en charge des instances Spot est disponible dans toutes les régions où SageMaker HyperPod est actuellement disponible. Pour en savoir plus, consultez la documentation.