Amazon SageMaker HyperPod ahora admite etiquetas y taints personalizadas de Kubernetes

Publicado en: 26 de nov de 2025

Amazon SageMaker HyperPod ahora admite etiquetas y taints personalizadas de Kubernetes. Esto les permite a los clientes controlar la programación de los pods e integrarse sin problemas con la infraestructura de Kubernetes existente. Los clientes que implementan cargas de trabajo de IA en clústeres de HyperPod orquestados con EKS necesitan un control preciso sobre la ubicación de las cargas de trabajo para evitar que los módulos del sistema y las cargas de trabajo que no son de IA consuman los costosos recursos de la GPU, al tiempo que garantizan la compatibilidad con complementos de dispositivos personalizados, como los operadores de GPU EFA y NVIDIA. Anteriormente, los clientes tenían que aplicar etiquetas y taints manualmente con kubectl y volver a aplicarlas después de cada operación de reemplazo, escalado o aplicación de parches de nodos, lo que generaba una importante sobrecarga operativa.

Esta capacidad te permite configurar etiquetas y taints en grupos de instancias a través de las API CreateCluster y UpdateCluster. De este modo, se ofrece un enfoque administrado para definir y mantener las políticas de programación durante todo el ciclo de vida del nodo. Con el nuevo parámetro KubernetesConfig, puede especificar hasta 50 etiquetas y 50 taints por grupo de instancias. Las etiquetas permiten la organización de los recursos y la segmentación de los pods mediante selectores de nodos, mientras que las taints repelen los pods sin igualar las tolerancias para proteger los nodos especializados. Por ejemplo, puede aplicar las taints NoSchedule a los grupos de instancias de GPU para garantizar que solo los trabajos de entrenamiento de IA con tolerancias explícitas consuman recursos de computación de alto costo, o agregar etiquetas personalizadas que permitan que los pods de complementos del dispositivo se programen correctamente. HyperPod aplica automáticamente estas configuraciones durante la creación de nodos y las mantiene durante las operaciones de reemplazo, escalado y aplicación de parches. Así, se evita la intervención manual y reduce la sobrecarga operativa.

Esta característica está disponible en todas las regiones de AWS en las que Amazon SageMaker HyperPod está disponible. Para obtener más información sobre las etiquetas personalizadas y las propiedades taints, consulte la guía del usuario.