Amazon SageMaker HyperPod ora supporta etichette e taint Kubernetes personalizzati

Inserito il: 26 nov 2025

Amazon SageMaker HyperPod ora supporta etichette e taint Kubernetes personalizzati, che consentono ai clienti di controllare la pianificazione dei pod e si integrano perfettamente con l'infrastruttura Kubernetes esistente. I clienti che implementano carichi di lavoro IA su cluster HyperPod orchestrati con EKS necessitano di un controllo preciso sul posizionamento dei carichi di lavoro per evitare che costose risorse GPU vengano consumate da pod di sistema e carichi di lavoro non IA, garantendo al contempo la compatibilità con plug-in di dispositivi personalizzati come gli operatori GPU EFA e NVIDIA. In precedenza i clienti dovevano applicare manualmente etichette e taint utilizzando kubectl, quindi applicarli nuovamente dopo ogni operazione di sostituzione, dimensionamento o applicazione di patch dei nodi, creando un notevole sovraccarico operativo.

Questa funzionalità consente di configurare etichette e taint a livello di gruppo di istanze tramite le API CreateCluster e UpdateCluster, fornendo un approccio gestito alla definizione e al mantenimento delle policy di pianificazione durante l'intero ciclo di vita del nodo. Utilizzando il nuovo parametro KubernetesConfig, puoi specificare fino a 50 etichette e 50 taint per gruppo di istanze. Le etichette consentono l'organizzazione delle risorse e il targeting dei pod tramite selettori di nodi, mentre i taint respingono i pod privi delle tolleranze compatibili per proteggere i nodi specializzati. Ad esempio, puoi applicare i taint NoSchedule ai gruppi di istanze GPU per assicurarsi che solo i job di addestramento dell'IA con tolleranze esplicite consumino risorse di calcolo ad alto costo o aggiungere etichette personalizzate che consentano la corretta pianificazione dei pod dei plug-in dei dispositivi. HyperPod applica automaticamente queste configurazioni durante la creazione dei nodi e le mantiene durante le operazioni di sostituzione, dimensionamento e applicazione di patch, eliminando gli interventi manuali e riducendo il sovraccarico operativo.

La funzionalità è disponibile in tutte le regioni AWS in cui è supportato Amazon SageMaker HyperPod. Per ulteriori informazioni su etichette e taint personalizzati, consulta la guida utente.