Amazon SageMaker HyperPod agora oferece suporte a rótulos e taints personalizados do Kubernetes
O Amazon SageMaker HyperPod agora oferece suporte a rótulos e taints personalizados do Kubernetes, permitindo que os clientes controlem o agendamento de pods e se integrem perfeitamente à infraestrutura existente do Kubernetes. Os clientes que implantam workloads de IA em clusters do HyperPod orquestrados com o EKS precisam de um controle preciso sobre o posicionamento da workload para evitar que recursos caros de GPU sejam consumidos por pods do sistema e workloads que não são de IA, ao mesmo tempo em que garantem a compatibilidade com plug-ins de dispositivos personalizados, como operadores de GPU do EFA e da NVIDIA. Anteriormente, os clientes precisavam aplicar manualmente rótulos e taints usando o kubectl e reaplicá-los após cada operação de substituição, escalabilidade ou correção de nós, criando uma sobrecarga operacional significativa.
Esse recurso permite configurar rótulos e taints no nível do grupo de instâncias por meio das APIs CreateCluster e UpdateCluster, fornecendo uma abordagem gerenciada para definir e manter políticas de agendamento em todo o ciclo de vida do nó. Usando o novo parâmetro KubernetesConfig, você pode especificar até 50 rótulos e 50 taints por grupo de instâncias. Os rótulos permitem a organização de recursos e a segmentação de pods por meio de seletores de nós, enquanto os taints repelem os pods sem igualar as tolerâncias para proteger os nós especializados. Por exemplo, você pode aplicar taints do NoSchedule a grupos de instâncias de GPU para garantir que somente tarefas de treinamento de IA com tolerâncias explícitas consumam recursos computacionais de alto custo ou adicionem rótulos personalizados que permitem que os pods de plug-ins do dispositivo sejam agendados corretamente. O HyperPod aplica automaticamente essas configurações durante a criação do nó e as mantém nas operações de substituição, escalabilidade e correção, eliminando a intervenção manual e reduzindo a sobrecarga operacional.
Esse atributo está disponível em todas as regiões da AWS que oferecem o Amazon SageMaker HyperPod. Para saber mais sobre rótulos e taints personalizados, consulte o guia do usuário.