Amazon SageMaker HyperPod ahora admite acciones de nodo desde la consola

Publicado en: 10 de feb de 2026

Amazon SageMaker HyperPod ahora le permite administrar nodos de clústeres individuales directamente desde la Consola de AWS. Los operadores de clústeres de HyperPod que administran cargas de trabajo de IA y ML a gran escala suelen necesitar conectarse a los nodos para solucionar problemas, reiniciar las instancias que no responden o reemplazar los nodos degradados. Anteriormente, para conectarse a un nodo, era necesario construir manualmente las cadenas de conexión de SSM, mientras que las acciones de recuperación del nodo, como reiniciar o reemplazar, requerían comandos de la CLI; ahora la consola ofrece una única interfaz para todas las acciones relacionadas con el nodo.

Con las acciones de nodo en la consola, ahora puede conectarse a cualquier nodo mediante AWS Systems Manager (SSM). La consola proporciona comandos de la CLI de SSM rellenados previamente con soporte para copiar al portapapeles y el inicio directo de sesiones de SSM en la consola. Si bien los clústeres de SageMaker HyperPod ya admiten el reemplazo y el reinicio automáticos de instancias en mal estado, hay situaciones como el exceso de memoria o la degradación indetectable del hardware que pueden requerir una intervención manual. Ahora, las acciones de nodo en la consola proporcionan un enfoque coherente para reiniciar manualmente los nodos para recuperarse de problemas transitorios, eliminar nodos en mal estado y reemplazar nodos, con operaciones por lotes que admiten acciones de varios nodos simultáneamente, lo que permite resolver los problemas de los nodos en cuestión de minutos. Esta capacidad es especialmente valiosa cuando se ejecutan cargas de trabajo de inferencia y entrenamiento de IA urgentes en las que es esencial minimizar el tiempo de inactividad.

Esta característica está disponible en todas las regiones de AWS en las que Amazon SageMaker HyperPod está disponible. Puede realizar todas estas acciones de nodo en la página de administración del clúster de HyperPod de la consola. Haga clic en los enlaces correspondientes para obtener más información sobre la sustitución o el reinicio y la conexión a un nodo.