Administre los clústeres de Amazon SageMaker HyperPod con el nuevo servidor MCP de Amazon SageMaker AI

Publicado en: 25 de nov de 2025

El servidor MCP de Amazon SageMaker AI ahora admite herramientas que lo ayudan a configurar y administrar los clústeres de HyperPod. Amazon SageMaker HyperPod elimina el trabajo pesado e indiferenciado que implica la creación de modelos de IA generativa al escalar rápidamente las tareas de desarrollo de modelos, como el entrenamiento, el refinamiento o la implementación en un clúster de aceleradores de IA. El servidor MCP de SageMaker AI ahora permite a los asistentes de codificación de IA aprovisionar y operar clústeres de IA/ML para el entrenamiento y la implementación de modelos.

Los servidores MCP de AWS proporcionan una interfaz estándar para mejorar el desarrollo de aplicaciones asistido por IA al equipar a los asistentes de código de IA con una comprensión contextual en tiempo real de varios servicios de AWS. El servidor MCP de SageMaker AI incluye herramientas que agilizan las operaciones de los clústeres de IA y ML de principio a fin mediante el asistente de IA que elijas, desde la configuración inicial hasta la administración continua. Permite a los agentes de IA configurar de forma fiable clústeres de HyperPod orquestados por Amazon EKS o Slurm con requisitos previos y basado en plantillas de CloudFormation que optimizan los recursos de red, almacenamiento y procesamiento. Los clústeres creados mediante este servidor MCP están totalmente optimizados para cargas de trabajo distribuidas de entrenamiento e inferencia de alto rendimiento, y aprovechan las arquitecturas de mejores prácticas para maximizar el rendimiento y minimizar la latencia a escala. Además, proporciona herramientas integrales para la administración de clústeres y nodos, incluidas las operaciones de escalado, la aplicación de parches de software y la realización de diversas tareas de mantenimiento. Cuando se utiliza junto con el servidor MCP de la API de AWS, el servidor MCP de AWS Knowledge y el servidor MCP de Amazon EKS, obtiene una cobertura completa para todas las API de HyperPod de SageMaker y puede solucionar problemas comunes de forma eficaz, como el diagnóstico de por qué un nodo del clúster se ha vuelto inaccesible. Para los administradores de clústeres, estas herramientas simplifican las operaciones diarias. Para los científicos de datos, permiten configurar clústeres de IA/ML a escala sin necesidad de conocimientos de infraestructura. De este modo, puede centrarse en lo que más importa: la formación y la implementación de modelos.

Puede gestionar los clústeres de IA/ML a través del servidor MCP de SageMaker AI en todas las regiones en las que esté disponible SageMaker HyperPod. Para empezar, consulte la documentación de los servidores MCP de AWS.