Gérez les clusters Amazon SageMaker HyperPod avec le nouveau serveur Amazon SageMaker AI MCP

Publié le: 25 nov. 2025

Le serveur Amazon SageMaker AI MCP prend désormais en charge des outils qui vous aident à configurer et gérer des clusters HyperPod. Amazon SageMaker HyperPod élimine les tâches indifférenciées liées à la création de modèles d'IA générative en adaptant rapidement les tâches de développement de modèles, telles que l'entraînement, la mise au point ou le déploiement sur un cluster d'accélérateurs d'IA. Le serveur SageMaker AI MCP permet désormais aux assistants de codage IA de provisionner et d'exploiter des clusters IA/ML pour la formation et le déploiement de modèles.

Les serveurs MCP d'AWS proposent une interface standard pour améliorer le développement d'applications assisté par l'IA en fournissant aux assistants de code IA une compréhension contextuelle en temps réel des différents services AWS. Le serveur SageMaker AI MCP est livré avec des outils qui rationalisent les opérations des clusters IA/ML de bout en bout à l'aide de l'assistant IA de votre choix, de la configuration initiale à la gestion continue. Il permet aux agents d'IA de configurer de manière fiable des clusters HyperPod orchestrés par Amazon EKS ou Slurm, avec les prérequis, basés sur des modèles CloudFormation qui optimisent les ressources réseau, de stockage et de calcul. Les clusters créés via ce serveur MCP sont entièrement optimisés pour les charges de travail d'entraînement et d'inférence distribuées hautes performances, et tirent parti des meilleures architectures pour maximiser le débit et minimiser la latence à grande échelle. En outre, il fournit des outils complets pour la gestion des clusters et des nœuds, y compris les opérations de dimensionnement, l'application de correctifs logiciels et l'exécution de diverses tâches de maintenance. Lorsqu'il est utilisé conjointement avec le serveur AWS API MCP, le serveur AWS Knowledge MCP et le serveur Amazon EKS MCP, vous bénéficiez d'une couverture complète pour toutes les API SageMaker HyperPod et vous pouvez résoudre efficacement les problèmes courants, tels que le diagnostic des raisons pour lesquelles un nœud de cluster est devenu inaccessible. Pour les administrateurs de clusters, ces outils rationalisent les opérations quotidiennes. Pour les scientifiques des données, ils vous permettent de configurer des clusters d'IA/ML à grande échelle sans avoir besoin d'expertise en matière d'infrastructure, ce qui vous permet de vous concentrer sur l'essentiel : la formation et le déploiement de modèles.

Vous pouvez gérer vos clusters d'IA/ML via le serveur SageMaker AI MCP dans toutes les régions où SageMaker HyperPod est disponible. Pour commencer, consultez la documentation relative aux serveurs AWS MCP.