Управляйте кластерами Amazon SageMaker HyperPod с помощью нового MCP-сервера Amazon SageMaker AI

Проведено: 25 нояб. 2025 г.

MCP-сервер Amazon SageMaker AI теперь поддерживает инструменты, помогающие настраивать кластеры HyperPod и управлять ими. Amazon SageMaker HyperPod упрощает создание генеративных моделей искусственного интеллекта за счет быстрого масштабирования задач по разработке моделей, таких как обучение, точная настройка или развертывание, в кластере ускорителей искусственного интеллекта. MCP-сервер SageMaker AI теперь позволяет ИИ-помощникам для написания кода выделять кластеры ИИ и ML и управлять ими для обучения и развертывания моделей.

Серверы MCP в AWS предоставляют стандартный интерфейс для более эффективной разработки приложений с помощью искусственного интеллекта (ИИ). Они снабжают ИИ-помощники по написанию кода контекстной аналитической информацией по различным сервисам AWS в реальном времени. MCP-сервер SageMaker AI поставляется с инструментами, упрощающими выполнение всего комплекса операций по эксплуатации кластеров ИИ/ML – от первоначальной настройки до текущего управления – через выбранный вами ИИ-помощник. Эта функция позволяет агентам ИИ надежно развертывать кластеры HyperPod, оркестрируемые Amazon EKS или Slurm, включая все необходимые предварительные условия, на базе шаблонов CloudFormation, оптимизирующих сетевые ресурсы, хранилище и вычислительные ресурсы. Кластеры, создаваемые с помощью этого сервера MCP, полностью оптимизированы для высокопроизводительных распределенных рабочих нагрузок обучения и вывода. Это достигается за счет использования лучших архитектурных практик для повышения пропускной способности и снижения задержек при масштабировании. Кроме того, он предоставляет комплексный набор инструментов для управления кластерами и узлами – для выполнения операций масштабирования, установки исправлений и различных задач по обслуживанию. При использовании в комбинации с MCP-серверами AWS API, AWS Knowledge и Amazon EKS обеспечивается охват всех API SageMaker HyperPod. Это позволяет эффективно устранять распространенные проблемы, например диагностировать, почему узел кластера стал недоступен. Администраторам кластеров эти инструменты помогают эффективнее выполнять повседневные операции. Исследователи данных могут создавать кластеры для ИИ/ML нужного масштаба, не имея опыта по управлению инфраструктурой и уделяя все внимание обучению и развертыванию моделей.

Управлять кластерами ИИ и машинного обучения через MCP-сервер SageMaker AI можно во всех регионах, где предоставляется SageMaker HyperPod. Для начала работы ознакомьтесь с документацией по MCP-серверам AWS.