Amazon SageMaker HyperPod представляет новую функцию наблюдаемости

Проведено: 10 июля 2025 г.

Новая функция наблюдаемости Amazon SageMaker HyperPod ускоряет разработку моделей генеративного искусственного интеллекта за счет полной прозрачности вычислительных ресурсов и задач разработки. Это избавляет от необходимости вручную собирать сотни метрик по всему стеку, визуализировать корреляции между ними и устранять сбой задачи по разработке модели генеративного искусственного интеллекта. Система управления наблюдаемостью HyperPod в реальном времени отслеживает метрики производительности задач, отправляет оповещение в случае их ухудшения и автоматически устраняет первопричину с помощью определенных клиентом политик.

Система управления наблюдаемостью SageMaker HyperPod меняет способы мониторинга и оптимизации задач по разработке моделей генеративного искусственного интеллекта. В Управляемой Amazon Grafana доступна предварительно настроенная единая панель мониторинга, данные из которой автоматически публикуются в рабочем пространстве Управляемого сервиса Amazon для Prometheus. Благодаря этому клиенты теперь могут просматривать метрики производительности задач генеративного искусственного интеллекта, сведения об использовании ресурсов и работоспособности кластера в едином представлении. Это позволяет командам быстро выявлять узкие места, предотвращать дорогостоящие задержки и оптимизировать вычислительные ресурсы. Клиенты могут настраивать автоматические оповещения, получать метрики задач для конкретных сценариев использования и публиковать их на единой панели всего за несколько щелчков мышью. Это сокращает сроки устранения неполадок с нескольких дней до считаных минут, помогая клиентам ускорить переход к производству и максимально увеличить окупаемость инвестиций в искусственный интеллект.

Система управления наблюдаемостью SageMaker HyperPod доступна во всех регионах AWS, где поддерживается SageMaker HyperPod, кроме Запада США (Северная Калифорния) и Азиатско-Тихоокеанского региона (Мельбурн). Чтобы узнать больше и начать работу, ознакомьтесь с блогом, изучите документацию и посетите веб-страницу SageMaker HyperPod.