Сервис параллельных вычислений AWS теперь поддерживает Slurm 25.11

Проведено: 23 апр. 2026 г.

Сервис параллельных вычислений AWS (AWS PCS) теперь поддерживает версию Slurm 25.11 с поддержкой совместимого с Prometheus адреса OpenMetrics и вводит новые типы журналов, включая журналы аудита планировщика.

В этой версии Slurm 25.11 реализован ускоренный возврат в очередь, позволяющий автоматически переносить задания, на которые повлияли проблемы с узлами, с наивысшим приоритетом, чтобы ускорить восстановление рабочих нагрузок. Вы можете включить новый адрес OpenMetrics для просмотра заданий, узлов и планирования в реальном времени с помощью существующих инструментов мониторинга. Теперь AWS PCS также может отправлять журналы демона баз данных Slurm (slurmdbd) и демона Обработки запросов на основе передачи состояния (slurmrestd) в Журналы Amazon CloudWatch, Amazon S3 или Amazon Data Firehose, помогая диагностировать проблемы с учетом и отлаживать интеграцию API. Журналы аудита планировщика, ранее включенные в операционные журналы, теперь поставляются в виде специального типа журналов, что обеспечивает независимый контроль над затратами на прием данных и хранение.

AWS PCS – это управляемый сервис, который позволяет вам легче запускать и масштабировать рабочие нагрузки для высокопроизводительных вычислений, чтобы создавать научные и инженерные модели на AWS с помощью Slurm. AWS PCS можно использовать для создания полнофункциональных эластичных сред, в которых объединены вычислительные ресурсы, хранилища, сети и инструменты визуализации. AWS PCS упрощает операции с кластерами благодаря управляемым обновлениям и встроенным функциям наблюдаемости, что помогает снизить затраты на обслуживание. Вы можете работать в привычной среде, сосредоточившись на исследованиях и инновациях без отвлечения на инфраструктуру.

Данные функции доступны во всех регионах AWS, в которых предлагается AWS PCS. За доставку журналов в пункты назначения взимается стандартная плата. Подробности об AWS PCS см. в документации по сервису.