Сервис параллельных вычислений AWS (PCS) теперь поддерживает перезагрузку узлов с помощью Slurm

Проведено: 2 окт. 2025 г.

Сервис параллельных вычислений AWS (PCS) теперь позволяет перезагружать вычислительные узлы с помощью команд Slurm без запуска замены инстанса. С помощью этой функции можно перезагружать узлы по эксплуатационным причинам, таким как устранение неполадок, очистка ресурсов и восстановление после повреждения, прежде чем потребуется их полная замена. Это позволяет эффективно поддерживать работоспособность кластера с меньшими затратами.

Данная функция доступна во всех регионах AWS, где предлагается PCS. С помощью команды control reboot с параметрами можно запланировать немедленную или отложенную перезагрузку, в то время как при перезагрузке другими способами будет по-прежнему инициироваться замена инстанса. Подробности см. в разделе Перезагрузка вычислительных узлов с помощью Slurm в AWS PCS.

PCS – это управляемый сервис, который упрощает выполнение и масштабирование рабочих нагрузок высокопроизводительных вычислений в AWS с помощью Slurm. Подробности о PCS см. в документации сервиса.