Сервис параллельных вычислений AWS теперь поддерживает настройки slurmdbd и cgroups
Сервис параллельных вычислений AWS (AWS PCS) теперь поддерживает дополнительные настройки конфигурации Slurm для slurmdbd и cgroups, что позволяет более точно настраивать алгоритмы регистрации данных и изоляцию ресурсов непосредственно в консоли AWS PCS, через интерфейс командной строки или с помощью SDK. Так вы сможете внедрить у себя готовые к работе среды для высокопроизводительных вычислений (HPS) с улучшенными средствами управления конфиденциальностью, гибкими политиками хранения данных и более эффективным управлением ресурсами.
Используя настройки slurmdbd, вы можете указать, как Slurm будет регистрировать данные в вашем кластере. Помимо прочего, это затрагивает контроль конфиденциальности, политики хранения данных и возможности отслеживания рабочей нагрузки. С помощью cgroups можно предотвратить избыточную подписку на ресурсы за счет связывания ядер ЦПУ, настроить ограничение памяти для обеспечения стабильности узлов и задать границы выполнения рабочих нагрузок, контролируя доступ к устройствам.
PCS – это управляемый сервис, который может использовать решение Slurm, чтобы упростить выполнение и масштабирование рабочих нагрузок высокопроизводительных вычислений (HPC) в AWS. Вы сможете создавать полноценные эластичные среды, которые объединят в себе вычислительные ресурсы, системы хранения данных, сети и инструменты визуализации, а наш сервис будет выполнять автоматические обновления и осуществлять функции наблюдения для управления кластером.
Данная функция доступна во всех регионах AWS, где можно использовать PCS. Описанные выше настройки можно указать при создании нового кластера или изменении существующего. Подробнее см. в руководстве пользователя AWS PCS.