Amazon SageMaker HyperPod теперь поддерживает конфигурацию жизненного цикла узлов на основе AMI для кластеров Slurm

Проведено: 7 мая 2026 г.

Amazon SageMaker HyperPod теперь поддерживает конфигурацию на основе AMI, которая предоставляет узлы кластера Slurm с программным обеспечением и настройками, необходимыми для выполнения рабочих нагрузок обучения моделей ИИ и машинного обучения в производственной среде. Это избавляет от необходимости загружать, настраивать или передавать скрипты настройки жизненного цикла в Amazon S3. Благодаря меньшему количеству операций по подготовке кластера и отсутствию скриптов настройки жизненного цикла, выполняемых во время выделения узлов, время создания кластера значительно сокращается, поэтому вы можете быстрее приступить к выполнению заданий.

Конфигурация на основе AMI включает необходимое программное обеспечение, такое как Docker, Enroot и Pyxis, а также такие настройки, как учет Slurm, генерация ключей SSH, ротация журналов Slurm и настройка домашнего каталога пользователя. Чтобы включить конфигурацию на основе AMI, исключите блок LifeCycleConfig из конфигурации группы инстансов при создании кластеров с помощью API CreateCluster либо при использовании консоли SageMaker AI выберите «Нет» в разделе скриптов жизненного цикла на экране пользовательской настройки. Для дополнительной настройки поверх базовой конфигурации на основе AMI можно предоставить скрипт расширения, позволяющий сосредоточиться только на добавляемых возможностях и программном обеспечении, например на пользовательских настройках, наблюдаемости или интеграции с LDAP.

Скрипты расширения можно настроить при создании кластеров как с помощью API, так и с помощью консоли SageMaker AI. Используя API CreateCluster, укажите новый параметр OnInitComplete и SourceS3Uri в блоке LifeCycleConfig. Через консоль введите URI S3 для скрипта расширения в поле «Файл скрипта расширения в S3» на экране пользовательской настройки. В сложных примерах использования, требующих полного контроля над выделением ресурсов, пользовательские скрипты настройки жизненного цикла по-прежнему полностью поддерживаются как через API, так и через консоль SageMaker AI.

Эта функция доступна во всех регионах AWS, где предоставляется SageMaker HyperPod. Чтобы приступить к созданию кластеров Slurm HyperPod с конфигурацией жизненного цикла узлов на основе AMI, см. раздел Начало работы с SageMaker HyperPod с помощью AWS CLI или Начало работы с SageMaker HyperPod с помощью консоли SageMaker AI в руководстве для разработчиков SageMaker AI.