Amazon SageMaker HyperPod теперь проверяет квоты на обслуживание перед созданием кластеров в консоли
Консоль Amazon SageMaker HyperPod теперь проверяет квоты на обслуживание для аккаунта AWS, прежде чем запускать создание кластера, чтобы владелец аккаунта мог подтвердить наличие достаточной квоты перед выделением ресурсов. Функция SageMaker HyperPod помогает создавать отказоустойчивые кластеры для рабочих нагрузок искусственного интеллекта (ИИ) и машинного обучения (ML), а также для разработки самых современных больших языковых моделей (LLM), базовых моделей (FM) и моделей диффузии.
При создании крупномасштабных кластеров ИИ/ML необходимо убедиться, что у аккаунта есть достаточно квот на инстансы, хранилище и сетевые ресурсы, однако в прошлом для подтверждения квот необходимо было проверять множество сервисов AWS вручную, из-за чего попытка создания кластера часто завершалась неудачей и потерей времени, если вы не запросили об увеличении квот вовремя. Новая функция проверки квот в консоли SageMaker HyperPod автоматически проверяет соответствие квот на уровне аккаунта с желаемой конфигурацией кластера, в том числе ограничения по типам инстансов, размеры томов EBS и квоты, связанные с виртуальным частным облаком (VPC), при создании новых ресурсов. В результате проверки отображается понятная таблица с указанием ожидаемого использования, применимых значений квот и статуса соответствия по каждой квоте. Если квоты могут быть превышены, вы получите предупреждающее сообщение с прямыми ссылками на консоль квот на обслуживание, где можно запросить увеличение.
Эта функция доступна во всех регионах AWS, в которых поддерживается Amazon SageMaker HyperPod. Полный список выполняемых проверок по квотам на обслуживание см. в руководстве пользователя Amazon SageMaker HyperPod.