Управление задачами теперь является общедоступным для Amazon SageMaker HyperPod
Amazon SageMaker HyperPod теперь обеспечивает централизованное управление всеми задачами по разработке на основе генеративного искусственного интеллекта, такими как обучение и логический вывод. Вы полностью контролируете распределение вычислительных ресурсов, обеспечиваете приоритетность наиболее важных задач и максимально эффективно используете вычислительные ресурсы, сокращая затраты на разработку моделей на 40 %.
Благодаря управлению задачами HyperPod администраторы могут легко определять приоритеты для разных задач и устанавливать ограничения по количеству вычислительных ресурсов, которые может использовать каждая команда. В любой момент администраторы также могут отслеживать и проверять выполняемые задачи или задачи, ожидающие выделения вычислительных ресурсов, с помощью визуальной панели управления. Когда специалисты по обработке данных создают свои задачи, HyperPod автоматически выполняет их, соблюдая установленные ограничения и приоритеты для вычислительных ресурсов. Например, если обучение высокоприоритетной модели необходимо завершить как можно скорее, но все вычислительные ресурсы уже используются, HyperPod высвобождает для поддержки обучения те ресурсы, которые были выделены для менее приоритетных задач. HyperPod приостанавливает низкоприоритетную задачу, сохраняет контрольную точку и перераспределяет высвободившиеся вычислительные ресурсы. Задание с более низким приоритетом, ресурсы которого были высвобождены для других целей, будет возобновлено с последней сохраненной контрольной точки, когда ресурсы снова станут доступными. А если команда не задействует все ресурсы, выделенные администратором, HyperPod будет использовать эти свободные ресурсы для ускорения выполнения задач другой командой. Кроме того, HyperPod теперь интегрирован со Студией Amazon SageMaker, что позволяет управлять задачами и другими возможностями HyperPod в среде Studio. Теперь специалисты по обработке данных могут беспрепятственно взаимодействовать с кластерами HyperPod прямо из Studio, что позволяет им разрабатывать, отправлять и отслеживать задания машинного обучения (ML) в мощных кластерах на базе ускорителей.
Управление задачами для HyperPod доступно во всех регионах AWS, где доступна функция HyperPod: Восток США (Северная Вирджиния), Запад США (Северная Калифорния, Орегон), Азиатско-Тихоокеанский регион (Мумбаи, Сингапур, Сидней, Токио), Европа (Франкфурт, Ирландия, Лондон, Стокгольм) и Южная Америка (Сан-Паулу).
Дополнительные сведения см. на веб-странице SageMaker HyperPod, в блоге AWS News и в документации по SageMaker AI.