Вопросы и ответы по Amazon SageMaker

Общие вопросы

Да. Вы можете использовать R в инстансах блокнотов SageMaker, в которые входят предварительно установленное ядро R и библиотека reticulate. Библиотека reticulate реализует интерфейс R для Amazon SageMaker Python SDK, благодаря чему специалисты по машинному обучению могут создавать, обучать, настраивать и развертывать модели на базе языка R. 

Студия Amazon SageMaker предоставляет единый визуальный веб‑интерфейс, в котором можно проводить все этапы разработки ML. Студия SageMaker обеспечивает полный доступ, контроль и прозрачность каждого шага, необходимого для подготовки, создания, обучения и развертывания моделей. Теперь можно быстро загружать данные, создавать новые блокноты, обучать и настраивать модели, перемещаться между любыми этапами, настраивать эксперименты, сравнивать результаты и развертывать модели в одном месте, что благотворно сказывается на эффективности процесса. Все действия по ML‑разработке, включая создание блокнотов, управление экспериментами, автоматизированное создание моделей, отладку и профилирование, а также обнаружение отклонений в моделях, можно выполнять в едином визуальном интерфейсе студии Amazon SageMaker.

Управление машинным обучением

SageMaker предоставляет специально разработанные инструменты управления машинным обучением на протяжении всего жизненного цикла. С помощью Менеджера ролей Amazon SageMaker администраторы могут определить минимальные разрешения за считаные минуты. Сервис Карты моделей Amazon SageMaker облегчает сбор, извлечение и обмен важной информацией о модели от ее создания до развертывания, а Панель управления моделью Amazon SageMaker позволяет получать информацию о поведении производственной модели в одном месте. Подробнее
см. в разделе Управление машинным обучением с Amazon SageMaker.

Базовые модели

Безопасность – главный приоритет AWS, и сервис SageMaker JumpStart разработан для обеспечения защиты. Поэтому SageMaker предоставляет клиентам право собственности и контроль над их контентом с помощью простых и эффективных инструментов. Эти инструменты позволяют определить, где будет храниться контент, обеспечить его безопасность при передаче и хранении, а также управлять доступом пользователей к сервисам и ресурсам AWS.

  1. Мы не передаем информацию об обучении клиентов и выводах продавцам моделей на Торговой площадке AWS. Аналогичным образом, артефакты модели продавца (например, вес моделей) не передаются покупателю.
  2. SageMaker JumpStart не использует модели клиентов, данные обучения или алгоритмы для улучшения своего сервиса и не передает третьим сторонам данные обучения клиентов и выводы.
  3. В SageMaker JumpStart артефакты моделей машинного обучения шифруются при передаче и хранении.
  4. Согласно Модели общей ответственности AWS, AWS несет ответственность за защиту глобальной инфраструктуры, на которой работают все сервисы AWS. Вы несете ответственность за контроль над контентом, размещенным в этой инфраструктуре.

Используя модель из Торговой площадки AWS или SageMaker JumpStart, пользователи берут на себя ответственность за качество вывода модели и признают возможности и ограничения, указанные в описании отдельной модели.

Amazon SageMaker Clarify теперь поддерживает оценку базовых моделей. Вы можете оценить, сравнить и выбрать лучшие базовые модели для вашего конкретного сценария использования. Просто выберите модель, которую вы хотите оценить для выполнения той или иной задачи, например ответа на вопросы или реферирования контента. Затем выберите критерии оценки (например, точность, объективность и надежность) и выгрузите свой собственный набор данных подсказок либо выберите один из встроенных общедоступных наборов данных. Для анализа ответов при работе с субъективными критериями или специфическим контентом, требующим тщательного анализа со стороны человека, можно привлечь своих сотрудников или управляемый персонал компании AWS. После завершения процесса настройки SageMaker Clarify проводит оценку и создает отчет, чтобы вы могли легко понять, как модель работает в контексте ключевых критериев. Оценить базовые модели в SageMaker JumpStart можно с помощью мастера оценки или любых базовых моделей вне хостинга на AWS, используя библиотеку с открытым исходным кодом.

Рабочие процессы машинного обучения

Конвейеры SageMaker предоставляет центральный репозиторий обученных моделей, который называется реестром моделей. Вы можете подбирать модели и изучать реестр моделей через визуальный интерфейс SageMaker Studio или программным образом через Python SDK, что дает вам свободу в выборе требуемой модели для развертывания в производственной среде.

Подготовка данных

SageMaker Data Wrangler поддерживает табличные данные, данные временных рядов и графические данные, предоставляя более 300 предварительно настроенный преобразований данных для подготовки этих различных форм данных. Для клиентов, которым требуется подготовить текстовые данные в Data Wrangler для сценариев использования NLP, Data Wrangler поддерживает библиотеку NLTK, поэтому клиенты могут готовить текстовые данные, создавая в Data Wrangler настраиваемые сопоставления.

Обучение моделей

SageMaker HyperPod специально разработан для ускорения обучения базовых моделей. Он обеспечивает более отказоустойчивую инфраструктуру, оптимизированную для масштабного распределенного обучения. Это позволяет быстрее обучаться на тысячах ускорителей. Сервис автоматически обнаруживает, диагностирует и устраняет неисправности, поэтому можно непрерывно обучать базовые модели в течение нескольких месяцев. В SageMaker HyperPod предварительно настроены распределенные библиотеки обучения SageMaker, которые помогают эффективно повысить производительность за счет разделения обучающих данных модели на небольшие блоки, чтобы их можно было одновременно обрабатывать на разных акселераторах.
Если необходима более продолжительная и масштабная учебная рабочая нагрузка, требующая большого количества вычислительных инстансов, таких как графические процессоры или ускорители AWS, можно использовать SageMaker HyperPod для повышения отказоустойчивости и сокращения времени обучения.

Развертывание моделей

Amazon SageMaker — полностью управляемый сервис для настройки инстансов, совместимостей с версиями ПО, а также исправлений версий и управления ими. Он также предоставляет встроенные метрики и журналы для адресов, которые можно использовать для мониторинга и получения оповещений. Благодаря инструментам и управляемым рабочим процессам SageMaker упрощается весь процесс упаковки и развертывания моделей машинного обучения. Это позволяет с легкостью оптимизировать адреса для достижения желаемой производительности и сокращения затрат. Вы можете без лишних усилий развернуть модели машинного обучения, включая базовые модели, в SageMaker Studio или используя новый PySDK.
SageMaker поддерживает следующие варианты адресов: Адреса для одной модели — одна модель в контейнере, размещенная на выделенных инстансах, или бессерверная модель, ориентированная на низкую задержку и высокую пропускную способность. Адреса для нескольких моделей — размещение нескольких моделей, использующих общую инфраструктуру для экономии затрат и максимально эффективного использования ресурсов. Вы можете контролировать объем вычислительных ресурсов и памяти, доступных каждой модели, которые необходимы ей для эффективной работы. Последовательные конвейеры логического вывода — несколько контейнеров, совместно использующих выделенные инстансы и выполняющихся последовательно. Конвейер логических выводов можно использовать для объединения задач предварительной обработки, прогнозирования и последующего анализа данных.
Политики масштабирования можно использовать для автоматического масштабирования базовых вычислительных ресурсов в соответствии с колебаниями запросов на выводы. Вы можете управлять политиками масштабирования для каждой модели машинного обучения отдельно, что помогает упростить обработку изменений в использовании модели, а также оптимизировать затраты на инфраструктуру.

Список поддерживаемых регионов приведен в списке региональных сервисов AWS.

Тарифы Amazon SageMaker Savings Plans

Экономичные планы SageMaker предлагают гибкую модель ценообразования на основе использования для SageMaker, применяемую при условии, что клиент обязуется использовать постоянный объем вычислительных ресурсов (измеряемый в USD/час) на протяжении одного года или трех лет. Экономичные планы SageMaker – это самый гибкий вариант, помогающий экономить до 64 %. Эти тарифы автоматически применяются к соответствующим инстансам SageMaker ML, включая блокноты Студии SageMaker, блокноты SageMaker по требованию, Обработку SageMaker, SageMaker Data Wrangler, SageMaker Training, SageMaker Real-Time Inference и SageMaker Batch Transform, независимо от семейства инстансов, размера и региона. Например, для обработки рабочих нагрузок, связанных с получением логических выводов, вместо инстанса ml.c5.xlarge, работающего в регионе Восток США (Огайо), можно в любое время перейти к использованию инстанса ml.Inf1 в регионе Запад США (Орегон) и автоматически продолжать пользоваться тарифами Экономичных планов.

Если вы с определенной частотой (измеряемой в USD в час) используете инстансы SageMaker и несколько компонентов SageMaker или ожидаете, что ваша конфигурация (например, семейство инстансов, регион) будет со временем меняться, тарифы Экономичных планов SageMaker позволят вам получить максимальную экономию при одновременном обеспечении гибкости изменения конфигурации базовых технологий с учетом потребностей приложений и внедрения инноваций. Тарифы Экономичных планов применяется автоматически ко всем подходящим инстансам машинного обучения без какого-либо ручного вмешательства.

Экономичные планы SageMaker можно подключить в Обозревателе затрат AWS на Консоли управления или с помощью API либо командной строки. Пользуясь рекомендациями в AWS Cost Explorer, вы без труда выберете оптимальные обязательства по Savings Plans, чтобы добиться максимальной экономии средств. Рекомендуемые почасовые обязательства основаны на вашей истории использования ресурсов по требованию и личном выборе типа плана, срока действия и способа оплаты. После регистрации плана оплаты по схеме Savings Plans плата за использование вычислительных ресурсов автоматически станет начисляться в соответствии с льготными ценами этого плана, а превышение выбранного объема будет оплачиваться по тарифам схемы по требованию.

Разница между Экономичными планами для SageMaker и для Amazon EC2 заключается в перечне поддерживаемых ими сервисов. Экономичные планы SageMaker применяются только к использованию инстансов машинного обучения SageMaker.

Тарифы Savings Plans можно приобрести в любом аккаунте группы AWS Organization и консолидированной оплаты. По умолчанию экономия, предоставляемая тарифами Savings Plans, распространяется на все аккаунты в рамках группы AWS Organization и консолидированной оплаты. Однако вы также можете ограничить действие экономичных планов только аккаунтом, в котором они были приобретены.