Общие вопросы

Вопрос: Что такое Amazon SageMaker?

Amazon SageMaker – это полностью управляемый сервис, который позволяет разработчикам и специалистам по работе с данными быстро и легко создавать, обучать и развертывать модели машинного обучения.

Вопрос: Для чего предназначен сервис Amazon SageMaker?

Amazon SageMaker позволяет разработчикам и специалистам по работе с данными создавать модели машинного обучения, которые используются в интеллектуальных прогнозирующих приложениях.

Вопрос: Как начать работу с Amazon SageMaker?

Чтобы начать работу с Amazon SageMaker, необходимо войти в консоль Amazon SageMaker, запустить инстанс блокнота с готовым примером, отредактировать его для подключения к своим источникам данных, на основе примера создать, обучить или проверить модели, а затем выполнить развертывание итоговой модели в рабочей среде, используя несколько вводов данных.

Вопрос. В каких регионах доступен Amazon SageMaker?

Список регионов AWS с поддержкой сервиса Amazon SageMaker см. в таблице регионов AWS для всей глобальной инфраструктуры AWS. См. также раздел «Регионы и адреса серверов» в общих справочных материалах по AWS.

Вопрос: Можно ли получить для своего аккаунта историю вызовов API Amazon SageMaker для анализа состояния безопасности и устранения неполадок в работе? 

Да. Для получения истории вызовов API Amazon SageMaker аккаунта включите сервис AWS CloudTrail в Консоли управления AWS. Следующие вызовы API в среде выполнения Amazon SageMaker Runtime *не* записываются и не доставляются: InvokeEndpoint.

Вопрос: Какова доступность сервиса Amazon SageMaker?

Amazon SageMaker разработан для обеспечения высокой доступности. Сервис работает без плановых простоев и перерывов на обслуживание. API Amazon SageMaker работают на базе надежных ЦОД Amazon с высокой степенью доступности, стек сервиса реплицируется в трех ЦОД в каждом регионе AWS, что обеспечивает отказоустойчивость в случае выхода из строя отдельного сервера или аварийного отключения зоны доступности.

Вопрос: Какие меры обеспечения безопасности использует сервис Amazon SageMaker?

Amazon SageMaker обеспечивает шифрование моделей машинного обучения и других системных артефактов как при хранении, так и при пересылке. Запросы к API и консоли сервиса Amazon SageMaker выполняются через безопасное SSL-соединение. Права доступа к ресурсам для обучения и развертывания от имени клиента предоставляются сервису Amazon SageMaker путем передачи ему соответствующих ролей AWS Identity and Access Management. Можно использовать зашифрованные корзины S3 для артефактов моделей и данных либо передать ключ KMS в блокноты Amazon SageMaker, задачи на обучение и адреса сервиса с целью шифрования подключенного тома хранилища для машинного обучения.

Вопрос: Как обеспечивается безопасность кода в Amazon SageMaker?

Amazon SageMaker хранит код в томах хранилища для машинного обучения, которые защищены группами безопасности и могут быть дополнительно зашифрованы при хранении.

Вопрос: Как начисляется плата за использование Amazon SageMaker?

Плата начисляется за вычислительные ресурсы, хранилище и ресурсы для обработки данных, которые используются для размещения блокнотов, обучения моделей, расчета прогнозов и ведения журнала выходных данных. Amazon SageMaker позволяет выбрать число и тип инстансов, которые будут использованы для размещения блокнотов, обучения и хостинга моделей. Вы платите только за то, что используете. Минимальные платежи и авансовые обязательства отсутствуют.

Вопрос: Могу ли я использовать свой блокнот, среду обучения или хостинга?

Amazon SageMaker полностью обеспечивает все этапы рабочего процесса, однако это не мешает использовать существующие инструменты вместе с Amazon SageMaker. В зависимости от конкретных практических потребностей можно легко импортировать результаты в Amazon SageMaker либо экспортировать их из сервиса на любом этапе рабочего процесса.

Размещенные блокноты Jupyter

Вопрос: Какие типы блокнотов поддерживаются?

В данный момент поддерживаются блокноты Jupyter.

Вопрос: Как сохраняются файлы блокнотов при остановке рабочего пространства?

Файлы блокнотов хранятся на подключенном томе хранилища для машинного обучения. При отключении инстанса блокнота выполняется отсоединение тома. Повторное подключение произойдет при очередном запуске инстанса. Элементы, хранящиеся в оперативной памяти, будут утеряны.

Вопрос: Как увеличить количество доступных ресурсов для своего блокнота?

После сохранения файлов и данных на подключенном томе хранилища для машинного обучения отредактируйте инстанс блокнота и выберите следующий по размеру профиль через консоль Amazon SageMaker. После перезапуска данного инстанса будет доступно больше ресурсов с сохранением набора файлов и установленных библиотек.

Вопрос: Как обучить модель из блокнота Amazon SageMaker?

После запуска примера блокнота настройте его согласно своей схеме и источникам данных. Запустите API AWS для создания задачи на обучение. Наблюдать за ходом выполнения задачи на обучение можно в консоли Amazon SageMaker или с помощью API AWS.

Обучение моделей

Вопрос. Что такое управляемое спотовое обучение?

Управляемое спотовое обучение с использованием Amazon SageMaker позволяет обучать модели машинного обучения с помощью спотовых инстансов Amazon EC2 и при этом снизить затраты на него до 90%.

Вопрос. Как использовать управляемое спотовое обучение?

Отправляя запросы на выполнение своих заданий по обучению, вы активируете управляемое спотовое обучение и указываете, в течение какого периода хотите ждать спотовые ресурсы. Затем Amazon SageMaker использует спотовые инстансы Amazon EC2 для выполнения задания и управляет спотовыми ресурсами. Вы полностью видите состояние задания по обучению как в процессе его выполнения, так и во время ожидания ресурсов.

Вопрос. В каких случаях стоит использовать управляемое спотовое обучение?

Управляемое спотовое обучение – идеальный вариант, когда у вас есть некоторая свобода в выполнении заданий по обучению, а также если вы хотите минимизировать затраты на такие задания. Благодаря управляемому спотовому обучению затраты на обучение моделей машинного обучения можно снизить до 90%.

Вопрос. Как работает управляемое спотовое обучение?

Для обучения в таком формате используются спотовые инстансы Amazon EC2, которые можно освободить, когда AWS понадобятся ресурсы. Таким образом, задания по управляемому спотовому обучению можно разбить на небольшие этапы и выполнять их по мере доступности ресурсов. В случае прерывания задания по обучению не придется начинать с самого начала, поскольку Amazon SageMaker может возобновить их выполнение, используя последнюю контрольную точку модели. Благодаря Amazon SageMaker встроенные платформы и алгоритмы машинного зрения позволяют создавать периодические контрольные точки, которые можно также использовать для пользовательских моделей.

Вопрос. Нужно ли периодически создавать контрольные точки в процессе управляемого спотового обучения?

Рекомендуем периодически создавать контрольные точки при выполнении долгосрочных заданий по обучению. Это позволит предотвратить перезапуск заданий по управляемому спотовому обучению в случае освобождения ресурса. Если активировано использование контрольных точек, Amazon SageMaker возобновит выполнение задания по управляемому спотовому обучению с последней контрольной точки. 

Вопрос. Как подсчитать снижение издержек в случае использования заданий по управляемому спотовому обучению?

После завершения задания по управляемому спотовому обучению вы можете ознакомиться с тем, сколько вы сэкономите, в консоли управления AWS, а также рассчитать снижение издержек в процентном соотношении между предыдущей длительностью выполнения задания по обучению и длительностью, указанной в счете.

Независимо от количества прерываний заданий по управляемому обучению вы оплачиваете только количество загруженных данных.

Вопрос. Какие инстансы можно использовать для управляемого спотового обучения?

Для управляемого спотового обучения можно использовать все инстансы, которые поддерживает Amazon SageMaker.

Вопрос. В каких регионах AWS поддерживается управляемое спотовое обучение?

Управляемое спотовое обучение поддерживается во всех регионах AWS, в которых на данный момент доступен Amazon SageMaker.

Вопрос. Существуют ли ограничения на размер пакета данных, который используется для обучения?

С Amazon SageMaker для обучения моделей можно использовать пакеты данных любого размера.

Вопрос: Какие источники данных можно легко добавить в Amazon SageMaker?

В момент создания задачи на обучение можно указать местоположение данных для обучения в Amazon S3.

Вопрос: Какие алгоритмы Amazon SageMaker использует для создания моделей?

Amazon SageMaker предоставляет следующие встроенные алгоритмы: вычисление линейной регрессии, логической регрессии, кластеризация методом k-средних, анализ основного компонента, факторизация машин, тематическое нейронное моделирование, латентное размещение Дирихле, построение деревьев методом градиентного роста, алгоритм sequence2sequence, прогнозирование временных рядов, word2vec и классификация изображений. Amazon SageMaker также дает возможность использовать оптимизированные контейнеры Apache MXNet, TensorFlow, Chainer и PyTorch. Кроме того, Amazon SageMaker поддерживает собственные алгоритмы обучения, предоставленные в образе Docker в соответствии с требованиями спецификации.

Вопрос: Что такое автоматическая настройка модели?

Большинство алгоритмов машинного обучения раскрывают множество параметров, которые контролируют работу базового алгоритма. Эти параметры носят название гиперпараметров, и их значения влияют на качество итоговых обученных моделей. Автоматическая настройка модели – это процесс поиска такого набора гиперпараметров алгоритма, который позволит получить оптимальную модель.

Вопрос: Какие модели поддаются автоматической настройке?

Автоматическую настройку модели можно запускать в Amazon SageMaker поверх любого алгоритма до тех пор, пока это возможно с научной точки зрения. В число возможных вариантов входят встроенные алгоритмы SageMaker, глубокие нейронные сети, а также любые произвольные алгоритмы, которые были импортированы в Amazon SageMaker в виде образов Docker.

Вопрос: Можно ли использовать автоматическую настройку модели за пределами Amazon SageMaker?

В настоящий момент нет. Наибольшего эффекта от автоматической настройки модели можно добиться только в рамках Amazon SageMaker.

Вопрос: Какой базовый алгоритм лежит в основе механизма настройки?

В данный момент в качестве алгоритма для настройки гиперпараметров используется специальным образом настроенный алгоритм байесовской оптимизации. Его задача – оптимизировать в процессе настройки заданные пользователем объективные метрики. Если подробнее, он проверяет объективные метрики завершенных задач обучения и использует полученные результаты для изменения комбинации гиперпараметров для следующей обучающей задачи.

Вопрос. Вы можете порекомендовать конкретные гиперпараметры, которые следует настроить?

Нет. Влияние различных гиперпараметров на поведение модели зависит от множества факторов. Из-за этого нельзя достоверно заявлять, что один из них важнее других и настраивать следует именно его. В случае встроенных в Amazon SageMaker алгоритмов мы указываем, является ли тот или иной гиперпараметр настраиваемым.

Вопрос: Сколько времени занимает настройка гиперпараметра?

Продолжительность настройки гиперпараметра зависит от множества факторов, включая объем используемых данных, базовый алгоритм и значения гиперпараметров. Помимо этого пользователи имеют возможность выбрать количество одновременно выполняемых обучающих задач и их общее количество. Все эти факторы влияют на продолжительность настройки гиперпараметра. 

Вопрос: Можно ли оптимизировать несколько целевых метрик по аналогии с моделями, чтобы они были одновременно и быстрыми, и точными?

В настоящий момент нет. На данный момент пользователю необходимо указывать единственную целевую метрику для оптимизации или изменить код алгоритма таким образом, чтобы он порождал новую метрику, которая представляет собой среднее взвешенное между двумя и более полезными метриками. Процесс настройки необходимо будет оптимизировать в сторону этой целевой метрики.

Вопрос: Сколько стоит автоматическая настройка модели?

За саму настройку гиперпараметров плата не взимается. Плата начисляется за выполнение обучающих задач, которые будут запущены процессом настройки, согласно тарифам на обучение моделей.

Вопрос. Что такое стимулированное обучение?

Стимулированное обучение — это техника машинного обучения, позволяющая агенту учиться в интерактивной среде методом проб и ошибок, используя обратную связь по своим действиям и взаимодействиям.

Вопрос. Можно ли обучать модели стимулированного обучения в Amazon SageMaker?

Да. В Amazon SageMaker можно обучать не только контролируемые и неконтролируемые модели, но и модели стимулированного обучения.

Вопрос. Чем стимулированное обучение отличается от контролируемого обучения?

Несмотря на то что и в контролируемом, и в стимулированном обучении используется сопоставление входных и выходных данных, в отличие от контролируемого обучения, где агенту в качестве обратной связи предоставляется набор шагов для выполнения задачи, в стимулированном обучении используется обратная связь с задержкой, когда поощрительные сигналы оптимизируются для достижения долгосрочной цели посредством выполнения последовательности действий.

Вопрос. В каких случаях следует использовать стимулированное обучение?

В то время как целью техник, используемых в контролируемом обучении, является поиск правильного ответа на основе существующих в учебных данных шаблонов, техники неконтролируемого обучения преследуют цель найти сходства и различия между точками данных. Техники стимулированного обучения, в отличие от этого, призваны научить достигать нужного результата даже в случае, когда не совсем понятно, как его достичь. Следовательно, стимулированное обучение больше подходит для обеспечения работы интеллектуальных приложений, когда агент может принимать автономные решения: робототехника, автоматизированные транспортные средства, системы отопления, вентиляции и кондиционирования воздуха, промышленные системы контроля и управления и многое другое.

Вопрос. Какой тип сред можно использовать для обучения моделей стимулированного обучения?

Система стимулированного обучения Amazon SageMaker поддерживает несколько разных сред для обучения соответствующих моделей. Можно использовать такие сервисы AWS, как AWS RoboMaker, среды с открытым исходным кодом или пользовательские среды, разработанные с помощью интерфейсов Open AI Gym, а также коммерческие среды моделирования, такие как MATLAB и SimuLink.

Вопрос. Нужно ли создавать собственные алгоритмы для агентов стимулированного обучения, чтобы обучать соответствующие модели?

Нет, система стимулированного обучения Amazon SageMaker включает наборы инструментов для стимулированного обучения, такие как Coach и Ray RLLib, предлагающие реализации алгоритмов для агентов стимулированного обучения (DQN, PPO, A3C и многие другие).

Вопрос. Можно ли использовать собственные библиотеки и реализации алгоритмов стимулированного обучения в системе стимулированного обучения Amazon SageMaker?

Да, вы можете использовать собственные библиотеки и реализации алгоритмов стимулированного обучения, помещенные в контейнеры Docker, в системе стимулированного обучения Amazon SageMaker.

Вопрос. Можно ли выполнять распределенные развертывания с помощью системы стимулированного обучения Amazon SageMaker?

Да. Можно даже выбрать гетерогенный кластер, где обучение может проходить в инстансе графического процессора, а моделирование может выполняться в нескольких инстансах ЦП.

Вопрос. Что такое Amazon SageMaker Neo?

Amazon SageMaker Neo – это новый компонент, благодаря которому можно обучить модели машинного обучения однократно, а затем запускать их где угодно в облаке и на периферии. SageMaker Neo автоматически оптимизирует модели, созданные на базе популярных платформ глубинного обучения, которые можно использовать для развертывания на нескольких аппаратных платформах. Оптимизированные модели выполняются до двух раз быстрее и потребляют менее десятой части ресурсов по сравнению со стандартными моделями машинного обучения.


Вопрос. Как начать работу с Amazon SageMaker Neo?

Чтобы начать работу с Amazon SageMaker Neo, необходимо войти на консоль Amazon SageMaker, выбрать обученную модель, составить модели, следуя примеру, а затем развернуть полученную модель на целевой аппаратной платформе.

 

Вопрос. Каковы основные компоненты Amazon SageMaker Neo?

Amazon SageMaker Neo состоит из двух основных компонентов: компилятора и среды выполнения. Во-первых, компилятор Neo считывает модели, экспортированные разными платформами. Затем он преобразует функции и операции платформы в промежуточное представление, которое не зависит от платформы. Затем компилятор выполняет серию оптимизаций, создает двоичный код для оптимизированных операций и записывает их в общую библиотеку объектов. Компилятор также сохраняет определение и параметры модели в отдельные файлы. Во время выполнения среда выполнения Neo загружает артефакты, созданные компилятором: определение модели, параметры, а также общую библиотеку объектов для выполнения модели.


 

Вопрос. Требуется ли использовать SageMaker для обучения модели, чтобы использовать Neo для преобразования модели?

Нет. Обучать модели можно где угодно и использовать Neo, чтобы оптимизировать их для инстансов машинного обучения SageMaker или устройств с поддержкой Greengrass. 

 

 

Вопрос. Какие модели поддерживает SageMaker Neo?

В настоящее время SageMaker Neo поддерживает наиболее популярные модели машинного обучения, которые лежат в основе приложений компьютерного зрения и наиболее популярные модели дерева принятия решений, которые сегодня используются в Amazon SageMaker. Neo оптимизирует производительность моделей AlexNet, ResNet, VGG, Inception, MobileNet, SqueezeNet и DenseNet, обученных в MXNet и TensorFlow, а также обученные в XGBoost модели классификации и модели на основе алгоритма Random Cut Forest.


 

 

Вопрос. Какие платформы поддерживает SageMaker Neo?

В настоящее время Neo поддерживает инстансы SageMaker ML.C5, ML.C4, ML.M5, ML.M4, ML.P3 и ML.P2, а также устройства AWS DeepLens, Raspberry Pi, Jetson TX1 и TX2, а также ЦП Intel® Atom и Intel® Xeon на базе устройств Greengrass, ЦП ARM Cortex-A и графические процессоры Nvidia Maxwell и Pascal.

 

 

 

Вопрос. Нужно ли использовать определенную версию платформы, которая поддерживается на целевом оборудовании?

Нет. Разработчики могут выполнять модели, используя контейнер SageMaker Neo, вне зависимости от платформы.

 

 

 

Вопрос. Сколько стоит использование SageMaker Neo?

Вы платите за использование инстанса машинного обучения SageMaker, который запускает процедуру получения логических выводов с использованием SageMaker Neo.

 

 

 

Вопрос. В каких регионах AWS доступен SageMaker Neo?

В настоящее время сервис SageMaker Neo доступен в следующих регионах AWS: Северная Вирджиния, Орегон, Огайо и Ирландия. 

 

 

 

Вопрос. Что такое отслеживание моделей Amazon SageMaker?

Отслеживание моделей Amazon SageMaker позволяет быстро находить и оценивать самые актуальные прогоны обучения моделей из (потенциально) сотен и тысяч заданий обучения моделей в Amazon SageMaker. SageMaker Search доступен на Консоли управления AWS и через API-интерфейсы AWS SDK для Amazon SageMaker.

 

 

 

Вопрос. Как организовать и отслеживать прогоны обучения моделей?

С помощью отслеживания моделей можно искать и организовывать прогоны обучения ваших моделей, задавая любые свойства для задания обучения, такие как время создания задания обучения, URI набора данных для обучения, значения гиперпараметров или любые метаданные задания обучения. Теги, помечающие задания обучения моделей, позволяют гибко упорядочить и сгруппировать соответствующие задания обучения. Поиск по тегам позволяет быстро находить прогоны обучения моделей, связанные с конкретным бизнес-проектом, исследовательской лабораторией или командой специалистов по аналитике данных, помогая вам эффективно классифицировать прогоны обучения моделей и вносить их в каталог.

 

 

 

Вопрос. Как создать рейтинговую таблицу тренировочного прогона с помощью отслеживания моделей?

Задания обучения моделей отображаются на Консоли управления AWS в формате таблицы, подобно рейтингу. Все гиперпараметры и метрики обучения моделей представлены в сортируемых столбцах. Вы можете щелкнуть заголовок столбца, чтобы отсортировать рейтинг по выбранной метрике эффективности. Вы также можете быстро сравнивать и сортировать прогоны обучения моделей по метрикам эффективности, таким как потери при обучении и точность проверок. В результате можно использовать рейтинги для выбора оптимальных моделей, которые будут развернуты в производственной среде.

 

 

 

Вопрос. Как отследить происхождение модели или адреса сервера?

Перейдите в раздел «Адреса серверов» на консоли управления AWS для сервиса Amazon SageMaker и выберите из списка всех развернутых адресов серверов нужный. Затем прокрутите вниз до «Параметры конфигурации адреса» на странице выбранного адреса, чтобы просмотреть все версии модели, развернутые на этом адресе. Рядом с каждой версией модели отображается прямая ссылка на задание обучения модели, с помощью которого изначально была создана эта модель.


 

 

 

Развертывание моделей

Вопрос. Можно ли получить доступ к инфраструктуре, на которой работает Amazon SageMaker?

Нет. Amazon SageMaker управляет вычислительной инфраструктурой от имени клиента, что позволяет выполнять проверку работоспособности, применять обновления безопасности и выполнять другие рутинные работы по обслуживанию. Кроме того, сервис дает возможность развертывать артефакты моделей обучения с собственным кодом логического вывода в своей среде хостинга.

Вопрос: Как увеличить размер и производительность модели Amazon SageMaker, запущенной в рабочей среде?

Хостинг Amazon SageMaker автоматически масштабирует производительность на основании потребностей приложения, используя Application Auto Scaling. Сервис также позволяет вручную изменить количество и тип инстансов при редактировании конфигурации адреса, не останавливая работу системы.

Вопрос: Как выполнять мониторинг Amazon SageMaker в рабочей среде?

Amazon SageMaker отправляет метрики производительности в Amazon CloudWatch. Это позволяет отслеживать метрики, устанавливать предупреждения и автоматически реагировать на изменения в рабочем трафике. Кроме того, Amazon SageMaker записывает журналы в Amazon CloudWatch Logs, что дает возможность отслеживать и устранять проблемы рабочего развертывания.

Вопрос: Какие модели можно разместить с помощью Amazon SageMaker?

Amazon SageMaker может разместить любую модель, которая соответствует задокументированной спецификации для образов Docker, используемых для логического вывода. Сюда входят модели, созданные из артефактов моделей Amazon SageMaker и кода логического вывода.

Вопрос: Какое количество одновременных запросов API в режиме реального времени поддерживает Amazon SageMaker?

Amazon SageMaker рассчитан на масштабирование для обеспечения большого количества транзакций в секунду. Точное количество определяется конкретной моделью, а также количеством и типом инстансов, на которых выполнено развертывание.


Вопрос: Что такое пакетное преобразование?

Пакетное преобразование позволяет выполнять прогнозирование на основе крупных или малых пакетов данных. Набор данных не требуется разбивать на несколько фрагментов, управлять адресами получения в реальном времени также не нужно. С помощью простого API можно запрашивать прогнозы для большого количества записей данных, а затем быстро и просто преобразовывать данные.

 

Подробнее о ценах на Amazon SageMaker

Перейти на страницу цен
Готовы начать?
Регистрация
Есть вопросы?
Свяжитесь с нами