Amazon SageMaker

Создание, обучение и развертывание моделей машинного обучения в любом масштабе

Amazon SageMaker – это полностью управляемый сервис, который позволяет специалистам по работе с данными и разработчикам быстро и просто создавать, обучать и развертывать модели машинного обучения в любом масштабе. Amazon SageMaker устраняет все типичные барьеры, которые останавливают разработчиков, стремящихся использовать машинное обучение.

Большинство разработчиков считают машинное обучение сложным делом. Причина в том, что процессы создания и обучения моделей, а также последующего их развертывания для работы достаточно сложны и выполняются слишком медленно. Сначала требуется собрать и подготовить данные для обучения, чтобы выделить в них ключевые элементы. Затем необходимо выбрать подходящий алгоритм и инфраструктуру. После определения основного подхода необходимо обучить модель давать прогнозы, что требует большого количества вычислений. Затем требуется настроить полученную модель, чтобы она выдавала наилучшие возможные прогнозы, что требует кропотливого ручного труда. После всех этих шагов полностью обученную модель необходимо интегрировать с клиентским приложением и выполнить его развертывание в масштабируемой инфраструктуре. Все эти манипуляции требуют большого количества специализированных навыков, доступа к большому объему вычислительных и дисковых ресурсов, а также немалого количества времени на эксперименты и оптимизацию каждой части процесса. Неудивительно, что в итоге большинство разработчиков считает использование этой технологии чем-то запредельным.

Amazon SageMaker устраняет сложности, которые сдерживают разработчиков на каждом шаге этого процесса. Amazon SageMaker содержит в себе модули, которые можно использовать в связке или по отдельности, чтобы создавать, обучать и развертывать модели машинного обучения.

Представляем Amazon SageMaker

Как работает сервис

Создание

Amazon SageMaker позволяет без труда создавать модели машинного обучения и готовить их к обучению. Сервис предоставляет все необходимые инструменты, которые понадобятся для быстрого подключения к обучающим данным, а также выбора и оптимизации наилучшего алгоритма и инфраструктуры для приложения пользователя. Amazon SageMaker предоставляет размещенные блокноты Jupyter, которые облегчают изучение и визуализацию обучающих данных, хранимых в Amazon S3. Пользователи могут подключаться к данным в S3 напрямую или использовать AWS Glue для переноса данных из Amazon RDS, Amazon DynamoDB и Amazon Redshift в S3 для последующего анализа в блокноте.

Чтобы помочь с выбором подходящего алгоритма, Amazon SageMaker предлагает 10 наиболее популярных интегрированных алгоритмов машинного обучения. Они оптимизированы и обеспечивают производительность, которая в 10 раз превышает ту, что можно получить на любой другой существующей платформе. Помимо этого, Amazon SageMaker содержит предварительные настройки, которые необходимы для запуска двух наиболее популярных платформ с открытым исходным кодом – TensorFlow и Apache MXNet. Сервис также обеспечивает возможность использования любой другой платформы.

Обучение

Начать обучение модели можно одним щелчком в консоли Amazon SageMaker. Amazon SageMaker берет на себя управление всей необходимой инфраструктурой и может легко масштабироваться для обучения моделей на уровне петабайтов. Чтобы сделать процесс обучения еще быстрее и проще, Amazon SageMaker может автоматически настраивать модель для достижения максимально возможной точности прогнозов.

Развертывание

По завершении обучения и настройки модели, Amazon SageMaker позволяет без труда выполнить ее рабочее развертывание, чтобы начать генерировать прогнозы на новых наборах данных (этот процесс называется выводом). Amazon SageMaker развертывает обученную модель на автомасштабируемом кластере инстансов Amazon EC2, расположенных в нескольких зонах доступности, чтобы обеспечить как высокую производительность, так и высокую доступность модели. Помимо этого, Amazon SageMaker имеет встроенные возможности проведения А/В-тестирования модели, которые позволяют поэкспериментировать с различными версиями для достижения наилучших результатов.

Amazon SageMaker берет на себя самые сложные задачи машинного обучения, позволяя своим клиентам быстро и просто создавать, обучать и развертывать ML-модели.

Преимущества

Быстрый запуск моделей машинного обучения в работу

Amazon SageMaker значительно сокращает время, необходимое для обучения, настройки и развертывания моделей машинного обучения.Amazon SageMaker берет на себя задачи по автоматизации сложных методик обучения и настройки, а также управлению ими, ускоряя процесс запуска моделей в работу.

Работа с любым доступным алгоритмом или платформой

Amazon SageMaker поддерживает все существующие платформы и алгоритмы машинного обучения, что позволяет использовать в работе знакомые технологии. Платформы Apache MXNet и TensorFlow уже интегрированы в сервис. Помимо этого, Amazon SageMaker предоставляет широкий набор встроенных алгоритмов машинного обучения с высокой производительностью. Чтобы использовать для обучения альтернативную платформу или алгоритм, достаточно загрузить их в виде контейнера Docker.

Обучение и развертывание в один щелчок

Amazon SageMaker позволяет приступить к обучению модели за один щелчок мышью в консоли или простым вызовом API. По завершении обучения модели развертывание можно выполнить так же – одним щелчком в консоли Amazon SageMaker.

Простая интеграция с существующим рабочим процессом

Amazon SageMaker спроектирован в виде трех модулей, которые можно использовать вместе или по отдельности, в качестве компонентов любого существующего рабочего процесса машинного обучения.

Легкий доступ к обученным моделям

Amazon SageMaker позволяет без труда интегрировать модели машинного обучения в клиентские приложения, предоставляя адрес HTTPS-сервера, к которому можно обратиться из любого приложения.

Примеры использования

Рекламный таргетинг

Использование Amazon SageMaker в сочетании с другими сервисами AWS позволяет оптимизировать возврат средств, вложенных в рекламу. Amazon SageMaker позволяет без труда обучать и развертывать модели машинного обучения, которые могут более эффективно таргетировать онлайн-рекламу, что обеспечивает лучшее вовлечение клиентов и последующую конверсию. Модели для систем рекомендаций, прогноза переходов по ссылкам, сегментирования потребителей и продления сроков показа можно обучить в бессерверной распределенной среде Amazon SageMaker. Готовые модели могут быть легко размещены на автомасштабируемых узлах с низкой задержкой или переданы в другие системы размещения рекламы в режиме реального времени.

Прогноз кредитного дефолта

Amazon SageMaker облегчает прогнозирование вероятности кредитного дефолта – одной из типовых задач, которую пытаются решить средствами машинного обучения. Amazon SageMaker тесно интегрирован с такими существующими аналитическими инфраструктурами, как Amazon Redshift, Amazon EMR и AWS Glue, что позволяет передавать большие и разноплановые наборы данных в озеро данных в Amazon S3. Сервис быстро преобразует их, создает с их помощью модели машинного обучения и тут же размещает их для генерации онлайн-прогнозов.

Промышленный Интернет вещей и машинное обучение

Промышленный Интернет вещей и машинное обучение делают возможными прогнозы в режиме реального времени для предсказания отказов оборудования или оптимизации графика обслуживания, что позволяет добиться более высокого уровня эффективности.

Публикации в блоге

evangelist-randall-hunt

Amazon SageMaker – Accelerating Machine Learning
Рэндалл Хант, старший технический эксперт AWS
29 ноября 2017 г.

Подробнее о возможностях Amazon SageMaker

Перейти на страницу с описанием возможностей
Готовы начать работу?
Регистрация