Amazon SageMaker Autopilot

Автоматическое создание моделей машинного обучения с полной прозрачностью процесса

Amazon SageMaker Autopilot автоматически создает, обучает и настраивает наилучшие модели машинного обучения, используя характеристики ваших данных и позволяя сохранять полный контроль и прозрачность этого процесса.

Для создания моделей машинного обучения нужно вручную подготовить признаки, проверить множество алгоритмов и оптимизировать сотни параметров модели для выбора оптимальной модели. Такой подход требует большого опыта работы с машинным обучением. Если у вас его нет, вы можете использовать автоматический способ (AutoML), но обычно он плохо позволяет понять, как используются признаки и как они влияют на прогнозы модели. Это означает, что вы будете меньше доверять результатам, которые невозможно воспроизвести и проанализировать.

Amazon SageMaker Autopilot избавит вас от трудоемких процедур создания моделей машинного обучения, позволяя автоматически создавать, обучать и настраивать оптимальные модели в зависимости от используемых данных. В SageMaker Autopilot достаточно предоставить набор данных в табличной форме и выбрать для прогнозирования целевую колонку, которая может содержать числовое значение (например, стоимость дома, и такая задача называется регрессией) или обозначение категории (например, маркировка спама в электронной почте, и такая задача называется классификацией). SageMaker Autopilot автоматически изучит доступные решения и выберет из них оптимальную модель. Далее в том же интерфейсе можно всего одним щелчком развернуть полученную модель в рабочей среде или последовательно изучить разные решения в Amazon SageMaker Studio, чтобы дополнительно повысить качество модели.

Принцип работы сервиса

Принцип работы сервиса — Autopilot

Преимущества

Быстрое получение моделей высокого качества

Amazon SageMaker Autopilot автоматически определяет лучшую модель машинного обучения для ваших данных, оптимизируя сотни моделей и параметров. После нескольких начальных итераций SageMaker Autopilot создает рейтинг лучших по производительности моделей в среде SageMaker Studio. Здесь можно увидеть, какие компоненты данных использует каждая модель, и развернуть наиболее подходящую для конкретной ситуации.

Развертывание одним щелчком

Поскольку Amazon SageMaker Autopilot автоматически создает, обучает и настраивает лучшую модель машинного обучения на основе ваших данных, вы можете развернуть свою модель в рабочей среде одним щелчком мыши. Чтобы получить прогнозы, нужно лишь обратиться на адрес развернутой модели с помощью вызовов REST API. Также вы можете отслеживать развернутую модель при помощи Amazon SageMaker Model Monitor.

Сохранение прозрачности и контроля

Создание моделей — полностью прозрачный процесс. Вы можете автоматически создать блокнот Amazon SageMaker Studio Notebook для любой модели, созданной в Amazon SageMaker Autopilot. В нем будут доступны подробные сведения о создании моделей, кроме того здесь можно дополнительно настроить модель и в дальнейшем воссоздать ее из блокнота в любой момент.

Многоуровневая безопасность

Amazon SageMaker обеспечивает широкий набор возможностей для безопасности, как, например, шифрование, подключение к частной сети, авторизацию, аутентификацию, мониторинг и доступность для аудита, что позволит вашей организации соблюдать самые строгие требования к безопасности для рабочих нагрузок машинного обучения.

Основные возможности

Автоматическая предварительная обработка данных и разработка функций

Вы можете использовать Amazon SageMaker Autopilot даже при отсутствии части данных. SageMaker Autopilot автоматически заполняет недостающие значения, выполняет статистический анализ столбцов в наборе данных и автоматически извлекает информацию из нечисловых столбцов (например, дату и время из меток времени).

Автоматический выбор модели машинного обучения

Amazon SageMaker Autopilot автоматически определяет тип прогнозов, наиболее подходящий для ваших данных — двоичная классификация, мультиклассовая классификация или регрессия. Затем SageMaker Autopilot изучает высокоэффективные алгоритмы, такие как дерево принятия решений с градиентным бустингом, глубокие нейронные сети с прямой связью и логистическую регрессию, обучает и оптимизирует по этим алгоритмам несколько сотен моделей для поиска оптимального варианта.

Рейтинг лучших моделей

Amazon SageMaker Autopilot позволяет проверить все модели машинного обучения, автоматически созданные для ваших данных. Вы можете просмотреть список моделей с сортировкой по таким метрикам, как доля правильных ответов, точность, полнота и площадь под кривой, изучить влияние признаков на прогнозы и другие характеристики модели, а также развернуть наиболее подходящую для вашей ситуации модель.

Автоматическое создание блокнота

Для любой модели, созданной в Amazon SageMaker Autopilot, вы можете автоматически создавать блокнот Amazon SageMaker Studio, что позволит изучить подробности создания модели, что-то в них изменить по мере необходимости и восстановить модель из этого блокнота в любой момент в будущем.

Простая интеграция с вашими приложениями

Вы можете использовать интерфейс прикладного программирования (API) Amazon SageMaker Autopilot для упрощения создания моделей и получения выводов прямо из приложения, например в средствах для анализа и хранения данных.

Amazon SageMaker Autopilot Model Leaderboard
Amazon SageMaker Autopilot Automatic Notebook Creation
Amazon SageMaker Autopilot Automatic Data-preprocessing and Feature Engineering
Amazon SageMaker Autopilot Automatic Model Selection

Примеры использования

Прогнозирование цены

Модели прогнозирования цены широко применяются в финансовых сервисах, сфере недвижимости, энергетических и коммунальных компаниях для прогнозирования цен на акции, объекты недвижимости и природные ресурсы. Amazon SageMaker Autopilot позволяет прогнозировать цены и принимать взвешенные решения об инвестициях на основе данных за прошедшие периоды, таких как спрос, сезонные тенденции и стоимость других товаров.

Прогнозирование оттока клиентов

Оттоком клиентов называется уход существующих клиентов, которого стремится избежать любая компания. Модели, автоматически создаваемые в Amazon SageMaker Autopilot, помогают понять тенденции такого оттока. Модели прогнозирования оттока клиентов применяют процессы быстрого обучения к существующим данным и выявляют тенденции в новых наборах данных, позволяя получить прогноз о том, какие клиенты наиболее склонны к уходу.

Оценка риска

Для оценки риска требуется выявление и анализ потенциальных событий, которые могут негативно повлиять на отдельных людей, активы и компанию в целом. Модели, автоматически создаваемые в Amazon SageMaker Autopilot, прогнозируют риски по мере возникновения новых событий. Модели оценки риска обучаются по существующим наборам данных и помогают оптимизировать прогнозы для принятия бизнес-решений.

Клиенты

Freddys
«Раньше нам приходилось просто брать пару похожих ресторанов, а теперь у нас есть полное понимание связей между нашими позициями в меню, клиентами и расположением. Amazon SageMaker Autopilot, на котором основана новая система машинного обучения Domo, заметно повысила эффективность наших команд маркетинга и закупок и позволила им применить новые идеи и улучшить взаимодействие с клиентами».

Шон Томпсон, директор по ИТ компании Freddy’s

Skullcandy
«Новый сервис машинного обучения Sisense на базе Amazon SageMaker Autopilot дал нам все, в чем мы нуждались для сохранения своевременности в обслуживании клиентов на фоне пандемии COVID-19. Skullcandy удалось получить важные сведения о потребностях наших клиентов, повысить долю успешно решенных проблем и повысить рейтинг удовлетворенности клиентов».

Марк Хокинс, директор по ИТ компании Skullcandy Inc.

mobilewalla
«Основной целью в составлении демографических карт является оптимизация по точности и масштабу. Обычно это достаточно трудно, но мы смогли применить Amazon SageMaker Autopilot к нашим подробным обучающим данным и сложным признакам, получив в итоге более качественные модели с точностью на 137 % выше».

Аниндия Датта, генеральный директор Mobilewalla

Начать работу с Amazon SageMaker Autopilot