Amazon SageMaker Autopilot

Автоматическое создание моделей машинного обучения с полной прозрачностью процесса

Amazon SageMaker Autopilot автоматически создает, обучает и настраивает наилучшие модели машинного обучения, используя характеристики ваших данных и позволяя сохранять полный контроль и прозрачность этого процесса.

Для создания моделей машинного обучения нужно вручную подготовить признаки, проверить множество алгоритмов и оптимизировать сотни параметров модели для выбора оптимальной модели. Такой подход требует большого опыта работы с машинным обучением. Если у вас его нет, вы можете использовать автоматический способ (AutoML), но обычно он плохо позволяет понять, как используются признаки и как они влияют на прогнозы модели. Это означает, что вы будете меньше доверять результатам, которые невозможно воспроизвести и проанализировать.

Amazon SageMaker Autopilot избавит вас от трудоемких процедур создания моделей машинного обучения, позволяя автоматически создавать, обучать и настраивать оптимальные модели в зависимости от используемых данных. В SageMaker Autopilot достаточно предоставить набор данных в табличной форме и выбрать для прогнозирования целевую колонку, которая может содержать числовое значение (например, стоимость дома, и такая задача называется регрессией) или обозначение категории (например, маркировка спама в электронной почте, и такая задача называется классификацией). SageMaker Autopilot автоматически изучит доступные решения и выберет из них оптимальную модель. Далее в том же интерфейсе можно всего одним щелчком развернуть полученную модель в рабочей среде или последовательно изучить разные решения в Amazon SageMaker Studio, чтобы дополнительно повысить качество модели.

Принцип работы

Как работает Amazon SageMaker Autopilot?

Основные возможности

Автоматическая предварительная обработка данных и разработка функций

Вы можете использовать Amazon SageMaker Autopilot даже при отсутствии части данных. SageMaker Autopilot автоматически заполняет недостающие значения, выполняет статистический анализ столбцов в наборе данных и автоматически извлекает информацию из нечисловых столбцов (например, дату и время из меток времени).

Автоматический выбор модели машинного обучения

Amazon SageMaker Autopilot автоматически определяет тип прогнозов, наиболее подходящий для ваших данных — двоичная классификация, мультиклассовая классификация или регрессия. Затем SageMaker Autopilot изучает высокоэффективные алгоритмы, такие как дерево принятия решений с градиентным бустингом, глубокие нейронные сети с прямой связью и логистическую регрессию, обучает и оптимизирует по этим алгоритмам несколько сотен моделей для поиска оптимального варианта.

Рейтинг лучших моделей

Amazon SageMaker Autopilot позволяет проверить все модели машинного обучения, автоматически созданные для ваших данных. Вы можете просмотреть список моделей с сортировкой по таким метрикам, как доля правильных ответов, точность, полнота и площадь под кривой, изучить влияние признаков на прогнозы и другие характеристики модели, а также развернуть наиболее подходящую для вашей ситуации модель.

Автоматическое создание блокнота

Для любой модели, созданной в Amazon SageMaker Autopilot, вы можете автоматически создавать блокнот Amazon SageMaker Studio, что позволит изучить подробности создания модели, что-то в них изменить по мере необходимости и восстановить модель из этого блокнота в любой момент в будущем.

Важность функции

Amazon SageMaker Autopilot предоставляет отчет с объяснениями, сгенерированный Amazon SageMaker Clarify. С его помощью проще понять и объяснить, как модели, созданные с помощью SageMaker Autopilot, составляют прогнозы. Также можно определить, какой вклад делает каждый атрибут данных для обучения в спрогнозированный результат в процентном соотношении. Чем выше процент, тем сильнее характеристика влияет на прогнозы этой модели.

Простая интеграция с вашими приложениями

Вы можете использовать интерфейс прикладного программирования (API) Amazon SageMaker Autopilot для упрощения создания моделей и получения выводов прямо из приложения, например в средствах для анализа и хранения данных.

Примеры использования

Прогнозирование цены

Модели прогнозирования цены широко применяются в финансовых сервисах, сфере недвижимости, энергетических и коммунальных компаниях для прогнозирования цен на акции, объекты недвижимости и природные ресурсы. Amazon SageMaker Autopilot позволяет прогнозировать цены и принимать взвешенные решения об инвестициях на основе данных за прошедшие периоды, таких как спрос, сезонные тенденции и стоимость других товаров.

Прогнозирование оттока клиентов

Оттоком клиентов называется уход существующих клиентов, которого стремится избежать любая компания. Модели, автоматически создаваемые в Amazon SageMaker Autopilot, помогают понять тенденции такого оттока. Модели прогнозирования оттока клиентов применяют процессы быстрого обучения к существующим данным и выявляют тенденции в новых наборах данных, позволяя получить прогноз о том, какие клиенты наиболее склонны к уходу.

Оценка риска

Для оценки риска требуется выявление и анализ потенциальных событий, которые могут негативно повлиять на отдельных людей, активы и компанию в целом. Модели, автоматически создаваемые в Amazon SageMaker Autopilot, прогнозируют риски по мере возникновения новых событий. Модели оценки риска обучаются по существующим наборам данных и помогают оптимизировать прогнозы для принятия бизнес-решений.

Клиенты

Skullcandy Inc.
«Новый сервис машинного обучения Sisense на базе Amazon SageMaker Autopilot дал нам все, в чем мы нуждались для сохранения своевременности в обслуживании клиентов на фоне пандемии COVID-19. Skullcandy удалось получить важные сведения о потребностях наших клиентов, повысить долю успешно решенных проблем и повысить рейтинг удовлетворенности клиентов».

Марк Хопкинс, директор по ИТ компании Skullcandy Inc.

Freddy’s
«Раньше нам приходилось просто выбирать пару похожих ресторанов, а теперь у нас есть полное понимание связей между нашими позициями в меню, клиентами и расположением. Amazon SageMaker Autopilot, на котором основана новая система машинного обучения Domo, заметно повысила эффективность наших команд маркетинга и закупок и позволила им применить новые идеи и улучшить взаимодействие с клиентами».

Шон Томпсон, директор по ИТ компании Freddy’s

Mobilewalla
«Основной целью в составлении демографических карт является оптимизация по точности и масштабу. Обычно это достаточно трудно, но мы смогли применить Amazon SageMaker Autopilot к нашим подробным обучающим данным и сложным признакам, получив в итоге более качественные модели с точностью на 137 % выше».

Аниндия Датта, генеральный директор Mobilewalla

Ресурсы для Amazon SageMaker Autopilot

Легкое и быстрое создание качественных моделей машинного обучения с помощью Amazon SageMaker Autopilot (31:39)

Amazon SageMaker Autopilot