Начать работу с руководством по внедрению

6 шагов  |  30 минут

Machine_Learning_HERO-ART_SM

Вопрос: Что такое Amazon Machine Learning (Amazon ML)?

Amazon ML – это сервис, позволяющий легко создавать прогнозирующие приложения, в том числе приложения для обнаружения мошенничества, предсказания спроса и прогнозов поведения пользователей. Amazon ML использует мощные алгоритмы, позволяющие создавать модели машинного обучения путем нахождения шаблонов в существующих данных и их использования для составления прогнозов по новым данным, как только они становятся доступны. Консоль управления AWS и API предоставляют инструменты визуализации данных и моделей, а также мастеров, помогающих создавать модели машинного обучения, определять их качество и выполнять тонкую настройку прогнозов в соответствии с потребностями приложений. После создания моделей можно получать прогнозы для ваших приложений, используя простой API. Создавать собственный код для формирования прогнозов и управлять какой-либо инфраструктурой не требуется. Amazon ML – это высокомасштабируемый сервис, который может ежедневно формировать миллиарды прогнозов, выдавая их с высокой производительностью в режиме реального времени. При работе с Amazon ML плата за настройку не взимается, вы платите только за используемые ресурсы. Это позволяет начать работу в небольшом объеме и наращивать используемые ресурсы по мере развития приложения.

Вопрос: Какие существуют варианты использования Amazon ML?

Amazon ML можно использовать для создания широкого спектра прогнозирующих приложений. Например, Amazon ML можно использовать для создания приложений, которые помечают подозрительные транзакции, выявляют мошеннические заказы, прогнозируют спрос или действия пользователя, индивидуально настраивают контент, фильтруют отзывы, следят за информацией в социальных сетях, анализируют произвольные тексты и рекомендуют товары.

Вопрос: Какие меры обеспечения безопасности использует сервис Amazon ML?

Amazon ML обеспечивает шифрование моделей машинного обучения и других системных артефактов как при хранении, так и при пересылке. Запросы к API сервиса Amazon ML и связь с консолью выполняются через безопасное SSL-соединение. Для управления доступом пользователей IAM к конкретным действиям и ресурсам Amazon Machine Learning можно использовать сервис AWS Identity and Access Management (AWS IAM).

Вопрос: Где можно хранить данные, используемые Amazon ML?

Amazon ML может читать данные из трех источников: (a) одного или нескольких файлов в Amazon S3, (b) результатов поискового запроса Amazon Redshift или (c) результатов поискового запроса Amazon Relational Database Service (RDS), если он выполнен по базе данных с ядром MySQL. Данные других продуктов, как правило, можно экспортировать в формате CSV в корзину Amazon S3, сделав их доступными для сервиса Amazon ML. Подробные указания по настройке разрешений, позволяющих сервису Amazon ML получить доступ к поддерживаемым хранилищам данных, см. в Руководстве по Amazon Machine Learning для разработчиков.

Вопрос: Я хочу использовать пробный проект для обработки собственных данных. Есть ли ограничения на размер пакета данных, который используется для обучения?

Amazon ML может обучать модели на наборах данных объемом до 100 ГБ.

Вопрос: Каким образом можно настроить модель, если она не выдает желаемых результатов?

Лучший способ повысить эффективность модели – использовать для обучения больше данных высокого качества. Хорошим способом повышения точности прогнозирования моделей является добавление данных наблюдений и дополнительных типов информации, а также преобразование данных для оптимизации процесса обучения. Amazon ML также предоставляет несколько параметров для настройки процесса обучения: (a) целевой размер модели, (b) количество проходов по данным и (c) тип и степень регуляризации, применяемая к модели. В завершение укажем один важный аспект настройки модели: нужно учитывать, каким образом прогнозы, созданные моделью машинного обучения, будут интерпретироваться конечным приложением и как можно оптимизировать эту интерпретацию для соответствия целям бизнеса. Amazon ML обеспечивает настройку интерпретации порога отсечения для моделей бинарной классификации, позволяя достичь обоснованного компромисса между разными видами ошибок, которые может допускать обученная модель. Например, некоторые приложения устойчивы к ложноположительным ошибкам, но весьма чувствительны к ложноотрицательным ошибкам. Консоль сервиса Amazon ML поможет настроить порог отсечения в соответствии с конкретными требованиями.

Вопрос: В чем могут помочь прогнозирующие модели Amazon ML?

Сформированные прогнозы можно использовать разными способами. Например, результаты можно загрузить в таблицу и отсортировать по значениям вероятности. Их можно также загрузить в базу данных, такую как Amazon RDS или Amazon Redshift, и создать списки подходящих сегментов. Кроме того, значения вероятности можно загрузить в базу данных NoSQL через Amazon DynamoDB и организовать передачу значений вероятности в приложение в режиме реального времени.

Начать работу с руководством по внедрению