С помощью сервиса Amazon SageMaker Ground Truth можно создавать обучающие наборы данных для систем машинного обучения. Сервис Ground Truth позволяет помечать контент (изображения, аудиозаписи, текст и т. д.), по шагам направляя человека-проверяющего в рамках рабочего процесса. С помощью этих рабочих процессов можно задействовать три группы людей-проверяющих: работников сервиса Amazon Mechanical Turk, ваших сотрудников или сторонних поставщиков услуг. Кроме того, сервис Ground Truth может использовать эти метки для своего обучения, а затем автоматически помечать объекты.  

Плата начисляется за каждый помеченный объект (который может представлять собой изображение, аудиозапись, часть текста и т. д.) независимо от того, каким образом выполняется присвоение меток – автоматически сервисом Ground Truth или вручную человеком. Если для присвоения меток вы используете услуги поставщика или сервиса Mechanical Turk, вам придется доплачивать за каждый помеченный объект. Если для присвоения меток вы используете собственных работников, дополнительных расходов не будет. 

Сведения о ценах

Цены на использование встроенного рабочего процесса для присвоения меток с использованием сервиса Amazon Mechanical Turk

Если вы пользуетесь услугами поставщиков, цена за одну метку будет начисляться согласно их тарифам. Сведения о ценах каждого поставщика можно посмотреть в AWS Marketplace. При использовании сервиса Amazon Mechanical Turk для присвоения меток оплата взимается за каждый объект, проанализированный человеком-проверяющим. Чтобы повысить точность результатов, рекомендуется использовать множество проверяющих для анализа одного и того же объекта. 

Уровень бесплатного пользования

В рамках уровня бесплатного пользования AWS работу с сервисом Amazon SageMaker Ground Truth можно начать бесплатно. В течение первых двух месяцев после первого использования сервиса Amazon SageMaker можно бесплатно пометить 500 объектов в месяц (за исключением дополнительных расходов на поставщиков услуг проверки или за использование сервиса Amazon Mechanical Turk).

Примеры расчета цен

Использование собственных работников для присвоения меток вручную

Производственная компания использует машинное обучение для классификации изображений своих продуктов. Чтобы обучить модель, в компании планируют пометить 40 000 изображений с названиями продуктов. Используя встроенный рабочий процесс для классификации изображений, сотрудники компании помечают все 40 000 изображений.

Так как компания использовала собственных работников, цена для 40 000 изображений, помеченных людьми, не изменилась – 0,08 USD за изображение.

Общая стоимость = 40 000 изображений, помеченных людьми x 0,08 USD за изображение = 3200 USD

Использование сервиса Mechanical Turk для присвоения меток людьми с применением пользовательского рабочего процесса

Рекламная компания использует машинное обучение для определения настроения и контента публикаций в социальных сетях. В компании решили, что для обучения их модели необходимо пометить 85 000 публикаций. Было решено создать и выгрузить пользовательский рабочий процесс и задать ставку 0,036 USD за публикацию. Кроме того, чтобы повысить точность присвоения меток, было решено проверять каждую публикацию 3 раза. С помощью сервиса SageMaker Ground Truth проверяющие пометили 85 000 публикаций.

Так как компания использовала сервис Mechanical Turk, в стоимость были включены дополнительные расходы в сумме 0,036 USD за каждую помеченную человеком публикацию. Эта сумма выплачивается проверяющему.

Общая стоимость = (50 000 x 0,08 USD за одну статью) + (35 000 публикаций x 0,04 USD за одну публикацию) + (85 000 помеченных людьми публикаций x 0,036 USD за одну публикацию x 3 проверяющих на один объект) = 14 580 USD

Использование сервиса Mechanical Turk для присвоения меток людьми с применением встроенного рабочего процесса

Издательская компания использует машинное обучение, чтобы создать приложение для обработки естественного языка, которое предполагается применять для классификации статей в газетах. Для обучения модели компании необходимо пометить 200 000 статей. В компании используют встроенный рабочий процесс классификации текстов и чтобы повысить точность присвоения меток, было решено проверять каждую статью 3 раза. С помощью сервиса SageMaker Ground Truth люди-проверяющие пометили 40 000 статей, а 160 000 статей было обработано автоматически.

Так как компания использовала сервис Mechanical Turk, в рабочий процесс классификации текстов были добавлены дополнительные расходы в сумме 0,012 USD за каждую помеченную человеком статью. Эта сумма выплачивается человеку-проверяющему.

Общая стоимость = (50 000 x 0,08 USD за одну статью) + (150 000 статей x 0,04 USD за одну статью) + (40 000 статей, помеченных людьми x 0,012 USD за одну статью x 3 проверяющих на один объект) + расходы на обучение и получение выводов в сервисе Amazon SageMaker** = 11 440 USD + расходы на обучение и получение выводов в сервисе Amazon SageMaker**

**Эти расходы зависят от самых разных факторов, в том числе от типа используемого набора данных, вида задачи на присвоение меток и разрешения изображений в наборе данных.

Дополнительные ресурсы по ценам

Калькулятор полной стоимости владения (TCO)

Рассчитать полную стоимость владения (TCO)

Калькулятор цен AWS

Простой расчет ежемесячных расходов на AWS

Центр ресурсов по экономике

Дополнительные ресурсы для перехода на AWS

Product-Page_Standard-Icons_01_Product-Features_SqInk
Изучить документацию по сервису Amazon SageMaker Ground Truth

Узнайте, как с помощью сервиса Amazon SageMaker Ground Truth можно с высокой точностью создавать высококачественные обучающие наборы данных и уменьшить расходы на присвоение меток данным на величину до 70 %.

Ознакомиться с документацией 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Зарегистрировать бесплатный аккаунт

Получите мгновенный доступ к уровню бесплатного пользования AWS. 

Регистрация 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Начать разработку в консоли

Начните разработку с использованием сервиса Amazon SageMaker Ground Truth в Консоли управления AWS.

Вход