Amazon Comprehend обеспечивает обработку естественного языка, обнаружение и редактирование персональной информации (PII), пользовательскую классификацию и обнаружение сущностей, а также тематическое моделирование, позволяя использовать широкий спектр приложений для анализа необработанного текста, и с помощью API-интерфейсов такие форматы документов, как PDF и Word.

  • Обработка естественного языка. API Amazon Comprehend используется для распознавания сущностей, анализа эмоций, анализа синтаксиса, извлечения ключевых фраз и определения языка. С помощью этих функций можно извлекать сведения из текста, написанного на естественном языке. Такие запросы измеряются в единицах по 100 символов (1 единица = 100 символов). Минимальная плата взимается за 3 единицы (300 символов).
  • Персональная информация (PII). API персональной информации могут находить местоположения сущностей персональной информации внутри документа. Кроме того, API можно использовать для создания обезличенных версий документов. API персональной информации сообщает, содержит ли документ выбранную персональную информацию. Такие запросы измеряются в единицах по 100 символов (1 единица = 100 символов). Минимальная плата взимается за 3 единицы (300 символов).
  • Понимание пользовательских сущностей. Пользовательские API классификации и сущностей могут обучить пользовательскую модель NLP классифицировать текст по категориям и извлекать пользовательские сущности. Асинхронные запросы на логические выводы измеряются в единицах по 100 символов. Минимальная плата взимается за 3 единицы (300 символов). Вы платите 3 USD в час за обучение модели (с точностью до секунды) и 0,50 USD в месяц за управление пользовательскими моделями. При запросах на логические выводы для пользовательской классификации и пользовательских сущностей вы предоставляете адрес с соответствующей пропускной способностью. Сумма к оплате начисляется с момента использования такого адреса до его удаления.
  • Моделирование тем. Моделирование тем позволяет выявлять релевантные термины или темы в наборе документов, сохраненном в Amazon S3. Этот API определяет наиболее распространенные темы в массиве и организовывает их по группам, после чего связывает каждый документ с соответствующей темой. Плата взимается за общий размер обработанных документов в задании. За первые 100 МБ плата взимается по фиксированному тарифу. При объеме свыше 100 МБ плата взимается за каждый мегабайт.
  • Доверие и безопасность (новая возможность): API определения токсичности Comprehend можно использовать для обнаружения токсичного содержимого в тексте. Также функцию классификации запросов по уровню безопасности Comprehend можно использовать для обнаружения небезопасных входных запросов в больших языковых моделях и приложениях. Такие запросы измеряются в единицах по 100 символов (1 единица = 100 символов). Минимальная плата взимается за 3 единицы (300 символов).
  • Подробнее о ценах на Amazon Comprehend Medical на этой странице.
  • Вы можете оценить расходы с помощью Калькулятора цен AWS.
  • Выберите регион Восток США (Северная Вирджиния) в списке регионов ниже, чтобы увидеть цены на все API

 

Если вам необходимо обрабатывать более 100 млн единиц в месяц, свяжитесь с нами, чтобы обсудить цены.
NLP‑запросы измеряются в единицах по 100 символов. Минимальная плата взимается за 3 единицы (300 символов).

С API Amazon Comprehend можно обрабатывать неструктурированный неподготовленный текст, а с помощью определенных API – другие текстовые файлы, например документы PDF и Word. 

Понимание пользовательских сущностей

Пользовательские сущности и классификация
Для распознавания асинхронных сущностей в простых текстовых документах и документах PDF и Word

Запросы на логические выводы измеряются в единицах по 100 символов. Минимальная плата взимается за 3 единицы (300 символов).

За асинхронную классификацию

Запросы на логические выводы измеряются в единицах по 100 символов. Минимальная плата взимается за 3 единицы (300 символов).

Для асинхронной классификации и распознавания сущностей

Плата за использование адресов начисляется с шагом в одну секунду; минимальный период использования составляет 60 секунд. Плата взимается с момента использования такого адреса до его удаления, даже если документы в это время не анализируются.

Использование одной единицы обеспечивает пропускную способность в 100 символов в секунду по управляемому вами адресу. Можно выделять дополнительные единицы, чтобы увеличить пропускную способность. Стоимость одной единицы – 0,0005 USD за секунду.

3 USD в час за обучение моделей

*для извлечения текста из сканированных документов PDF вызывается API обнаружения текста документа Amazon Textract.

Моделирование тем

За первые 100 МБ

За каждый мегабайт свыше 100 МБ

Плата взимается за общий размер обработанных документов в задании по моделированию тем. За первые 100 МБ плата взимается по фиксированному тарифу. При объеме свыше 100 МБ плата взимается за каждый мегабайт.

Уровень бесплатного пользования

50 000 ЕДИНИЦ ТЕКСТА (5 000 000 СИМВОЛОВ)

На уровне бесплатного пользования Amazon Comprehend предлагается 50 000 единиц текста (5 000 000 символов) на каждый API в месяц.

В числе API – извлечение ключевых фраз, эмоциональная окраска, таргетированная эмоциональная окраска, распознавание сущностей, определение языка, обнаружение событий, синтаксический анализ, обнаружение персональной информации, вхождение персональной информации и классификация запросов по уровню безопасности.

Примечание: для функций понимания пользовательских сущностей и их классификации уровень бесплатного использования не предусмотрен. Это касается обучения моделей, формулировки логических выводов и управления моделями.

5 заданий по моделированию объемом до 1 МБ (тематическое моделирование)

Уровень бесплатного пользования Amazon Comprehend доступен для новых и существующих клиентов AWS в течение 12 месяцев с даты первого запроса Amazon Comprehend.

Примеры расчета стоимости Amazon Comprehend

Пример 1. Анализ комментариев клиентов

Предположим, вы написали приложение для анализа комментариев клиентов онлайн‑магазина с помощью Amazon Comprehend. Вы получили 10 000 комментариев, каждый объемом 550 символов. Вы используете сервис второй год.

Вычисление общей стоимости:

Размер каждого запроса – 550 символов

Количество единиц за запрос = 6

Всего единиц: 10 000 (запросов) x 6 (единиц за запрос) = 60 000

Цена за единицу = 0,0001 USD

Общая стоимость = [Кол‑во единиц] x [Стоимость единицы] = 60 000 x 0,0001 USD = 6,00 USD


Пример 2. Группировка документов по темам

Предположим, у вас есть справочные документы общим объемом 240 МБ, которые нужно группировать по темам и рекомендовать клиентам на основе сфер их интересов. Дополнительно предположим, что вы пользуетесь сервисом второй год и не имеете права на уровень бесплатного пользования.

Вычисление общей стоимости:

Общее количество обработанных мегабайтов = 240

Количество мегабайтов по фиксированному тарифу 1 USD = 100

Количество мегабайтов по стоимости 0,004 USD/МБ = 140 [240-100]

Общая стоимость задания = 1,00 USD + [140 x 0,004 USD] = 1,00 USD + 0,56 USD = 1,56 USD


Пример 3. Сортировка отзывов клиентов с помощью API пользовательской классификации

Предположим, требуется настроить классификатор для автоматической сортировки новых отзывов клиентов, поступающих с веб‑сайта. Ежеминутно 10 клиентов оставляют свои отзывы (каждый размером в 300 символов). Для обучения пользовательской модели потребуется один час, и вы планируете хранить эту модель в течение месяца. В данном случае обучение модели обойдется вам в 3 USD, а ее хранение – 0,5 USD за месяц. Дополнительно предположим, что вы пользуетесь сервисом второй год и не имеете права на уровень бесплатного пользования. 

При асинхронной классификации отзывов взимается плата за количество символов в документах. При классификации в режиме реального времени вы предоставляете адрес с достаточной пропускной способностью для вашего варианта применения и платите, только когда адрес активен.

Расчет стоимости логических выводов при асинхронной классификации

Количество символов в запросе на день = 4 320 000 символов [300 символов * 10 документов * 1440 минут]

Количество единиц в запросе = 43 200 единиц [432 000 символов ÷ 100 символов на единицу]

Цена за единицу = 0,0005 USD

Общая стоимость логических выводов (при расчете единиц) = 21,60 USD [43 200 единиц x 0,0005 USD]

Общая стоимость = 25,10 USD [21,60 USD (логические выводы) + 3 USD (обучение моделей) + 0,50 USD (хранение моделей)]

Определение общей стоимости для синхронной классификации:

Прежде всего, необходимо рассчитать требуемую пропускную способность. Ежеминутно мы обрабатываем 10 документов по 300 символов каждый или

50 символов в секунду [300 символов x 10 документов ÷ 60 секунд]

Таким образом, вам понадобится выделить адрес с использованием одной единицы, обеспечивающую пропускную способность в 100 символов в секунду.

Цена за 1 единицу = 0,0005 USD за секунду

Вы оплачиваете только время активного использования адреса для классификации в режиме реального времени независимо от количества вызовов логических выводов.

При использовании адреса для классификации в режиме реального времени 12 часов в день:

Общая стоимость логических выводов = 21,60 USD [0,0005 USD x 3600 секунд x 12 часов]

Общая стоимость = 25,10 USD [21,60 USD (логические выводы) + 3 USD (обучение моделей) + 0,50 USD (хранение моделей)]

Обратите внимание: вы платите за предоставленную пропускную способность, когда адрес активен. Цена при необходимости увеличить пропускную способность:

2 единицы = 0,001 USD за секунду [0,0005 USD x 2]

3 единицы = 0,0015 USD за секунду [0,0005 USD x 3]


Пример 4. Анализ комментариев клиентов с использованием API пользовательских сущностей

Предположим, требуется обучить модель пользовательских сущностей автоматическому извлечению пользовательских терминов из отзыва клиента, который тот оставил на вашем веб-сайте. Обучение занимает 1,5 часа, за это время система анализирует 10 000 единиц отзывов клиентов (по 550 символов каждый). Вы планируете работать с этой моделью в течение месяца. Дополнительно предположим, что вы пользуетесь сервисом второй год и не имеете права на уровень бесплатного пользования.

Вычисление общей стоимости:

Размер каждого запроса – 5,500,000 символов

Количество единиц за запрос = 55,000 единиц [5,500,000 символов ÷ 100 символов на единицу]

Цена за единицу = 0,0005 USD

Общая стоимость единиц = 27,5 USD [55 000 единиц x 0,0005 USD]

Общее время обучения модели = 1,5 часа

Цена за час = 3 USD

Общая стоимость обучения модели = 4,5 USD [1,5 часа x 3 USD]

Срок управления пользовательской моделью = 1 месяц

Цена за месяц = 0,50 USD 

Общая стоимость управления моделью = 0,50 USD [1 месяц x 0,50 USD]

Общая стоимость = 37 USD [27,5 USD + 4,5 USD + 0,50 USD]


Пример 5. Извлечение событий и связанной информации с помощью обнаружения событий

Предположим, вы хотите извлечь 3 типа событий из 3000 статей (каждая статья содержит 500 символов), а сервисом вы пользуетесь уже второй год.

Вычисление общей стоимости:

Количество обработанных символов = 1 500 000 символов [3000 статей x 500 символов]

Количество обработанных единиц = 45 000 единиц [1 500 000 x 3 типа событий ÷ 100 символов за единицу]

Цена за единицу = 0,003 USD

Общая стоимость единиц = 135 USD [45 000 единиц x 0,003 USD]


Пример 6. Определение персональной информации с помощью API, содержащего персональную информацию

Предположим, вы написали приложение для анализа комментариев клиентов онлайн‑магазина с помощью Amazon Comprehend. Вы получили 10 000 комментариев от клиентов (количество символов для каждого комментария составляет 550). Вам необходимо определить документы, которые содержат персональную информацию, чтобы хранить ее в надежном месте. Представим, что вы уже второй год пользуетесь сервисом.

Вычисление общей стоимости:

Размер каждого запроса – 550 символов

Количество единиц за запрос = 6

Всего единиц: 60 000 [10 000 запросов x 6 единиц за запрос]

Цена за единицу = 0,000002 USD

Общая стоимость = 0,12 USD [60 000 единиц x 0,000002 USD]


Пример 7. Обработка персональной информации из документов с помощью API, определяющего персональную информацию

Предположим, вы написали приложение для анализа комментариев клиентов онлайн‑магазина с помощью Amazon Comprehend. Вы получили 10 000 комментариев от клиентов (количество символов для каждого комментария составляет 550). Вам необходимо создать обезличенные версии документов перед тем, как архивировать их. Представим, что вы уже второй год пользуетесь сервисом.

Вычисление общей стоимости:

Размер каждого запроса – 550 символов

Количество единиц за запрос = 6

Всего единиц: 60 000 [10 000 запросов x 6 единиц за запрос]

Цена за единицу = 0,0001 USD

Общая стоимость = 6 USD [60 000 единиц x 0,0001 USD]

Пример 8. Извлечение сущностей ипотечных заявок с помощью пользовательского API сущностей

Предположим, вы хотите обучить модель пользовательского извлечения сущностей, чтобы извлечь 10 пользовательских сущностей из ипотечного приложения. Каждый день заявки подают сто пользователей, каждый предоставляет десятистраничный сканированный документ PDF с 2500 символами на каждой странице. Допустим, вам необходимо с помощью Amazon Textract извлечь текст с каждой обработанной страницы, а после извлечь сущности, используя API обнаружения текста документа. Для обучения пользовательской модели потребуется один час, и вы планируете хранить эту модель в течение месяца. В данном случае обучение модели обойдется вам в 3 USD, а ее хранение – 0,50 USD за месяц. Дополнительно предположим, что вы пользуетесь сервисом второй год и не имеете права на уровень бесплатного пользования. При асинхронном извлечении пользовательских сущностей взимается плата за количество символов в документах. При извлечении сущностей в режиме реального времени вы предоставляете адрес с достаточной пропускной способностью для вашего варианта применения и платите, только когда адрес активен.

Расчет стоимости логических выводов при асинхронной классификации

Количество символов в запросе на день = 2 500 000 символов [100 приложений в день * 10 документов * 2500 символов]

Количество единиц за запрос = 25 000 единиц [2 500 000 символов ÷ 100 символов на единицу]

Цена за единицу = 0,0005 USD

Общая стоимость логических выводов (при расчете единиц) = 12,50 USD [25 000 единиц x 0,0005 USD]

Оплата за API обнаружения текста документа Amazon Textract = 1,50 USD [100 заявок в день * 10 документов * 0,0015 USD за страницу до 1 млн страниц]

Общая стоимость = 17,50 USD [12,50 USD (логические выводы) + 1,50 USD (Textract) + 3 USD (обучение моделей) + 0,50 USD (хранение моделей)]

 

Пример 9 – анализ ответов сотрудников на опрос

Предположим, что с помощью Amazon Comprehend Targeted Sentiment вы создали приложение для анализа ответов сотрудников корпорации на опрос. Вы получили 100 000 ответов, каждый объемом 350 символов. Вы используете сервис второй год.

Вычисление общей стоимости:

Размер каждого запроса = 350 символов

Количество единиц за запрос = 4

Всего единиц: 100 000 (запросов) x 4 (единиц за запрос) = 400 000

Цена за единицу = 0,0001 USD (от 0 до 10 млн единиц)

Общая стоимость = [Кол‑во единиц] x [Стоимость единицы] = 400 000 x 0,0001 USD = 40,00 USD

 

Пример 10. Обнаружение токсичности в онлайн-комментариях на веб-сайте

Предположим, вы написали приложение для анализа комментариев на своем веб-сайте на предмет токсичности с помощью Amazon Comprehend. Вы получили 100 млн комментариев от клиентов по 100 символов каждый, и вам необходимо определить, какие комментарии являются токсичными и должны быть отредактированы. Представим, что вы уже второй год пользуетесь сервисом.

            Расчет общей стоимости:

            Размер каждого запроса = 100 символов

            Количество единиц за запрос = 1

            Единицы = 100 млн единиц [100 млн комментариев x 1 единица на запрос]

            Цена за единицу = 0,0001 USD [от 0 до 10 млн единиц] + 0,00005 USD [от 10 млн до 50 млн единиц] + 0,000025 USD [от 50 млн до 100 млн единиц]

            Общая стоимость = [Кол‑во единиц] x [Стоимость единицы]

            = [10 млн x 0,001 USD] + [40 млн x 0,00005 USD] + [50 млн x 0,000025 USD]

            = 1000 USD + 2000 USD + 1250 USD

            = 4250 USD

Пример 11. Обнаружение небезопасных запросов в приложении с генеративным искусственным интеллектом

Предположим, что вы создали приложение с использованием Amazon Comprehend для обнаружения вводимых небезопасных запросов при взаимодействии пользователей с вашим продуктом генеративного искусственного интеллекта. Вы получили 10 млн запросов на ввод по 500 символов каждый, и вам необходимо определить, какие из них небезопасны. Представим, что вы уже второй год пользуетесь сервисом.

            Расчет общей стоимости:

            Размер каждого запроса = 500 символов

            Количество единиц на запрос = 5

            Всего единиц = 50 млн единиц [10 млн комментариев x 5 единиц на запрос]

            Цена за единицу = 0,0001 USD [от 0 до 10 млн единиц] + 0,00005 USD [от 10 млн до 50 млн единиц] + 0,000025 USD [от 50 млн до 100 млн единиц]

            Общая стоимость = [Кол‑во единиц] x [Стоимость единицы]

            = [10 млн x 0,001 USD] + [40 млн x 0,00005 USD]

            = 1000 USD + 2000 USD

            = 3000 USD

Подробнее о возможностях Amazon Comprehend

Перейти на страницу с описанием возможностей
Готовы начать работу?
Регистрация
Возникли дополнительные вопросы?
Свяжитесь с нами