Amazon Comprehend обеспечивает обработку естественного языка, обнаружение и редактирование персональной информации (PII), пользовательскую классификацию и обнаружение сущностей, а также тематическое моделирование, позволяя использовать широкий спектр приложений для анализа необработанного текста, и с помощью API-интерфейсов такие форматы документов, как PDF и Word.
- Обработка естественного языка. API Amazon Comprehend используется для распознавания сущностей, анализа эмоций, анализа синтаксиса, извлечения ключевых фраз и определения языка. С помощью этих функций можно извлекать сведения из текста, написанного на естественном языке. Такие запросы измеряются в единицах по 100 символов (1 единица = 100 символов). Минимальная плата взимается за 3 единицы (300 символов).
- Персональная информация (PII). API персональной информации могут находить местоположения сущностей персональной информации внутри документа. Кроме того, API можно использовать для создания обезличенных версий документов. API персональной информации сообщает, содержит ли документ выбранную персональную информацию. Такие запросы измеряются в единицах по 100 символов (1 единица = 100 символов). Минимальная плата взимается за 3 единицы (300 символов).
- Понимание пользовательских сущностей. Пользовательские API классификации и сущностей могут обучить пользовательскую модель NLP классифицировать текст по категориям и извлекать пользовательские сущности. Асинхронные запросы на логические выводы измеряются в единицах по 100 символов. Минимальная плата взимается за 3 единицы (300 символов). Вы платите 3 USD в час за обучение модели (с точностью до секунды) и 0,50 USD в месяц за управление пользовательскими моделями. При запросах на логические выводы для пользовательской классификации и пользовательских сущностей вы предоставляете адрес с соответствующей пропускной способностью. Сумма к оплате начисляется с момента использования такого адреса до его удаления.
- Моделирование тем. Моделирование тем позволяет выявлять релевантные термины или темы в наборе документов, сохраненном в Amazon S3. Этот API определяет наиболее распространенные темы в массиве и организовывает их по группам, после чего связывает каждый документ с соответствующей темой. Плата взимается за общий размер обработанных документов в задании. За первые 100 МБ плата взимается по фиксированному тарифу. При объеме свыше 100 МБ плата взимается за каждый мегабайт.
- Доверие и безопасность (новая возможность): API определения токсичности Comprehend можно использовать для обнаружения токсичного содержимого в тексте. Также функцию классификации запросов по уровню безопасности Comprehend можно использовать для обнаружения небезопасных входных запросов в больших языковых моделях и приложениях. Такие запросы измеряются в единицах по 100 символов (1 единица = 100 символов). Минимальная плата взимается за 3 единицы (300 символов).
- Подробнее о ценах на Amazon Comprehend Medical на этой странице.
- Вы можете оценить расходы с помощью Калькулятора цен AWS.
- Выберите регион Восток США (Северная Вирджиния) в списке регионов ниже, чтобы увидеть цены на все API
С API Amazon Comprehend можно обрабатывать неструктурированный неподготовленный текст, а с помощью определенных API – другие текстовые файлы, например документы PDF и Word.
Запросы на логические выводы измеряются в единицах по 100 символов. Минимальная плата взимается за 3 единицы (300 символов).
Запросы на логические выводы измеряются в единицах по 100 символов. Минимальная плата взимается за 3 единицы (300 символов).
Плата за использование адресов начисляется с шагом в одну секунду; минимальный период использования составляет 60 секунд. Плата взимается с момента использования такого адреса до его удаления, даже если документы в это время не анализируются.
Использование одной единицы обеспечивает пропускную способность в 100 символов в секунду по управляемому вами адресу. Можно выделять дополнительные единицы, чтобы увеличить пропускную способность. Стоимость одной единицы – 0,0005 USD за секунду.
*для извлечения текста из сканированных документов PDF вызывается API обнаружения текста документа Amazon Textract.
За первые 100 МБ
За каждый мегабайт свыше 100 МБ
Плата взимается за общий размер обработанных документов в задании по моделированию тем. За первые 100 МБ плата взимается по фиксированному тарифу. При объеме свыше 100 МБ плата взимается за каждый мегабайт.
На уровне бесплатного пользования Amazon Comprehend предлагается 50 000 единиц текста (5 000 000 символов) на каждый API в месяц.
В числе API – извлечение ключевых фраз, эмоциональная окраска, таргетированная эмоциональная окраска, распознавание сущностей, определение языка, обнаружение событий, синтаксический анализ, обнаружение персональной информации, вхождение персональной информации и классификация запросов по уровню безопасности.
Примечание: для функций понимания пользовательских сущностей и их классификации уровень бесплатного использования не предусмотрен. Это касается обучения моделей, формулировки логических выводов и управления моделями.
Уровень бесплатного пользования Amazon Comprehend доступен для новых и существующих клиентов AWS в течение 12 месяцев с даты первого запроса Amazon Comprehend.
Примеры расчета цены Amazon Comprehend
Пример 1: анализ комментариев клиентов
Предположим, вы написали приложение для анализа комментариев клиентов онлайн‑хранилища с помощью Amazon Comprehend. Вы получили 10 000 комментариев, каждый объемом 550 символов. Вы используете сервис второй год.
Вычисление общей стоимости:
Размер каждого запроса – 550 символов
Количество единиц за запрос = 6
Всего единиц: 10 000 (запросов) x 6 (единиц за запрос) = 60 000
Цена за единицу = 0,0001 USD
Общая стоимость = [Кол‑во единиц] x [Стоимость единицы] = 60 000 x 0,0001 USD = 6,00 USD
Пример 2: группировка документов по темам
Предположим, у вас есть справочные документы общим объемом 240 МБ, которые нужно группировать по темам и рекомендовать клиентам на основе сфер их интересов. Дополнительно предположим, что вы пользуетесь сервисом второй год и не имеете права на уровень бесплатного пользования.
Вычисление общей стоимости:
Общее количество обработанных мегабайтов = 240
Количество мегабайтов по фиксированному тарифу 1 USD = 100
Количество мегабайтов по стоимости 0,004 USD/МБ = 140 [240-100]
Общая стоимость задания = 1,00 USD + [140 x 0,004 USD] = 1,00 USD + 0,56 USD = 1,56 USD
Пример 3: сортировка отзывов клиентов с помощью API пользовательской классификации
Предположим, требуется настроить классификатор для автоматической сортировки новых отзывов клиентов, поступающих с веб‑сайта. Ежеминутно 10 клиентов оставляют свои отзывы (каждый размером в 300 символов). Для обучения пользовательской модели потребуется один час, и вы планируете хранить эту модель в течение месяца. В данном случае обучение модели обойдется вам в 3 USD, а ее хранение – 0,5 USD за месяц. Дополнительно предположим, что вы пользуетесь сервисом второй год и не имеете права на уровень бесплатного пользования.
При асинхронной классификации отзывов взимается плата за количество символов в документах. При классификации в режиме реального времени вы предоставляете адрес с достаточной пропускной способностью для вашего варианта применения и платите, только когда адрес активен.
Расчет стоимости логических выводов при асинхронной классификации
Количество символов в запросе на день = 4 320 000 символов [300 символов * 10 документов * 1440 минут]
Количество единиц в запросе = 43 200 единиц [432 000 символов ÷ 100 символов на единицу]
Цена за единицу = 0,0005 USD
Общая стоимость логических выводов (при расчете единиц) = 21,60 USD [43 200 единиц x 0,0005 USD]
Общая стоимость = 25,10 USD [21,60 USD (логические выводы) + 3 USD (обучение моделей) + 0,50 USD (хранение моделей)]
Определение общей стоимости для синхронной классификации:
Прежде всего, необходимо рассчитать требуемую пропускную способность. Ежеминутно мы обрабатываем 10 документов по 300 символов каждый или
50 символов в секунду [300 символов x 10 документов ÷ 60 секунд]
Таким образом, вам понадобится выделить адрес с использованием одной единицы, обеспечивающую пропускную способность в 100 символов в секунду.
Цена за 1 единицу = 0,0005 USD за секунду
Вы оплачиваете только время активного использования адреса для классификации в режиме реального времени независимо от количества вызовов логических выводов.
При использовании адреса для классификации в режиме реального времени 12 часов в день:
Общая стоимость логических выводов = 21,60 USD [0,0005 USD x 3600 секунд x 12 часов]
Общая стоимость = 25,10 USD [21,60 USD (логические выводы) + 3 USD (обучение моделей) + 0,50 USD (хранение моделей)]
Обратите внимание: вы платите за предоставленную пропускную способность, когда адрес активен. Цена при необходимости увеличить пропускную способность:
2 единицы = 0,001 USD за секунду [0,0005 USD x 2]
3 единицы = 0,0015 USD за секунду [0,0005 USD x 3]
Пример 4: анализ комментариев клиентов с использованием API пользовательских сущностей
Вычисление общей стоимости:
Размер каждого запроса – 5,500,000 символов
Количество единиц за запрос = 55,000 единиц [5,500,000 символов ÷ 100 символов на единицу]
Цена за единицу = 0,0005 USD
Общая стоимость единиц = 27,5 USD [55 000 единиц x 0,0005 USD]
Общее время обучения модели = 1,5 часа
Цена за час = 3 USD
Общая стоимость обучения модели = 4,5 USD [1,5 часа x 3 USD]
Срок управления пользовательской моделью = 1 месяц
Цена за месяц = 0,50 USD
Общая стоимость управления моделью = 0,50 USD [1 месяц x 0,50 USD]
Общая стоимость = 37 USD [27,5 USD + 4,5 USD + 0,50 USD]
Пример 5: извлечение событий и связанной информации с помощью обнаружения событий
Вычисление общей стоимости:
Количество обработанных символов = 1 500 000 символов [3000 статей x 500 символов]
Количество обработанных единиц = 45 000 единиц [1 500 000 x 3 типа событий ÷ 100 символов за единицу]
Цена за единицу = 0,003 USD
Общая стоимость единиц = 135 USD [45 000 единиц x 0,003 USD]
Пример 6: определение персональных данных с помощью API, содержащего персональные данные
Вычисление общей стоимости:
Размер каждого запроса – 550 символов
Количество единиц за запрос = 6
Всего единиц: 60 000 [10 000 запросов x 6 единиц за запрос]
Цена за единицу = 0,000002 USD
Общая стоимость = 0,12 USD [60 000 единиц x 0,000002 USD]
Пример 7. Обработка персональных данных из документов с помощью API, определяющего персональные данные
Вычисление общей стоимости:
Размер каждого запроса – 550 символов
Количество единиц за запрос = 6
Всего единиц: 60 000 [10 000 запросов x 6 единиц за запрос]
Цена за единицу = 0,0001 USD
Общая стоимость = 6 USD [60 000 единиц x 0,0001 USD]
Пример 8: извлечение сущностей ипотечных заявок с помощью пользовательского API сущностей
Расчет стоимости логических выводов при асинхронной классификации
Количество символов в запросе на день = 2 500 000 символов [100 приложений в день * 10 документов * 2500 символов]
Количество единиц за запрос = 25 000 единиц [2 500 000 символов ÷ 100 символов на единицу]
Цена за единицу = 0,0005 USD
Общая стоимость логических выводов (при расчете единиц) = 12,50 USD [25 000 единиц x 0,0005 USD]
Оплата за API обнаружения текста документа Amazon Textract = 1,50 USD [100 заявок в день * 10 документов * 0,0015 USD за страницу до 1 млн страниц]
Общая стоимость = 17,50 USD [12,50 USD (логические выводы) + 1,50 USD (Textract) + 3 USD (обучение моделей) + 0,50 USD (хранение моделей)]
Пример 9: анализ ответов сотрудников на опрос
Вычисление общей стоимости:
Размер каждого запроса = 350 символов
Количество единиц за запрос = 4
Всего единиц: 100 000 (запросов) x 4 (единиц за запрос) = 400 000
Цена за единицу = 0,0001 USD (от 0 до 10 млн единиц)
Общая стоимость = [Кол‑во единиц] x [Стоимость единицы] = 400 000 x 0,0001 USD = 40,00 USD
Пример 10. Обнаружение токсичности в онлайн-комментариях на веб-сайте
Расчет общей стоимости:
Размер каждого запроса = 100 символов
Количество единиц за запрос = 1
Единицы = 100 млн единиц [100 млн комментариев x 1 единица на запрос]
Цена за единицу = 0,0001 USD [от 0 до 10 млн единиц] + 0,00005 USD [от 10 млн до 50 млн единиц] + 0,000025 USD [от 50 млн до 100 млн единиц]
Общая стоимость = [Кол‑во единиц] x [Стоимость единицы]
= [10 млн x 0,001 USD] + [40 млн x 0,00005 USD] + [50 млн x 0,000025 USD]
= 1000 USD + 2000 USD + 1250 USD
= 4250 USD
Пример 11. Обнаружение небезопасных запросов в приложении с генеративным искусственным интеллектом
Расчет общей стоимости:
Размер каждого запроса = 500 символов
Количество единиц на запрос = 5
Всего единиц = 50 млн единиц [10 млн комментариев x 5 единиц на запрос]
Цена за единицу = 0,0001 USD [от 0 до 10 млн единиц] + 0,00005 USD [от 10 млн до 50 млн единиц] + 0,000025 USD [от 50 млн до 100 млн единиц]
Общая стоимость = [Кол‑во единиц] x [Стоимость единицы]
= [10 млн x 0,001 USD] + [40 млн x 0,00005 USD]
= 1000 USD + 2000 USD
= 3000 USD
Подробнее о возможностях Amazon Comprehend