Amazon Comprehend – это сервис обработки естественного языка (NLP), в котором для обнаружения в тексте аналитических данных применяются технологии машинного обучения. Amazon Comprehend предоставляет отдельные API для извлечения ключевых фраз, анализа эмоций, распознавания сущностей, моделирования тем и определения языка. Это позволяет просто встраивать механизмы обработки естественного языка в приложения. Для интеграции достаточно вызвать API сервиса Amazon Comprehend в приложении и передать информацию о местоположении исходного документа или текста. API выдаст сущности, ключевые фразы, эмоции и язык в формате JSON, и эту информацию можно использовать в приложении.

Извлечение ключевых фраз

API для извлечения ключевых фраз возвращает ключевые фразы или основные тезисы, а также уровень уверенности для каждой ключевой фразы.

Анализ эмоций

API анализа эмоций возвращает общий эмоциональный тон текста (положительный, отрицательный, нейтральный или смешанный).

Синтаксический анализ

Syntax API в Amazon Comprehend позволяет клиентам анализировать текст с использованием токенизации и частей речи (PoS), чтобы определять границы слов и метки, например имена существительные и прилагательные в тексте.

Распознавание сущностей

API распознавания сущностей возвращает именованные сущности ("People," "Places," "Locations" и т. д.), которые автоматически группируются по категориям на основании предоставленного текста.

Определение языка

API обнаружения языка автоматически обнаруживает текст, написанный более чем на 100 языках, и возвращает основной язык и уровень уверенности в том, что этот язык является основным.

Моделирование тем

API моделирования тем обнаруживает актуальные термины или темы в массиве документов, хранящихся в Amazon S3. Этот API определяет наиболее распространенные темы в массиве и организует их по группам, после чего связывает каждый документ с соответствующей темой.

  • Пример. Если документы (Doc1.txt, Doc2.txt, Doc3.txt и Doc4.txt) хранятся в Amazon S3 и вы передаете их местоположение в Amazon Comprehend, Comprehend проанализирует документы и вернет два результата.

    1. Группы ключевых слов, которые являются темами.

    Каждая группа ключевых слов связанной с группой тем. Вес обозначает преобладание ключевого слова в группе. Ключевые слова с весом, близким к 1, лучше всего характеризуют контекст группы тем.
    Группа тем Ключевые слова Вес
    1 Amazon 0,87
    1 Сиэтл 0,65
    2 Праздники 0,78
    2 Покупки 0,67
    Каждая группа ключевых слов связанной с группой тем. Вес обозначает преобладание ключевого слова в группе. Ключевые слова с весом, близким к 1, лучше всего характеризуют контекст группы тем.

    2. Распределение документов по темам.

    Название документа Группа тем Пропорция
    Doc1.txt 1 0,87
    Doc2.txt 1 0,65
    Doc3.txt 2 0,78
    Doc4.txt 2 0,67
    Каждый документ связывается с группой тем на основании пропорции взвешенных ключевых слов из группы тем, присутствующих в документе.

Поддержка различных языков

Amazon Comprehend может анализировать текст на английском и испанском языках. Это позволяет создавать приложения, обнаруживающие текст на множестве языков, переводить текст на английский или испанский с помощью Amazon Translate, а затем использовать Amazon Comprehend для анализа текста.

Подробнее о ценах на Amazon Comprehend

Перейти на страницу цен
Готовы начать работу?
Регистрация
Есть вопросы?
Свяжитесь с нами