O Amazon Comprehend é um serviço de processamento de linguagem natural (NLP) que usa Machine Learning para encontrar insights no texto. O Amazon Comprehend fornece APIs de extração de frases principais, análise de sentimentos, reconhecimento de entidades, modelagem de tópicos e detecção de idioma para que você possa integrar o processamento de linguagem natural a seus aplicativos. Basta chamar as APIs do Amazon Comprehend em seu aplicativo e fornecer a localização do documento ou texto de origem. As APIs emitirão uma saída com entidades, frases importantes, sentimentos e idioma em um formato JSON, que poderá ser usado no seu aplicativo.

Extração de frases-chave

A Keyphrase Extraction API retorna frases importantes ou pontos de fala, bem como uma pontuação de confiança, para confirmar que trata-se de uma frase importante.

Análise de sentimento

A Sentiment Analysis API retorna dados sobre o sentimento geral captado em um texto (Positivo, Negativo, Neutro ou Misto).

Análise sintática

A API Syntax do Amazon Comprehend possibilita aos clientes analisar texto usando tokenização e Parts of Speech (PoS – Partes da fala), além de identificar limites de palavras e rótulos, como substantivos e adjetivos, em um texto.

Reconhecimento de entidades

A API Entity Recognition retorna as entidades nomeadas ("Pessoas", "Lugares", "Locais" etc.) que são automaticamente categorizadas com base no texto fornecido.

Medical NERe (Named Entity and Relationship Extraction)

A API Medical NERe retorna as informações médicas, como medicamentos, condições médica, exames, tratamentos e procedimentos (TTP), anatomia e informações de saúde protegidas (PHI). Ela também identifica relações entre subtipos extraídos associados a medicamentos e TTP. Há também informações contextuais fornecidas como "traços" de entidades (negação ou se um diagnóstico é um sinal ou sintoma). A tabela abaixo mostra as informações extraídas com subtipos relevantes e traços de entidades.

Para extrair apenas PHI, você pode usar a API PHId (Protected Health Information Data Extraction and Identification).

Entidades personalizadas

As entidades personalizadas permitem que você personalize o Amazon Comprehend para identificar termos específicos ao seu domínio. Usando o AutoML, o Comprehend se informa a partir de um pequeno índice privado de exemplos (como uma lista de números de apólices e textos em que eles são usados) e, depois, treina um modelo personalizado e privado para reconhecer esses termos em outros blocos de texto. Não existem servidores a serem gerenciados nem algoritmos a serem aprendidos.

Detecção de idioma

A Language Detection API identifica automaticamente texto escrito em mais de 100 idiomas e retorna o idioma dominante com uma pontuação de confiança para confirmar que há um idioma dominante.

Classificação personalizada

A API de classificação personalizada permite que você crie facilmente modelos de classificação de texto personalizados usando rótulos específicos da empresa, sem necessidade de aprender ML. Por exemplo, a organização de suporte ao cliente pode usar a classificação personalizada para categorizar automaticamente solicitações de entrada por tipo de problema de acordo com a descrição do problema pelo cliente. A criação de um modelo personalizado é simples. Você fornece exemplos de texto para cada rótulo que quer usar e o Comprehend treina com base nesse exemplos para criar o modelo personalizado. Não é necessário ter nenhuma experiência em Machine Learning. Você pode criar um modelo personalizado sem usar uma única linha de código. Disponibilizamos um SDK para integrar o seu classificador de clientes aos aplicativos existentes. Com o modelo personalizado, é fácil moderar comentários de sites, selecionar feedback de clientes e organizar documentos do grupo de trabalho. Consulte esta página da documentação para obter mais detalhes.

Modelagem de tópicos

A Modelagem de tópicos identifica termos ou tópicos relevantes de uma coleção de documentos armazenados no Amazon S3. Ela identificará os tópicos mais comuns da coleção e os organizará em grupos; então os documentos são mapeados de acordo com o tópico ao qual pertencem.

  • Exemplo: Se os documentos (Doc1.txt, Doc2.txt, Doc3.txt e Doc4.txt) forem armazenados no Amazon S3 e você apontar o Amazon Comprehend para seus locais, o Comprehend analisará os documentos e retornará duas visualizações:

    1. Agrupamento de palavras-chave que são tópicos.

    Cada grupo de palavras-chave está associado a um grupo de tópicos. Peso refere-se à prevalência da palavra-chave dentro do grupo. As palavras-chave com peso próximo a 1 são as mais indicativas do contexto do grupo de tópicos.
    Grupo de tópicos Palavras-chave Peso
    1 Amazon 0,87
    1 Seattle 0,65
    2 Férias 0,78
    2 Compras 0,67
    Cada grupo de palavras-chave está associado a um grupo de tópicos. Peso refere-se à prevalência da palavra-chave dentro do grupo. As palavras-chave com peso próximo a 1 são as mais indicativas do contexto do grupo de tópicos.

    2. Agrupamento de documentos por tópicos.

    Nome do documento Grupo de tópicos Proporção
    Doc1.txt 1 0,87
    Doc2.txt 1 0,65
    Doc3.txt 2 0,78
    Doc4.txt 2 0,67
    Cada documento é mapeado para um grupo de tópicos baseado na proporção das palavras-chave com peso do grupo de tópicos que estão presentes no documento.

Suporte para vários idiomas

O Amazon Comprehend pode executar a análise de textos em inglês, francês, alemão, italiano, português e espanhol. Isso permite criar aplicativos que podem detectar textos em vários idiomas, converter texto para inglês ou espanhol com o Amazon Translate e usar o Amazon Comprehend para realizar a análise do texto.

Saiba mais sobre a definição de preço do Amazon Comprehend

Acesse a página de definição de preço
Pronto para começar?
Cadastrar-se
Mais dúvidas?
Entre em contato conosco