O Amazon Comprehend é um serviço de processamento de linguagem natural (NLP) que usa Machine Learning para encontrar insights no texto. O Amazon Comprehend fornece APIs de extração de frases principais, análise de sentimentos, reconhecimento de entidades, modelagem de tópicos e detecção de idioma para que você possa integrar o processamento de linguagem natural a seus aplicativos. Basta chamar as APIs do Amazon Comprehend em seu aplicativo e fornecer a localização do documento ou texto de origem. As APIs emitirão uma saída com entidades, frases importantes, sentimentos e idioma em um formato JSON, que poderá ser usado no seu aplicativo.

Extração de frases-chave

A Keyphrase Extraction API retorna frases importantes ou pontos de fala, bem como uma pontuação de confiança, para confirmar que trata-se de uma frase importante.

  • Exemplo: neste exemplo, o cliente está comparando uma câmera digital DSLR com uma câmera instantânea de filme. A API extrai frases chave e retorna uma pontuação de confiança sobre os resultados.

    Texto de amostra: sou um fotógrafo entusiasmado pelo ofício e dou preferência à minha câmera digital DSLR ou à instantânea que carrego comigo para uso eventual. Apesar de não haver nenhum equipamento igual à minha DSLR em matéria de potência e conveniência, há algo mágico que envolve minha câmera instantânea de filme. Talvez seja o fato de você estar trabalhando com filme de verdade, ou então porque cada foto é um artefato físico único (o que é algo especial no mundo em que vivemos hoje, com Instagram e Facebook, onde uma dúzia de fotos sai por uma bagatela). O que sei é que é uma delícia trabalhar com essas máquinas, e os olhos das pessoas brilham quando você tira da bolsa uma câmera dessas em uma festa.

    Frase importante Confiança
    um fotógrafo entusiasmado 0,99
    minha DSLR 0,97
    minha câmera instantânea de filme 0,99
    uso eventual 0,99
    potência e conveniência 0,94
    filme de verdade 0,99
    cada foto 0,92
    um artefato físico único 0,99
    hoje 0,91
    mundo 0,99
    Instagram e Facebook 0,99

Análise de sentimento

A Sentiment Analysis API retorna dados sobre o sentimento geral captado em um texto (Positivo, Negativo, Neutro ou Misto).

Análise sintática

A API Syntax do Amazon Comprehend possibilita aos clientes analisar texto usando tokenização e Parts of Speech (PoS – Partes da fala), além de identificar limites de palavras e rótulos, como substantivos e adjetivos, em um texto.

Reconhecimento de entidades

A API Entity Recognition retorna as entidades nomeadas ("Pessoas", "Lugares", "Locais" etc.) que são automaticamente categorizadas com base no texto fornecido.

Comprehend Medical

Medical Named Entity and Relationship Extraction (NERe)

A API Medical NERe retorna as informações médicas, como medicamentos, condições médica, exames, tratamentos e procedimentos (TTP), anatomia e informações de saúde protegidas (PHI). Ela também identifica relações entre subtipos extraídos associados a medicamentos e TTP. Há também informações contextuais fornecidas como "traços" de entidades (negação ou se um diagnóstico é um sinal ou sintoma). A tabela abaixo mostra as informações extraídas com subtipos relevantes e traços de entidades.

Para extrair apenas PHI, você pode usar a API PHId (Protected Health Information Data Identification).

Medical Ontology Linking

As APIs Medical Ontology Linking identificam informações médias e as vinculam a códigos e conceitos em ontologias médicas padrão. As condições médicas são vinculadas a códigos ICD-10-CM (por exemplo, “dor de cabeça” é vinculada ao código “R51”) com a API InferICD10CM e os medicamentos são vinculados aos códigos RxNorm (“Acetaminofeno/codeína” é vinculado ao CUI “C2341132”). A API Medical Ontology Linking também detecta informações contextuais como características de entidade (por exemplo, negação).

Entidades personalizadas

O reconhecimento de entidades personalizado permite personalizar o Amazon Comprehend para identificar termos específicos de seu domínio. Usando o AutoML, o Comprehend aprenderá com um pequeno conjunto de exemplos (como uma lista de números de apólices, números de declarações ou SSN) e treinará um modelo particular personalizado para reconhecer esses termos, como números de declarações em qualquer outro bloco de texto em PDFs, texto simples ou documentos do Microsoft Word, sem necessidade de machine learning. 

Detecção de idioma

A Language Detection API identifica automaticamente texto escrito em mais de 100 idiomas e retorna o idioma dominante com uma pontuação de confiança para confirmar que há um idioma dominante.

Classificação personalizada

A API de classificação personalizada permite que você crie facilmente modelos de classificação de texto personalizados usando rótulos específicos da empresa, sem necessidade de aprender ML. Por exemplo, a organização de suporte ao cliente pode usar a classificação personalizada para categorizar automaticamente solicitações de entrada por tipo de problema de acordo com a descrição do problema pelo cliente. A criação de um modelo personalizado é simples. Você fornece exemplos de texto para cada rótulo que quer usar e o Comprehend treina com base nesse exemplos para criar o modelo personalizado. Não é necessário ter nenhuma experiência em Machine Learning. Você pode criar um modelo personalizado sem usar uma única linha de código. Disponibilizamos um SDK para integrar o seu classificador de clientes aos aplicativos existentes. Com o modelo personalizado, é fácil moderar comentários de sites, selecionar feedback de clientes e organizar documentos do grupo de trabalho. Consulte esta página da documentação para obter mais detalhes.

Modelagem de tópicos

A Modelagem de tópicos identifica termos ou tópicos relevantes de uma coleção de documentos armazenados no Amazon S3. Ela identificará os tópicos mais comuns da coleção e os organizará em grupos; então os documentos são mapeados de acordo com o tópico ao qual pertencem.

  • Exemplo: Se os documentos (Doc1.txt, Doc2.txt, Doc3.txt e Doc4.txt) forem armazenados no Amazon S3 e você apontar o Amazon Comprehend para seus locais, o Comprehend analisará os documentos e retornará duas visualizações:

    1. Agrupamento de palavras-chave que são tópicos.

    Cada grupo de palavras-chave está associado a um grupo de tópicos. Peso refere-se à prevalência da palavra-chave dentro do grupo. As palavras-chave com peso próximo a 1 são as mais indicativas do contexto do grupo de tópicos.
    Grupo de tópicos Palavras-chave Peso
    1 Amazon 0,87
    1 Seattle 0,65
    2 Férias 0,78
    2 Compras 0,67
    Cada grupo de palavras-chave está associado a um grupo de tópicos. Peso refere-se à prevalência da palavra-chave dentro do grupo. As palavras-chave com peso próximo a 1 são as mais indicativas do contexto do grupo de tópicos.

    2. Agrupamento de documentos por tópicos.

    Nome do documento Grupo de tópicos Proporção
    Doc1.txt 1 0,87
    Doc2.txt 1 0,65
    Doc3.txt 2 0,78
    Doc4.txt 2 0,67
    Cada documento é mapeado para um grupo de tópicos baseado na proporção das palavras-chave com peso do grupo de tópicos que estão presentes no documento.

Suporte para vários idiomas

O Amazon Comprehend pode executar a análise de textos em inglês, francês, alemão, italiano, português e espanhol. Isso permite criar aplicativos que podem detectar textos em vários idiomas, converter texto para inglês ou espanhol com o Amazon Translate e usar o Amazon Comprehend para realizar a análise do texto.

Saiba mais sobre a definição de preço do Amazon Comprehend

Acesse a página de definição de preço
Pronto para começar?
Cadastrar-se
Tem outras dúvidas?
Entre em contato conosco