Amazon Comprehend es un servicio de procesamiento de lenguaje natural (NLP) que utiliza el aprendizaje automático para analizar textos. Amazon Comprehend proporciona API para la extracción de frases clave, análisis de opiniones, reconocimiento de entidades, modelado de temas y detección de idiomas que permiten integrar fácilmente el procesamiento de lenguaje natural en las aplicaciones. Basta con llamar a las API de Amazon Comprehend en una aplicación y proporcionar la ubicación del documento o el texto de origen. Las API producen entidades, frases clave, opiniones y lenguaje en formato JSON, que puede usar en su aplicación.

Extracción de frases claves

La API de extracción de frases clave produce frases clave o temas de conversación y una puntuación de confianza que respalda que se trata de una frase clave.

Análisis de opiniones

La API de análisis de opiniones produce la opinión general de un texto (positiva, negativa, neutra o una combinación) de estas.

Análisis sintáctico

La API Syntax de Amazon Comprehend permite a los clientes analizar texto con tokenización y categorías gramaticales, e identificar etiquetas y límites de palabras, como sustantivos y adjetivos, dentro del texto.

Reconocimiento de entidad

La API de reconocimiento de entidades devuelve las entidades nombradas (“Personas”, “Lugares”, “Ubicaciones”, etc.) que se categorizan de manera automática a partir del texto proporcionado.

Custom Entities

Custom Entities le permite personalizar Amazon Comprehend para identificar los términos que son específicos de su dominio. Con AutoML, Comprehend aprenderá de un pequeño índice privado de ejemplos (como una lista de números de póliza y el texto en el que se usan) y, a continuación, entrenará un modelo privado y personalizado para reconocer estos términos en otros bloques de texto. No hay servidores que administrar ni algoritmos que dominar.

Detección de idioma

La API de detección del idioma identifica automáticamente texto escrito en más de 100 idiomas y produce el idioma dominante con una puntuación de confianza para respaldar que un lenguaje es dominante.

Clasificación personalizada

La API de clasificación personalizada le permite crear fácilmente modelos de clasificación personalizada de textos utilizando las etiquetas específicas de su empresa sin tener que aprender ML. Por ejemplo, su organización de soporte al cliente puede usar la Clasificación personalizada para categorizar automáticamente las solicitudes entrantes por tipo de problema según cómo el cliente haya descrito el inconveniente. Crear un modelo personalizado es simple. Usted proporciona ejemplos de texto para cada una de las etiquetas que desea utilizar y Comprehend se basa en ellas para crear su modelo personalizado. No se requiere experiencia en aprendizaje automático, puede crear su modelo personalizado sin usar una sola línea de código. Hay un SDK disponible para que usted integre su clasificador de clientes a sus aplicaciones actuales. Con su modelo personalizado, es fácil moderar los comentarios de los sitios web, evaluar la opinión de los clientes y organizar los documentos de los grupos de trabajo. Consulte la página de documentación para obtener más información.

Modelado de tema

La creación de modelos de temas identifica términos o temas relevantes a partir de un conjunto de documentos almacenados en Amazon S3. Identifica los temas más comunes del conjunto y los organiza en grupos. A continuación, identifica qué documentos pertenecen a qué tema.

  • Ejemplo: si sus documentos (Doc1.txt, Doc2.txt, Doc3.txt y Doc4.txt) están almacenados en Amazon S3, y apunta Amazon Comprehend a su ubicación, Comprehend los analizará y producirá dos vistas:

    1. Agrupación de palabras clave que son temas.

    Cada grupo de palabras clave está asociado con un grupo de tema. El peso se refiere a la prevalencia de esa palabra clave en el grupo. Las palabras clave con el peso que más se acerca a 1 son las que más indican el contexto del grupo del tema.
    Grupo de temas Palabras claves Peso
    1 Amazon 0,87
    1 Seattle 0,65
    2 Vacaciones 0,78
    2 Compras 0,67
    Cada grupo de palabras clave está asociado con un grupo de tema. El peso se refiere a la prevalencia de esa palabra clave en el grupo. Las palabras clave con el peso que más se acerca a 1 son las que más indican el contexto del grupo del tema.

    2. Agrupación de documentos por temas.

    Nombre del documento Grupo de temas Proporción
    Doc1.txt 1 0,87
    Doc2.txt 1 0,65
    Doc3.txt 2 0,78
    Doc4.txt 2 0,67
    Cada documento se asigna a un grupo de tema en función de la proporción de las palabras clave ponderadas del grupo del tema presentes en el documento.

Compatibilidad con varios idiomas

Amazon Comprehend puede realizar análisis de textos en inglés, francés, alemán, italiano, portugués y español. Eso le permite crear aplicaciones capaces de detectar texto en numerosos idiomas, convertirlo al inglés, francés, alemán, italiano, portugués o español con Amazon Translate, y luego usar Amazon Comprehend para analizar el texto.

Más información sobre los precios de Amazon Comprehend

Visite la página de precios
¿Listo para comenzar?
Inscribirse
¿Tiene más preguntas?
Contacte con nosotros