Publicado en: Jun 27, 2018

Amazon Comprehend es un servicio de procesamiento de lenguaje natural (NLP) que usa el aprendizaje automático para encontrar información y relaciones en el texto. A partir de hoy, los clientes tienen la opción de analizar un conjunto de documentos almacenados en un bucket de Amazon S3 con el nuevo servicio de trabajo asíncrono. Esto se suma a las llamadas síncronas a la REST API de uno o varios documentos, ya disponibles, que le ofrecen una variedad de opciones que se adaptan perfectamente a las necesidades de sus aplicaciones.

Las operaciones asíncronas son especialmente útiles para analizar grandes conjuntos de datos cuando la aplicación no necesita una respuesta en tiempo real desde el servicio. Por ejemplo, puede programar que un lote de análisis de texto se ejecute de forma diaria, semanal o incluso mensual. Con la opción asíncrona, el servicio ahora acepta documentos de hasta 100 Kb de tamaño, lo que elimina la necesidad de cortar documentos grandes a la hora de realizar el reconocimiento de las entidades nombradas (NER) y el análisis de las frases clave. (Nota: el tamaño máximo de archivo para la detección de opiniones asíncrona todavía se limita a 5 Kb por documento).

Con este lanzamiento, Amazon Comprehend ahora proporciona las siguientes operaciones:

  • Procesamiento síncrono de un solo documento — Realiza una llamada a Amazon Comprehend con un solo documento y recibe una respuesta síncrona.
  • Procesamiento síncrono de varios documentos (25 por solicitud) — Realiza una llamada a Amazon Comprehend con un conjunto de hasta 25 documentos y recibe una respuesta síncrona.
  • Procesamiento asíncrono por lotes (límite de tamaño de trabajo de 5 GB, 100 Kb de tamaño por documento) — Utilice un conjunto de documentos almacenados en un bucket de Amazon S3 y comience una operación asíncrona para analizar los documentos. Los resultados del análisis se devuelven en un bucket de S3.  

Consulte la documentación de Amazon Comprehend para obtener información sobre cómo empezar con operaciones de procesamiento asíncronas.