Publicado en: May 29, 2019
Nos complace anunciar la disponibilidad general de Amazon Textract, que solo se encontraba en versión preliminar desde re:invent 2018. Amazon Textract es un servicio de aprendizaje automático administrado que extrae texto y datos estructurados de forma automática a partir de prácticamente cualquier documento. Con Amazon Textract, los clientes pueden automatizar rápidamente flujos de trabajo de documentos mediante el procesamiento de millones de páginas de documentos en unas pocas horas.
Amazon Textract no se limita al simple reconocimiento óptico de caracteres (OCR) para identificar contenido de campos de formularios, información almacenada en tablas y el contexto en el cual aparece la información. La API de Amazon Textract admite varios formatos de imágenes como escaneos, PDF y fotos, y los clientes pueden utilizarla con otros servicios de aprendizaje automático de AWS como Amazon Comprehend, Amazon Comprehend Medical y Amazon Translate para obtener información significativa de mayor relevancia a partir de los datos y los textos extraídos. Los datos y textos extraídos también se pueden usar para crear búsquedas inteligentes en archivos grandes de documentos o bien cargarlos en una base de datos para que los utilicen aplicaciones, como software contable, de conformidad y auditorías. Si desea obtener más información sobre este servicio, visite el sitio web de Amazon Textract.
Amazon Textract ya se encuentra disponible en las siguientes regiones de AWS: norte de Virginia, Ohio, Oregón e Irlanda. Para empezar a usar Amazon Textract, lea la guía de introducción.