Publicado: May 29, 2019

Temos o prazer de anunciar a disponibilidade geral do Amazon Textract, que estava em demonstração desde o re:invent 2018. O Amazon Textract é um serviço gerenciado de machine learning que extrai automaticamente texto e dados estruturados de praticamente qualquer documento. Os clientes usam o Amazon Textract para automatizar rapidamente fluxos de trabalho de documentos, processando milhões de páginas de documentos em algumas horas.

O Amazon Textract vai além do simples Optical Character Recognition (OCR – Reconhecimento óptico de caracteres) para identificar conteúdo de campos em formulários, informações armazenadas em tabelas e o contexto no qual as informações são apresentadas. A API do Amazon Textract oferece suporte a vários formatos de imagem como digitalizações, PDFs e fotografias. Os clientes podem usar o serviço com outros serviços de machine learning da AWS, como Amazon Comprehend, Amazon Comprehend Medical e Amazon Translate, para obter um significado mais profundo dos textos e dados extraídos. Além disso, os textos e dados extraídos podem ser usados para criar pesquisas inteligentes em grandes arquivamentos de documentos ou podem ser carregados em um banco de dados para uso por aplicativos como software de contabilidade, auditoria e conformidade. Para saber mais sobre o Amazon Textract, consulte o site do Amazon Textract.

O Amazon Textract já está disponível nas regiões da AWS Norte da Virgínia, Ohio, Oregon e Irlanda. Para começar a usar o Amazon Textract, leia o Guia de conceitos básicos.