Amazon Textract

Extraia facilmente textos e dados de praticamente qualquer documento

O Amazon Textract é um serviço que extrai automaticamente texto e dados de documentos digitalizados. O Amazon Textract vai além do simples Optical Character Recognition (OCR – Reconhecimento óptico de caracteres) para também identificar o conteúdo de campos em formulários e informações armazenadas em tabelas.

Hoje, Muitas empresas extraem dados de documentos e formulários por meio da entrada manual de dados, lenta e de alto custo, ou de software de reconhecimento óptico de caracteres (OCR), simples e difícil de personalizar. Muitas vezes, as regras e os fluxos de trabalho para cada documento e formulário precisam ser codificados e atualizados a cada mudança no formulário ou quando vários formulários são usados. Se um formulário deixar de seguir as regras, a saída poderá ficar embaralhada e inutilizável.

O Amazon Textract supera esses desafios usando machine learning para ler instantaneamente quase todos os tipos de documentos e extrair com precisão textos e dados, sem necessidade de tarefas manuais ou código personalizado. Com o Textract, você pode automatizar rapidamente fluxos de trabalho de documentos, o que permite processar milhões de páginas de documentos em algumas horas. Após a captura das informações, você pode tratá-las em aplicativos empresariais para acionar as próximas etapas de processamento de uma solicitação de empréstimo ou de reembolso de despesas médicas. Além disso, você pode criar índices de pesquisa inteligentes, criar fluxos de trabalho de aprovação automática e manter melhor a conformidade com regras de arquivamento de documentos, marcando os dados que podem exigir alteração.

Apresentação do Amazon Textract

Benefícios

Extraia dados com rapidez e precisão

O Amazon Textract facilita a extração rápida e precisa de dados de documentos e formulários. O Amazon Textract detecta automaticamente o layout de um documento e os principais elementos da página, compreende as relações de dados em todos os formulários ou tabelas incorporados e extrai tudo mantendo o contexto intacto. Isso significa que você pode usar instantaneamente os dados extraídos em um aplicativo ou armazená-los em um banco de dados, sem necessidade de grande quantidade de código complexo entre as etapas.



Sem manutenção de código ou modelos

Os modelos pré-treinados de machine learning do Amazon Textract eliminam a necessidade de escrever código para extração de dados, pois já foram treinados em dezenas de milhões de documentos de praticamente todos os setores, incluindo faturas, recibos, contratos, documentos fiscais, pedidos de venda, formulários de inscrição, solicitação de benefícios, reclamações de seguro e documentos de políticas, entre muitos outros. Não é mais necessário manter código para cada documento ou formulário que você pode receber ou se preocupar com a mudança de layout das páginas ao longo do tempo.

Reduza os custos de processamento de documentos

A API de extração de texto do Amazon Textract permite processar 1.000 páginas de documentos por 1,50 USD. Não importa se você processa algumas centenas ou vários milhões de documentos por ano. O Amazon Textract oferece OCR e extração de dados estruturados (formulários e tabelas) a um custo muito baixo e você paga apenas pelo que usa. Não há compromissos antecipados nem contratos de longo prazo.

Casos de uso

Crie índices de pesquisa inteligentes

Extraia dados estruturados de documentos e crie um índice inteligente usando o Amazon Elasticsearch Service para poder pesquisar rapidamente milhões de demonstrações financeiras. Por exemplo, uma companhia hipotecária pode usar o Amazon Textract para processar milhões de solicitações de empréstimo digitalizadas em algumas horas e indexar os dados extraídos no Amazon Elasticsearch. Assim, a companhia poderia criar experiências de pesquisa como “pesquisar solicitações de empréstimo onde o nome do solicitante é João da Silva” ou “pesquisar contratos em que a taxa de juros é de 2%”.

Crie fluxos de trabalho de processamento automático de documentos

O Amazon Textract pode fornecer as entradas necessárias para processar automaticamente formulários, sem intervenção humana. Por exemplo, um banco poderia criar código para ler PDFs de solicitações de empréstimos. As informações contidas no documento podem ser usadas para acionar todas as verificações de antecedentes e de crédito necessárias para aprovar o empréstimo. Dessa forma, os clientes obtêm resultados instantâneos para as solicitações e não precisam esperar vários dias pelos resultados de análise e validação manuais.

Mantenha a conformidade em arquivamentos de documentos

Como o Amazon Textract identifica automaticamente tipos de dados e rótulos de formulários, é fácil manter a conformidade com controles de informações. Por exemplo, uma seguradora pode usar o Amazon Textract para alimentar um fluxo de trabalho que elimina automaticamente Personally Identifiable Information (PII – Informações de identificação pessoal) para revisão antes do arquivamento de formulários de sinistros, reconhecendo automaticamente os pares chave-valor importantes que exigem proteção.

Product-Page_Standard-Icons_01_Product-Features_SqInk
Confira os recursos do Amazon Textract

Saiba mais sobre como o Amazon Textract detecta pares chave-valor, preserva dados tabulares e outras ações.

Saiba mais 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Cadastre-se para obter uma conta gratuita

Obtenha acesso instantâneo ao nível gratuito da AWS. 

Cadastrar-se 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Cadastre-se na demonstração do Amazon Textract

Comece a criar com o Amazon Textract cadastrando-se para acessar a demonstração.

Cadastrar-se