O que faz esta Implementação de soluções da AWS?

A Document Understanding Solution (DUS) fornece um aplicativo Web fácil de usar que consome e analisa arquivos, extrai texto de documentos, identifica dados estruturais (tabelas, pares de chave/valor), extrai informações críticas (entidades) e cria índices de pesquisa inteligente a partir dos dados. Além disso, os arquivos podem ser carregados diretamente por upload, e os arquivos analisados podem ser acessados de um bucket do Amazon Simple Storage Service (Amazon S3) na sua conta da AWS.

Essa solução usa serviços de inteligência artificial (IA) da AWS que tratam de problemas de negócios aplicáveis a vários setores verticais da indústria:

  • Pesquisa e descoberta: procure informações em vários documentos digitalizados, PDFs e imagens
  • Conformidade: retire informações de documentos
  • Automação do fluxo de trabalho: conecte-se facilmente a aplicações upstream e downstream existentes 

 

Visão geral da Implementação de soluções da AWS

O diagrama abaixo apresenta a arquitetura que você pode implantar automaticamente usando o guia de implementação da solução e o respectivo modelo do AWS CloudFormation.

Document Understanding Solution | Diagrama da arquitetura

Arquitetura da Document Understanding Solution

O modelo do AWS CloudFormation implanta um aplicativo web estático hospedado em um bucket do Amazon S3 e servido por uma distribuição do Amazon CloudFront. Os usuários são autenticados usando o Amazon Cognito. O aplicativo web interage com o back-end usando uma API do Amazon API Gateway, com o suporte de uma função do AWS Lambda. Os documentos são carregados por upload usando o aplicativo web ou diretamente em um bucket dedicado do Amazon S3 para processamento em massa. O processamento dos documentos é iniciado pela API, que aciona uma função do Lambda para adicionar uma entrada a uma tabela do Amazon DynamoDB. Essa tabela aciona uma segunda função do Lambda que supervisiona o processamento. O formato de arquivo do upload determina a rota de processamento. O Amazon Textract extrai texto e informações estruturais dos arquivos. O texto extraído é então transmitido ao Amazon Comprehend e ao Amazon Comprehend Medical para análise adicional.

As análises resultantes são armazenadas em um bucket do Amazon S3, e os metadados são armazenados em um banco de dados do DynamoDB. As informações extraídas são usadas para indexar o documento no Amazon Elasticsearch Service (Amazon ES) e, se habilitado, no Amazon Kendra.

Document Understanding Solution

Versão 1.0.1
Data de lançamento: 01/2021
Autor: AWS

Tempo de implantação estimado: 30-60 min

Código-fonte  Modelo do CloudFormation 
Use o botão abaixo para se inscrever nas atualizações desta Implementação de solução.
Observação: para assinar atualizações RSS, você deve ter um plug-in RSS habilitado para o navegador que está usando.
A implementação desta solução ajudou você?
Fornecer feedback 

Recursos

Pesquisa e descoberta

Pesquise informações em vários documentos digitalizados, PDFs e imagens

Aproveite os serviços de IA da AWS

Use o Amazon Ttract para extrair informações estruturais e de texto dos arquivos e, em seguida, transmiti-las ao Amazon Comprehend e ao Amazon Comprehend Medical para uma análise mais profunda.

Conformidade

Oculte informações em documentos.
Ícone Construir
Implante você mesmo uma solução

Explore nossa biblioteca de Implementações de soluções da AWS para obter respostas para problemas comuns de arquitetura.

Saiba mais 
Encontre um parceiro da APN
Encontre um parceiro da APN

Encontre parceiros de consultoria e tecnologia certificados da AWS para ajudar você a começar.

Saiba mais 
Ícone Explorar
Explore ofertas de consultoria de soluções

Explore nosso portfólio de Ofertas de consultoria para obter ajuda aprovada pela AWS com a implantação de soluções.

Saiba mais