O Amazon Textract é um serviço de machine learning (ML) que extrai automaticamente texto impresso ou manuscrito e dados de documentos digitalizados. Esse recurso faz mais do que o simples reconhecimento óptico de caracteres (OCR): ele identifica, entende e extrai dados de formulários e tabelas. Com o Amazon Textract, o pagamento é feito conforme o uso. Não há taxas mínimas nem compromissos antecipados. O Amazon Textract cobra somente por páginas processadas, quer você extraia texto, texto com tabelas, dados de formulários, consultas ou processa faturas e documentos de identidade. Consulte as Perguntas frequentes para saber mais detalhes sobre as páginas e o uso aceitável do Amazon Textract.

O Amazon Textract tem cinco APIs diferentes: Detect Document Text, Analyze Document, Analyze Expense, Analyze ID e Analyze Lending.

A API Detect Document Text utiliza a tecnologia OCR para extrair texto e manuscritos de um documento.

A API Analyze Document tem quatro recursos: Forms, Tables, Queries e Signatures. Você tem a flexibilidade de chamar qualquer combinação de Forms, Tables, Queries e Signatures.

  • A API Analyze Document for Forms extrai dados como pares de chave-valor (“Nome” e valor associado, como “Jane Smith”). Também utiliza a tecnologia OCR para extrair todo o texto e manuscritos de um documento.
  • A API Analyze Document for Tables extrai dados tabulares ou de tabela organizados em colunas e linhas. Também utiliza a tecnologia OCR para extrair todo o texto e manuscritos de um documento.
  • A API Analyze Document for Queries oferece flexibilidade para especificar as informações necessárias de um documento (por exemplo, "Qual é o nome do cliente?") e receber esses dados (por exemplo, "Jane Doe") como parte da resposta. Você não precisa se preocupar com a estrutura dos dados no documento ou com as variações na forma como os dados são dispostos em diferentes formatos e versões do documento. Também utiliza a tecnologia OCR para extrair todo o texto e manuscritos de um documento.
  • A API Analyze Document para consultas personalizadas oferece a capacidade de chamar o recurso de consultas personalizadas para documentos específicos de sua empresa. Você treina um adaptador usando o console da AWS e usa o identificador do adaptador em sua solicitação da API Analyze Document para usar consultas personalizadas.
  • A API Analyze Document for Signatures permite detectar assinaturas manuscritas, assinaturas eletrônicas e iniciais em qualquer documento ou imagem. Também utiliza a tecnologia OCR para extrair todo o texto e manuscritos de um documento.

 

A API Analyze ID usa machine learning para entender o contexto de documentos de identidade, como passaportes, carteiras de motorista e outros. Você pode extrair automaticamente informações específicas como a data de vencimento ou a data de nascimento, além de identificar e extrair de forma inteligente as informações implícitas, como nome e endereço. Cada imagem de ID é considerada uma página.
 
A API Analyze Lending é uma API especializada de processamento de documentos de hipoteca que automatiza a classificação e a extração de informações de diversos documentos de solicitações relacionadas a hipotecas. Os modelos de machine learning da Analyze Lending foram pré-treinados em vários tipos de documentos vistos em um pacote típico de solicitações de hipoteca. A Analyze Lending classificará, dividirá e extrairá os resultados com precisão e fornecerá um resumo de seus resultados, inclusive se uma assinatura foi detectada na página ou não.
 

Solicitar um orçamento personalizado

Para um volume alto de casos de uso, entre em contato com nossa equipe de vendas para solicitar uma proposta de preços personalizada.

Nível gratuito

Como parte do nível gratuito da AWS, você pode começar a usar o Amazon Textract gratuitamente. O nível gratuito dura três meses e novos clientes da AWS podem analisar até:

API Detect Document Text: 1.000 páginas por mês
API Analyze Document:

  • 1.000 páginas por mês ao usar somente o recurso Signatures
  • 100 páginas por mês ao usar os recursos de formulários, tabelas e layout
  • 100 páginas por mês cada para consultas, formulários + consultas, tabelas + consultas, formulários + tabelas + consultas
  • Não há nível gratuito para consultas personalizadas

API Analyze Expense: 100 páginas por mês

API Analyze ID: 100 páginas por mês

API Analyze Lending: 2.000 páginas por mês

Preços das APIs do Amazon Textract

Recursos pré-treinados

**A API Analyze Document vem com OCR incluído, independentemente do tipo de recurso selecionado
*As APIs Analyze Expense e Analyze ID incluem OCR na saída

Recursos pré-treinados e personalizados

Exemplos de preços fora do nível gratuito

Exemplo de preço 1: API Detect Document Text

Vamos supor que você queira extrair o texto de 100 mil páginas de relatórios de pesquisa usando a API Detect Document Text. O preço por página na região Oeste dos EUA (Oregon) para o primeiro um milhão de páginas é de USD 0,0015, totalizando USD 150.

Total de páginas processadas = 100.000

Preço por página = USD 0,0015

Cobrança total por mês = USD 0,0015 * 100.000 = USD 150

Exemplo de preço 2: API Detect Document Text

Digamos que você queira extrair o texto de dois milhões de páginas de relatórios de pesquisa usando a API Detect Document Text. O preço por página na região Oeste dos EUA (Oregon) para o primeiro milhão de páginas é de USD 0,0015 e as páginas após um milhão custam USD 0,0006, portanto, para o processamento de dois milhões de páginas, o custo total seria de USD 2.100.

Total de páginas processadas = 2.000.000

Preço por página = USD 0,0015 para o primeiro milhão de páginas e USD 0,0006 para páginas além de um milhão

Cobrança total por mês = USD 0,0015 * 1.000.000 + USD 0,0006 * 1.000.000 = USD 1.500 + USD 600 = USD 2.100

Exemplo de preço 3: API Analyze Document (Forms e Tables)

Digamos que você queira extrair texto e dados estruturados de 5.000 páginas de formulários fiscais usando a API Analyze Document. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com tabelas é de USD 0,015 e com formulários é de USD 0,05, para um total de USD 325.

Total de páginas processadas = 5.000 páginas

Preço por página com tabela = USD 0,015

Preço da página com formulário (par de chave-valor) = USD 0,05

Cobrança total = USD 0,015*5.000 + USD 0,05 *5.000 = USD 75 + USD 250 = USD 325

Exemplo de preço 4: API Analyze Document (Forms e Tables)

Digamos que você queira extrair texto, formulários e tabelas de dois milhões de páginas de formulários fiscais usando a API Analyze Document. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com tabelas é de USD 0,015 e USD 0,01 por página após um milhão de páginas. Páginas com formulários custam USD 0,05 para um milhão de páginas e USD 0,04 por página após um milhão. O custo total seria de USD 115.000.

Total de páginas processadas = 2.000.000 páginas

Preço da página com formulário (par de chave-valor) = USD 0,05 para o primeiro 1 milhão e USD 0,04 para o próximo 1 milhão

Cobrança total = USD 0,015 * 1.000.000 + USD 0,01 * 1.000.000 + USD 0,05 * 1.000.000 + USD 0,04 * 1.000.000 = USD 15.000 + USD 10.000 + USD 50.000 + USD 40.000 = USD 115.000

Exemplo de preço 5: API Analyze Document (Queries)

Digamos que você queira extrair o texto de 5.000 páginas de formulários hipotecários usando a API Analyze Document. Você também deseja extrair 10 pontos de dados específicos de cada página por meio do recurso Queries. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas é de USD 0,015, totalizando USD 75.

Total de páginas processadas = 5.000 páginas

Preço por página com o Queries = USD 0,015

Cobrança total = USD 0,015 x 5.000 = USD 75

Exemplo de preço 6: API Analyze Document (Forms, Tables e Queries)

Digamos que você queira extrair texto, formulários e tabelas de dois milhões de páginas de canhotos de pagamento usando a API Analyze Document. Você também deseja extrair 10 pontos de dados específicos de cada página por meio do recurso Queries. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com os recursos Tables, Forms e Queries é de USD 0,070 e USD 0,055 por página após um milhão de páginas. O custo total seria de USD 125.000.

Total de páginas processadas = 2.000.000 de páginas 

Preço por página com o Tables, o Forms e o Queries= USD 0,070 para o primeiro milhão e USD 0,055 para o próximo milhão 

Cobrança total = USD 0,070 x 1.000.000 + USD 0,055 x 1.000.000 = USD 70.000 + USD 55.000 = USD 125.000

Exemplo de preço 7: API Analyze Document (Forms e Tables)

Digamos que você queira extrair texto e dados de tabelas de 5.000 páginas de formulários fiscais usando a API Analyze Document. Você também deseja extrair 10 pontos de dados específicos de cada página por meio do recurso Queries. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com os recursos Tables e Queries é de USD 0,020 e USD 0,015 por página após um milhão de páginas. O custo total seria de USD 100.

Total de páginas processadas = 5.000 páginas

Preço por página com o Tables e o Queries = USD 0,020

Cobrança total = USD 0,020 x 5.000 = USD 100

Exemplo de preço 8: API Analyze Document (Signatures)

Digamos que você queira detectar assinaturas e extrair o texto de 100 mil páginas de formulários hipotecários usando a API Analyze Document
: tipo do recurso Signatures. Os preços por página na região Oeste dos EUA (Oregon) para o primeiro milhão de páginas é de USD 0,0035, totalizando um custo de
USD 350.
Total de páginas processadas = 100.000
Preço por página = USD 0,0035
Cobrança total por mês = USD 0,00035 * 100.000 = USD 350

Exemplo de preço 9: API Analyze Document (Signatures)

Digamos que você queira detectar assinaturas e extrair o texto de cinco milhões de páginas de formulários hipotecários usando a API Analyze Document
: tipo do recurso Signatures. Os preços por página na região Oeste dos EUA (Oregon) para o primeiro milhão de páginas é de USD 0,00035, totalizando um custo de USD 20.
Total de páginas processadas = 5.000.000
Preço por página para o primeiro 1 milhão de páginas = USD 0,0035 x 1.000.000 = USD 3.500
Preço por página para os quatro milhões de páginas seguintes = USD 0,0014 x 4.000.000 = USD 5.600
Total = USD 3500 + USD 5600 = USD 9100

Exemplo de preço 10: API Analyze Expense

Vamos supor que você queira extrair dados de 100.000 faturas usando a API Analyze Expense. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas é de USD 0,01 e você processa 100.000 faturas. O custo total seria de USD 1.000. Veja o cálculo abaixo: 

Total de páginas processadas = 100.000 

Preço por página = USD 0,01 

Cobrança total por mês = USD 0,01 x 100.000 = USD 1.000

Exemplo de preço 11: API Analyze Expense

Vamos supor que você queira extrair dados de 1.500.000 faturas usando a API Analyze Expense. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas é de USD 0,01 por página e USD 0,008 por página após um milhão. O custo total seria de USD 14.000. Veja o cálculo abaixo: 

Total de páginas processadas = 1.500.000 

Preço por página = USD 0,01 para o primeiro milhão e USD 0,008 para os próximos 500.000 

Cobrança total por mês = USD 0,01 x 1.000.000 + USD 0,008 x 500.000 = USD 14.000

Exemplo de preço 12: API Analyze ID

Vamos supor que você queira extrair informações de 100.000 documentos de identidade usando a API Analyze ID. O preço por página na região Oeste dos EUA (Oregon) para 100.000 páginas é USD 0,025 por página até 100.000 páginas. O custo total seria de USD 2.500. 

Total de páginas processadas = 100.000 

Preço por página = USD 0,025 

Cobrança total por mês = USD 0,025 x 100.000 = USD 2.500

Exemplo de preço 13: API Analyze ID

Vamos supor que você queira extrair informações de 600.000 documentos de identidade usando a API Analyze ID. O preço por página na região Oeste dos EUA (Oregon) para 100.000 páginas é de USD 0,025 por página e USD 0,01 por página após 100.000. O custo total seria de USD 7.500.

Total de páginas processadas = 600.000

Preço por página = USD 0,025 para as primeiras 100.01 páginas e USD 500,000 para as próximas 500.000

Cobrança total por mês = USD 0,025 * 100.000 + USD 0,01 * 500.000 = USD 7.500

Exemplo de preço 14: API Analyze Lending

Suponha que você queira extrair informações de 200.000 páginas de documentos de empréstimo hipotecário usando a API Analyze Lending. O preço por página na região Oeste dos EUA (Oregon) é de USD 0,07 por página por página para até um milhão de páginas. Das 200 mil páginas que você processou, a Analyze Lending forneceu classificação e extração para os tipos de documento compatíveis, resultando em 100 mil páginas de classificação e extração de dados. O custo total seria de USD 7.000 para as 100 mil páginas.

Total de páginas processadas = 200.000

Total de páginas compatíveis com classificação e extração = 100.000 

Preço por página = USD 0,07

Cobrança total por mês = USD 0,07 * 100.000 = USD 7.000

Exemplo de preço 15: API Analyze Lending

Suponha que você queira extrair informações de 2.000.000 páginas de documentos de empréstimo hipotecário usando a API Analyze Lending. O preço por página na região Oeste dos EUA (Oregon) é de USD 0,07 por página por página para até um milhão de páginas e de USD 0,055 por página após 1 milhão. Dos 2 milhões de páginas que você processou, a Analyze Lending forneceu classificação e extração para os tipos de documento compatíveis, resultando em 1.200.000 páginas de classificação e extração de dados. O custo total seria de USD 81.000 para 1.200.000 páginas.

Total de páginas processadas = 2.000.000

Total de páginas compatíveis com classificação e extração = 1.200.000

Preço por página = USD 0,07 para o primeiro milhão de páginas e USD 0,055 para as próximas 200 mil

Cobrança total por mês = USD 0,07 * 1.000.000 + USD 0,055 * 200.000 = USD 81.000

Exemplo de preço 16 – API Analyze Document – Layout e Tabelas

Você precisa extrair o layout e as tabelas de dois milhões de páginas de relatórios financeiros usando a API Analyze Document. O layout está disponível gratuitamente quando usado com o recurso Tabelas. O preço das tabelas na região Oeste dos EUA (Oregon) é de USD 0,015 por página para as primeiras 1 milhão de páginas em um mês e USD 0,010 por página para as páginas que excedem 1 milhão de páginas em um mês.

Total de páginas processadas = 2.000.000 de páginas

Preço das primeiras 1 milhão de páginas = USD 0,015 * 1.000.000 = USD 15.000

Preço para as próximas 1 milhão de páginas = USD 0,010 * 1.000.000 = USD 10.000

Cobrança total = USD 25.000

Exemplo de preço 17: API Analyze Document - Consultas personalizadas

Você precisa extrair dados de 5 milhões de páginas usando consultas personalizadas. O preço na região Oeste dos EUA (Oregon) é de USD 0,025 por página para as primeiras 1 milhão de páginas em um mês e USD 0,015 por página para as páginas que excederem 1 milhão de páginas em um mês.

Total de páginas processadas = 5.000.000

Preço das primeiras 1 milhão de páginas = USD 0,025 * 1000000 = USD 25.000

Preço para os próximos 4 milhões de páginas = USD 0,015 * 4.000.000 = USD 60.000

Cobrança total = USD 85.000

Exemplo de preço 18 - API de análise de documentos – Formulários pré-treinados e consultas personalizadas

Você precisa extrair pontos de dados de 2 milhões de páginas usando formulários pré-treinados e consultas personalizadas. O preço na região Oeste dos EUA (Oregon) é de USD 0,065 por página para as primeiras 1 milhão de páginas em um mês e USD 0,050 por página para as páginas que excederem 1 milhão de páginas em um mês.

Total de páginas processadas = 2.000.000 de páginas

Preço das primeiras 1 milhão de páginas = USD 0,065 * 1.000.000 = USD 65.000

Preço para as próximas 1 milhão de páginas = USD 0,050 * 1.000.000 = USD 50.000

Cobrança total = USD 115.000

Confira as perguntas frequentes do Amazon Textract

Saiba mais sobre como o Amazon Textract extrai texto e dados estruturados de praticamente qualquer documento.

Saiba mais 
Cadastre-se para obter uma conta gratuita

Obtenha acesso instantâneo ao nível gratuito da AWS. 

Cadastrar-se 
Comece a criar no console

Comece a criar com o Amazon Textract no Console de Gerenciamento da AWS.

Cadastre-se