O Amazon Textract é um serviço de machine learning (ML) que extrai automaticamente texto impresso ou manuscrito e dados de documentos digitalizados. Esse recurso faz mais do que o simples reconhecimento óptico de caracteres (OCR): ele identifica, entende e extrai dados de formulários e tabelas. Com o Amazon Textract, o pagamento é feito conforme o uso. Não há taxas mínimas nem compromissos antecipados. O Amazon Textract cobra somente por páginas processadas, quer você extraia texto, texto com tabelas, dados de formulários, consultas ou processa faturas e documentos de identidade. Consulte as Perguntas frequentes para saber mais detalhes sobre as páginas e o uso aceitável do Amazon Textract.

O Amazon Textract tem quatro APIs diferentes: Detect Document Text, Analyze Document, Analyze Expense e Analyze ID.

A API Detect Document Text utiliza a tecnologia OCR para extrair texto e manuscritos de um documento.

A API Analyze Document tem três recursos: Forms, Tables e Queries. Você tem flexibilidade para chamar qualquer combinação de Forms, Tables e Queries.

  • A API Analyze Documento for Forms extrai dados como pares de chave-valor (“Nome” e valor associado, como “Jane Smith”). Também utiliza a tecnologia OCR para extrair todo o texto e manuscritos de um documento.
  • A API Analyze Document for Tables extrai dados tabulares ou de tabela organizados em colunas e linhas. Também utiliza a tecnologia OCR para extrair todo o texto e manuscritos de um documento.
  • A API Analyze Document for Queries oferece flexibilidade para especificar as informações necessárias de um documento (por exemplo, "Qual é o nome do cliente?") e receber esses dados (por exemplo, "Jane Doe") como parte da resposta. Você não precisa se preocupar com a estrutura dos dados no documento ou com as variações na forma como os dados são dispostos em diferentes formatos e versões do documento. Também utiliza a tecnologia OCR para extrair todo o texto e manuscritos de um documento.
A API Analyze Expense extrai dados, como ID da fatura ou N.º da fatura e o valor associado,12345, de faturas e recibos. O Amazon Textract reconhece esses termos como sendo o ID da fatura e o valor correspondente como 12345. O recurso permite usar uma taxonomia padrão de campos comuns. 
A API Analyze ID usa machine learning para entender o contexto de documentos de identidade, como passaportes, carteiras de motorista e outros. Você pode extrair automaticamente informações específicas como a data de vencimento ou a data de nascimento, além de identificar e extrair de forma inteligente as informações implícitas, como nome e endereço. Cada imagem de ID é considerada uma página.
 

Nível gratuito

Como parte do nível gratuito da AWS, você pode começar a usar o Amazon Textract gratuitamente. O nível gratuito dura três meses e novos clientes da AWS podem analisar até:

API Detect Document Text: 1.000 páginas por mês
API Analyze Document:

  • 100 páginas por mês ao usar o recurso Forms ou Tables
  • Um adicional de 100 páginas por mês ao usar o recurso Queries NOVO

API Analyze Expense: 100 páginas por mês
API Analyze ID: 100 páginas por mês

Preços das APIs do Amazon Textract

*A saída da API Analyze Document inclui OCR, independentemente do tipo de recurso selecionado
*As APIs Analyze Expense e Analyze ID não incluem OCR na saída

Exemplos de preços fora do nível gratuito

Exemplo de preço 1: API Detect Document Text

Vamos supor que você queira extrair o texto de 100 mil páginas de relatórios de pesquisa usando a API Detect Document Text. O preço por página na região Oeste dos EUA (Oregon) para o primeiro um milhão de páginas é de USD 0,0015, totalizando USD 150.

Total de páginas processadas = 100.000

Preço por página = USD 0,0015

Cobrança total por mês = USD 0,0015 * 100.000 = USD 150

Exemplo de preço 2: API Detect Document Text

Digamos que você queira extrair o texto de dois milhões de páginas de relatórios de pesquisa usando a API Detect Document Text. O preço por página na região Oeste dos EUA (Oregon) para o primeiro milhão de páginas é de USD 0,0015 e as páginas após um milhão custam USD 0,0006, portanto, para o processamento de dois milhões de páginas, o custo total seria de USD 2.100.

Total de páginas processadas = 2.000.000

Preço por página = USD 0,0015 para o primeiro milhão de páginas e USD 0,0006 para páginas além de um milhão

Cobrança total por mês = USD 0,0015 * 1.000.000 + USD 0,0006 * 1.000.000 = USD 1.500 + USD 600 = USD 2.100

Exemplo de preço 3: API Analyze Document (Forms e Tables)

Digamos que você queira extrair texto e dados estruturados de 5.000 páginas de formulários fiscais usando a API Analyze Document. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com tabelas é de USD 0,015 e com formulários é de USD 0,05, para um total de USD 325.

Total de páginas processadas = 5.000 páginas

Preço por página com tabela = USD 0,015

Preço da página com formulário (par de chave-valor) = USD 0,05

Cobrança total = USD 0,015*5.000 + USD 0,05 *5.000 = USD 75 + USD 250 = USD 325

Exemplo de preço 4: API Analyze Document (Forms e Tables)

Digamos que você queira extrair texto, formulários e tabelas de dois milhões de páginas de formulários fiscais usando a API Analyze Document. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com tabelas é de USD 0,015 e USD 0,01 por página após um milhão de páginas. Páginas com formulários custam USD 0,05 para um milhão de páginas e USD 0,04 por página após um milhão. O custo total seria de USD 115.000.

Total de páginas processadas = 2.000.000 páginas

Preço da página com formulário (par de chave-valor) = USD 0,05 para o primeiro 1 milhão e USD 0,04 para o próximo 1 milhão

Cobrança total = USD 0,015 * 1.000.000 + USD 0,01 * 1.000.000 + USD 0,05 * 1.000.000 + USD 0,04 * 1.000.000 = USD 15.000 + USD 10.000 + USD 50.000 + USD 40.000 = USD 115.000

Exemplo de preço 5: API Analyze Document (Queries)

Digamos que você queira extrair o texto de 5.000 páginas de formulários hipotecários usando a API Analyze Document. Você também deseja extrair 10 pontos de dados específicos de cada página por meio do recurso Queries. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas é de USD 0,015, totalizando USD 75.

Total de páginas processadas = 5.000 páginas

Preço por página com o Queries = USD 0,015

Cobrança total = USD 0,015 * 5.000 = USD 75

Exemplo de preço 6: API Analyze Document (Forms e Queries)

Digamos que você queira extrair texto e dados de tabelas de 5.000 páginas de formulários fiscais usando a API Analyze Document. Você também deseja extrair 10 pontos de dados específicos de cada página por meio do recurso Queries. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com os recursos Tables e Queries é de USD 0,020 e USD 0,015 por página após um milhão de páginas. O custo total seria de USD 100.

Total de páginas processadas = 5.000 páginas

Preço por página com o Tables e o Queries = USD 0,020

Cobrança total = USD 0,020 * 5.000 = USD 100

Exemplo de preço 7: API Analyze Document (Forms e Tables)

Digamos que você queira extrair os dados de texto e formulários (pares de chave-valor) de 5.000 páginas de formulários de seguro usando a API Analyze Document. Você também deseja extrair 10 pontos de dados específicos de cada página por meio do recurso Queries. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com os recursos Forms e Queries é de USD 0,055 e USD 0,045 por página após um milhão de páginas. O custo total seria de USD 275.

Total de páginas processadas = 5.000 páginas

Preço por página com o Forms (par de chave-valor) e o Queries = USD 0,055

Cobrança total = USD 0,055 * 5.000 = USD 275

Exemplo de preço 8: API Analyze Document (Forms, Tables e Queries)

Digamos que você queira extrair texto, formulários e tabelas de dois milhões de páginas de canhotos de pagamento usando a API Analyze Document. Você também deseja extrair 10 pontos de dados específicos de cada página por meio do recurso Queries. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com os recursos Tables, Forms e Queries é de USD 0,070 e USD 0,055 por página após um milhão de páginas. O custo total seria de USD 125.000.

Total de páginas processadas = 2.000.000 de páginas 

Preço por página com o Tables, o Forms e o Queries= USD 0,070 para o primeiro milhão e USD 0,055 para o próximo milhão 

Cobrança total = USD 0,070 * 1.000.000 + USD 0,055 * 1.000.000 = USD 70.000 + USD 55.000 = USD 125.000

Exemplo de preço 9: API Analyze Expense

Vamos supor que você queira extrair dados de 100.000 faturas usando a API Analyze Expense. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas é de USD 0,01 e você processa 100.000 faturas. O custo total seria de USD 1.000. Veja o cálculo abaixo: 

Total de páginas processadas = 100.000 

Preço por página = USD 0,01 

Cobrança total por mês = USD 0,01 * 100.000 = USD 1.000

Exemplo de preço 10: API Analyze Expense

Vamos supor que você queira extrair dados de 1.500.000 faturas usando a API Analyze Expense. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas é de USD 0,01 por página e USD 0,008 por página após um milhão. O custo total seria de USD 14.000. Veja o cálculo abaixo: 

Total de páginas processadas = 1.500.000 

Preço por página = USD 0,01 para o primeiro milhão e USD 0,008 para os próximos 500.000 

Cobrança total por mês = USD 0,01 * 1.000.000 + USD 0,008 * 500.000 = USD 14.000

Exemplo de preço 11: API Analyze ID

Suponha que você queira extrair informações de 100.000 documentos de identidade usando a API Analyze ID. O preço por página na região Oeste dos EUA (Oregon) para 100.000 páginas é USD 0,025 por página até 100.000 páginas. O custo total seria de USD 2.500. 

Total de páginas processadas = 100.000 

Preço por página = USD 0,025 

Cobrança total por mês = USD 0,025 * 100.000 = USD 2.500

Exemplo de preço 12: API Analyze ID

Suponha que você queira extrair informações de 600.000 documentos de identidade usando a API Analyze ID. O preço por página na região Oeste dos EUA (Oregon) para 100.000 páginas é de USD 0,025 por página e USD 0,01 por página após 100.000. O custo total seria de USD 7.500.

Total de páginas processadas = 600.000 

Preço por página = USD 0,025 para as primeiras 100.000 páginas e USD 0,01 para as próximas 500.000 

Cobrança total por mês = USD 0,025 * 100.000 + USD 0,01 * 500.000 = USD 7.500

Standard Product Icons (Features) Squid Ink
Confira as perguntas frequentes do Amazon Textract

Saiba mais sobre como o Amazon Textract extrai texto e dados estruturados de praticamente qualquer documento.

Saiba mais 
Sign up for a free account
Cadastre-se para obter uma conta gratuita

Obtenha acesso instantâneo ao nível gratuito da AWS. 

Cadastrar-se 
Standard Product Icons (Start Building) Squid Ink
Comece a criar no console

Comece a criar com o Amazon Textract no Console de Gerenciamento da AWS.

Cadastrar-se