O Amazon Textract é um serviço de machine learning (ML) que extrai automaticamente texto impresso ou manuscrito e dados de documentos digitalizados. Esse recurso faz mais do que o simples reconhecimento óptico de caracteres (OCR): ele identifica, entende e extrai dados de formulários e tabelas. Com o Amazon Textract, o pagamento é feito conforme o uso. Não há taxas mínimas nem compromissos antecipados. O Amazon Textract cobra somente por páginas processadas, quer você extraia texto, texto com tabelas, dados de formulários, consultas ou processa faturas e documentos de identidade. Consulte as Perguntas frequentes para saber mais detalhes sobre as páginas e o uso aceitável do Amazon Textract.

O Amazon Textract tem quatro APIs diferentes: Detect Document Text, Analyze Document, Analyze Expense e Analyze ID.

A API Detect Document Text utiliza a tecnologia OCR para extrair texto e manuscritos de um documento.

A API Analyze Document tem três recursos: Forms, Tables e Queries. Você tem flexibilidade para chamar qualquer combinação de Forms, Tables e Queries.

  • A API Analyze Documento for Forms extrai dados como pares de chave-valor (“Nome” e valor associado, como “Jane Smith”). Também utiliza a tecnologia OCR para extrair todo o texto e manuscritos de um documento.
  • A API Analyze Document for Tables extrai dados tabulares ou de tabela organizados em colunas e linhas. Também utiliza a tecnologia OCR para extrair todo o texto e manuscritos de um documento.
  • A API Analyze Document for Queries oferece flexibilidade para especificar as informações necessárias de um documento (por exemplo, "Qual é o nome do cliente?") e receber esses dados (por exemplo, "Jane Doe") como parte da resposta. Você não precisa se preocupar com a estrutura dos dados no documento ou com as variações na forma como os dados são dispostos em diferentes formatos e versões do documento. Também utiliza a tecnologia OCR para extrair todo o texto e manuscritos de um documento.
A API Analyze Expense extrai dados, como ID da fatura ou N.º da fatura e o valor associado,12345, de faturas e recibos. O Amazon Textract reconhece esses termos como sendo o ID da fatura e o valor correspondente como 12345. O recurso permite usar uma taxonomia padrão de campos comuns. 
A API Analyze ID usa machine learning para entender o contexto de documentos de identidade, como passaportes, carteiras de motorista e outros. Você pode extrair automaticamente informações específicas como a data de vencimento ou a data de nascimento, além de identificar e extrair de forma inteligente as informações implícitas, como nome e endereço. Cada imagem de ID é considerada uma página.
 

Solicitar um orçamento personalizado

Para um volume alto de casos de uso, entre em contato com nossa equipe de vendas para solicitar uma proposta de preços personalizada.

Nível gratuito

Como parte do nível gratuito da AWS, você pode começar a usar o Amazon Textract gratuitamente. O nível gratuito dura três meses e novos clientes da AWS podem analisar até:

API Detect Document Text: 1.000 páginas por mês
API Analyze Document:

  • 100 páginas por mês ao usar o recurso Forms ou Tables
  • Um adicional de 100 páginas por mês ao usar o recurso Queries NOVO

API Analyze Expense: 100 páginas por mês
API Analyze ID: 100 páginas por mês

Preços das APIs do Amazon Textract

*A saída da API Analyze Document inclui OCR, independentemente do tipo de recurso selecionado
*As APIs Analyze Expense e Analyze ID não incluem OCR na saída

Exemplos de preços fora do nível gratuito

Exemplo de preço 1: API Detect Document Text

Vamos supor que você queira extrair o texto de 100 mil páginas de relatórios de pesquisa usando a API Detect Document Text. O preço por página na região Oeste dos EUA (Oregon) para o primeiro um milhão de páginas é de USD 0,0015, totalizando USD 150.

Total de páginas processadas = 100.000

Preço por página = USD 0,0015

Cobrança total por mês = USD 0,0015 * 100.000 = USD 150

Exemplo de preço 2: API Detect Document Text

Digamos que você queira extrair o texto de dois milhões de páginas de relatórios de pesquisa usando a API Detect Document Text. O preço por página na região Oeste dos EUA (Oregon) para o primeiro milhão de páginas é de USD 0,0015 e as páginas após um milhão custam USD 0,0006, portanto, para o processamento de dois milhões de páginas, o custo total seria de USD 2.100.

Total de páginas processadas = 2.000.000

Preço por página = USD 0,0015 para o primeiro milhão de páginas e USD 0,0006 para páginas além de um milhão

Cobrança total por mês = USD 0,0015 * 1.000.000 + USD 0,0006 * 1.000.000 = USD 1.500 + USD 600 = USD 2.100

Exemplo de preço 3: API Analyze Document (Forms e Tables)

Digamos que você queira extrair texto e dados estruturados de 5.000 páginas de formulários fiscais usando a API Analyze Document. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com tabelas é de USD 0,015 e com formulários é de USD 0,05, para um total de USD 325.

Total de páginas processadas = 5.000 páginas

Preço por página com tabela = USD 0,015

Preço da página com formulário (par de chave-valor) = USD 0,05

Cobrança total = USD 0,015*5.000 + USD 0,05 *5.000 = USD 75 + USD 250 = USD 325

Exemplo de preço 4: API Analyze Document (Forms e Tables)

Digamos que você queira extrair texto, formulários e tabelas de dois milhões de páginas de formulários fiscais usando a API Analyze Document. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com tabelas é de USD 0,015 e USD 0,01 por página após um milhão de páginas. Páginas com formulários custam USD 0,05 para um milhão de páginas e USD 0,04 por página após um milhão. O custo total seria de USD 115.000.

Total de páginas processadas = 2.000.000 páginas

Preço da página com formulário (par de chave-valor) = USD 0,05 para o primeiro 1 milhão e USD 0,04 para o próximo 1 milhão

Cobrança total = USD 0,015 * 1.000.000 + USD 0,01 * 1.000.000 + USD 0,05 * 1.000.000 + USD 0,04 * 1.000.000 = USD 15.000 + USD 10.000 + USD 50.000 + USD 40.000 = USD 115.000

Exemplo de preço 5: API Analyze Document (Queries)

Digamos que você queira extrair o texto de 5.000 páginas de formulários hipotecários usando a API Analyze Document. Você também deseja extrair 10 pontos de dados específicos de cada página por meio do recurso Queries. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas é de USD 0,015, totalizando USD 75.

Total de páginas processadas = 5.000 páginas

Preço por página com o Queries = USD 0,015

Cobrança total = USD 0,015 * 5.000 = USD 75

Exemplo de preço 6: API Analyze Document (Forms e Queries)

Digamos que você queira extrair texto e dados de tabelas de 5.000 páginas de formulários fiscais usando a API Analyze Document. Você também deseja extrair 10 pontos de dados específicos de cada página por meio do recurso Queries. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com os recursos Tables e Queries é de USD 0,020 e USD 0,015 por página após um milhão de páginas. O custo total seria de USD 100.

Total de páginas processadas = 5.000 páginas

Preço por página com o Tables e o Queries = USD 0,020

Cobrança total = USD 0,020 * 5.000 = USD 100

Exemplo de preço 7: API Analyze Document (Forms e Tables)

Digamos que você queira extrair os dados de texto e formulários (pares de chave-valor) de 5.000 páginas de formulários de seguro usando a API Analyze Document. Você também deseja extrair 10 pontos de dados específicos de cada página por meio do recurso Queries. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com os recursos Forms e Queries é de USD 0,055 e USD 0,045 por página após um milhão de páginas. O custo total seria de USD 275.

Total de páginas processadas = 5.000 páginas

Preço por página com o Forms (par de chave-valor) e o Queries = USD 0,055

Cobrança total = USD 0,055 * 5.000 = USD 275

Exemplo de preço 8: API Analyze Document (Forms, Tables e Queries)

Digamos que você queira extrair texto, formulários e tabelas de dois milhões de páginas de canhotos de pagamento usando a API Analyze Document. Você também deseja extrair 10 pontos de dados específicos de cada página por meio do recurso Queries. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com os recursos Tables, Forms e Queries é de USD 0,070 e USD 0,055 por página após um milhão de páginas. O custo total seria de USD 125.000.

Total de páginas processadas = 2.000.000 de páginas 

Preço por página com o Tables, o Forms e o Queries= USD 0,070 para o primeiro milhão e USD 0,055 para o próximo milhão 

Cobrança total = USD 0,070 * 1.000.000 + USD 0,055 * 1.000.000 = USD 70.000 + USD 55.000 = USD 125.000

Exemplo de preço 9: API Analyze Expense

Vamos supor que você queira extrair dados de 100.000 faturas usando a API Analyze Expense. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas é de USD 0,01 e você processa 100.000 faturas. O custo total seria de USD 1.000. Veja o cálculo abaixo: 

Total de páginas processadas = 100.000 

Preço por página = USD 0,01 

Cobrança total por mês = USD 0,01 * 100.000 = USD 1.000

Exemplo de preço 10: API Analyze Expense

Vamos supor que você queira extrair dados de 1.500.000 faturas usando a API Analyze Expense. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas é de USD 0,01 por página e USD 0,008 por página após um milhão. O custo total seria de USD 14.000. Veja o cálculo abaixo: 

Total de páginas processadas = 1.500.000 

Preço por página = USD 0,01 para o primeiro milhão e USD 0,008 para os próximos 500.000 

Cobrança total por mês = USD 0,01 * 1.000.000 + USD 0,008 * 500.000 = USD 14.000

Exemplo de preço 11: API Analyze ID

Suponha que você queira extrair informações de 100.000 documentos de identidade usando a API Analyze ID. O preço por página na região Oeste dos EUA (Oregon) para 100.000 páginas é USD 0,025 por página até 100.000 páginas. O custo total seria de USD 2.500. 

Total de páginas processadas = 100.000 

Preço por página = USD 0,025 

Cobrança total por mês = USD 0,025 * 100.000 = USD 2.500

Exemplo de preço 12: API Analyze ID

Suponha que você queira extrair informações de 600.000 documentos de identidade usando a API Analyze ID. O preço por página na região Oeste dos EUA (Oregon) para 100.000 páginas é de USD 0,025 por página e USD 0,01 por página após 100.000. O custo total seria de USD 7.500.

Total de páginas processadas = 600.000 

Preço por página = USD 0,025 para as primeiras 100.000 páginas e USD 0,01 para as próximas 500.000 

Cobrança total por mês = USD 0,025 * 100.000 + USD 0,01 * 500.000 = USD 7.500

Confira as perguntas frequentes do Amazon Textract

Saiba mais sobre como o Amazon Textract extrai texto e dados estruturados de praticamente qualquer documento.

Saiba mais 
Cadastre-se para obter uma conta gratuita

Obtenha acesso instantâneo ao nível gratuito da AWS. 

Cadastrar-se 
Comece a criar no console

Comece a criar com o Amazon Textract no Console de Gerenciamento da AWS.

Cadastre-se