O Amazon Textract é um serviço de machine learning (ML) que extrai automaticamente texto impresso ou manuscrito e dados de documentos digitalizados. Esse recurso faz mais do que o simples reconhecimento óptico de caracteres (OCR): ele identifica, entende e extrai dados de formulários e tabelas. Com o Amazon Textract, o pagamento é feito conforme o uso. Não há taxas mínimas nem compromissos antecipados. O Amazon Textract cobra somente por páginas processadas, quer você extraia texto, texto com tabelas, dados de formulários, consultas ou processa faturas e documentos de identidade. Consulte as Perguntas frequentes para saber mais detalhes sobre as páginas e o uso aceitável do Amazon Textract.
O Amazon Textract tem quatro APIs diferentes: Detect Document Text, Analyze Document, Analyze Expense e Analyze ID.
A API Detect Document Text utiliza a tecnologia OCR para extrair texto e manuscritos de um documento.
A API Analyze Document tem três recursos: Forms, Tables e Queries. Você tem flexibilidade para chamar qualquer combinação de Forms, Tables e Queries.
- A API Analyze Documento for Forms extrai dados como pares de chave-valor (“Nome” e valor associado, como “Jane Smith”). Também utiliza a tecnologia OCR para extrair todo o texto e manuscritos de um documento.
- A API Analyze Document for Tables extrai dados tabulares ou de tabela organizados em colunas e linhas. Também utiliza a tecnologia OCR para extrair todo o texto e manuscritos de um documento.
- A API Analyze Document for Queries oferece flexibilidade para especificar as informações necessárias de um documento (por exemplo, "Qual é o nome do cliente?") e receber esses dados (por exemplo, "Jane Doe") como parte da resposta. Você não precisa se preocupar com a estrutura dos dados no documento ou com as variações na forma como os dados são dispostos em diferentes formatos e versões do documento. Também utiliza a tecnologia OCR para extrair todo o texto e manuscritos de um documento.
Nível gratuito
Como parte do nível gratuito da AWS, você pode começar a usar o Amazon Textract gratuitamente. O nível gratuito dura três meses e novos clientes da AWS podem analisar até:
API Detect Document Text: 1.000 páginas por mês
API Analyze Document:
- 100 páginas por mês ao usar o recurso Forms ou Tables
- Um adicional de 100 páginas por mês ao usar o recurso Queries NOVO
API Analyze Expense: 100 páginas por mês
API Analyze ID: 100 páginas por mês
Preços das APIs do Amazon Textract
*A saída da API Analyze Document inclui OCR, independentemente do tipo de recurso selecionado
*As APIs Analyze Expense e Analyze ID não incluem OCR na saída
Exemplos de preços fora do nível gratuito
Exemplo de preço 1: API Detect Document Text
Vamos supor que você queira extrair o texto de 100 mil páginas de relatórios de pesquisa usando a API Detect Document Text. O preço por página na região Oeste dos EUA (Oregon) para o primeiro um milhão de páginas é de USD 0,0015, totalizando USD 150.
Total de páginas processadas = 100.000
Preço por página = USD 0,0015
Cobrança total por mês = USD 0,0015 * 100.000 = USD 150
Exemplo de preço 2: API Detect Document Text
Digamos que você queira extrair o texto de dois milhões de páginas de relatórios de pesquisa usando a API Detect Document Text. O preço por página na região Oeste dos EUA (Oregon) para o primeiro milhão de páginas é de USD 0,0015 e as páginas após um milhão custam USD 0,0006, portanto, para o processamento de dois milhões de páginas, o custo total seria de USD 2.100.
Total de páginas processadas = 2.000.000
Preço por página = USD 0,0015 para o primeiro milhão de páginas e USD 0,0006 para páginas além de um milhão
Cobrança total por mês = USD 0,0015 * 1.000.000 + USD 0,0006 * 1.000.000 = USD 1.500 + USD 600 = USD 2.100
Exemplo de preço 3: API Analyze Document (Forms e Tables)
Digamos que você queira extrair texto e dados estruturados de 5.000 páginas de formulários fiscais usando a API Analyze Document. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com tabelas é de USD 0,015 e com formulários é de USD 0,05, para um total de USD 325.
Total de páginas processadas = 5.000 páginas
Preço por página com tabela = USD 0,015
Preço da página com formulário (par de chave-valor) = USD 0,05
Cobrança total = USD 0,015*5.000 + USD 0,05 *5.000 = USD 75 + USD 250 = USD 325
Exemplo de preço 4: API Analyze Document (Forms e Tables)
Digamos que você queira extrair texto, formulários e tabelas de dois milhões de páginas de formulários fiscais usando a API Analyze Document. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com tabelas é de USD 0,015 e USD 0,01 por página após um milhão de páginas. Páginas com formulários custam USD 0,05 para um milhão de páginas e USD 0,04 por página após um milhão. O custo total seria de USD 115.000.
Total de páginas processadas = 2.000.000 páginas
Preço da página com formulário (par de chave-valor) = USD 0,05 para o primeiro 1 milhão e USD 0,04 para o próximo 1 milhão
Cobrança total = USD 0,015 * 1.000.000 + USD 0,01 * 1.000.000 + USD 0,05 * 1.000.000 + USD 0,04 * 1.000.000 = USD 15.000 + USD 10.000 + USD 50.000 + USD 40.000 = USD 115.000
Exemplo de preço 5: API Analyze Document (Queries)
Digamos que você queira extrair o texto de 5.000 páginas de formulários hipotecários usando a API Analyze Document. Você também deseja extrair 10 pontos de dados específicos de cada página por meio do recurso Queries. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas é de USD 0,015, totalizando USD 75.
Total de páginas processadas = 5.000 páginas
Preço por página com o Queries = USD 0,015
Cobrança total = USD 0,015 * 5.000 = USD 75
Exemplo de preço 6: API Analyze Document (Forms e Queries)
Digamos que você queira extrair texto e dados de tabelas de 5.000 páginas de formulários fiscais usando a API Analyze Document. Você também deseja extrair 10 pontos de dados específicos de cada página por meio do recurso Queries. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com os recursos Tables e Queries é de USD 0,020 e USD 0,015 por página após um milhão de páginas. O custo total seria de USD 100.
Total de páginas processadas = 5.000 páginas
Preço por página com o Tables e o Queries = USD 0,020
Cobrança total = USD 0,020 * 5.000 = USD 100
Exemplo de preço 7: API Analyze Document (Forms e Tables)
Digamos que você queira extrair os dados de texto e formulários (pares de chave-valor) de 5.000 páginas de formulários de seguro usando a API Analyze Document. Você também deseja extrair 10 pontos de dados específicos de cada página por meio do recurso Queries. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com os recursos Forms e Queries é de USD 0,055 e USD 0,045 por página após um milhão de páginas. O custo total seria de USD 275.
Total de páginas processadas = 5.000 páginas
Preço por página com o Forms (par de chave-valor) e o Queries = USD 0,055
Cobrança total = USD 0,055 * 5.000 = USD 275
Exemplo de preço 8: API Analyze Document (Forms, Tables e Queries)
Digamos que você queira extrair texto, formulários e tabelas de dois milhões de páginas de canhotos de pagamento usando a API Analyze Document. Você também deseja extrair 10 pontos de dados específicos de cada página por meio do recurso Queries. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com os recursos Tables, Forms e Queries é de USD 0,070 e USD 0,055 por página após um milhão de páginas. O custo total seria de USD 125.000.
Total de páginas processadas = 2.000.000 de páginas
Preço por página com o Tables, o Forms e o Queries= USD 0,070 para o primeiro milhão e USD 0,055 para o próximo milhão
Cobrança total = USD 0,070 * 1.000.000 + USD 0,055 * 1.000.000 = USD 70.000 + USD 55.000 = USD 125.000
Exemplo de preço 9: API Analyze Expense
Vamos supor que você queira extrair dados de 100.000 faturas usando a API Analyze Expense. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas é de USD 0,01 e você processa 100.000 faturas. O custo total seria de USD 1.000. Veja o cálculo abaixo:
Total de páginas processadas = 100.000
Preço por página = USD 0,01
Cobrança total por mês = USD 0,01 * 100.000 = USD 1.000
Exemplo de preço 10: API Analyze Expense
Vamos supor que você queira extrair dados de 1.500.000 faturas usando a API Analyze Expense. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas é de USD 0,01 por página e USD 0,008 por página após um milhão. O custo total seria de USD 14.000. Veja o cálculo abaixo:
Total de páginas processadas = 1.500.000
Preço por página = USD 0,01 para o primeiro milhão e USD 0,008 para os próximos 500.000
Cobrança total por mês = USD 0,01 * 1.000.000 + USD 0,008 * 500.000 = USD 14.000
Exemplo de preço 11: API Analyze ID
Suponha que você queira extrair informações de 100.000 documentos de identidade usando a API Analyze ID. O preço por página na região Oeste dos EUA (Oregon) para 100.000 páginas é USD 0,025 por página até 100.000 páginas. O custo total seria de USD 2.500.
Total de páginas processadas = 100.000
Preço por página = USD 0,025
Cobrança total por mês = USD 0,025 * 100.000 = USD 2.500
Exemplo de preço 12: API Analyze ID
Suponha que você queira extrair informações de 600.000 documentos de identidade usando a API Analyze ID. O preço por página na região Oeste dos EUA (Oregon) para 100.000 páginas é de USD 0,025 por página e USD 0,01 por página após 100.000. O custo total seria de USD 7.500.
Total de páginas processadas = 600.000
Preço por página = USD 0,025 para as primeiras 100.000 páginas e USD 0,01 para as próximas 500.000
Cobrança total por mês = USD 0,025 * 100.000 + USD 0,01 * 500.000 = USD 7.500

Saiba mais sobre como o Amazon Textract extrai texto e dados estruturados de praticamente qualquer documento.

Obtenha acesso instantâneo ao nível gratuito da AWS.

Comece a criar com o Amazon Textract no Console de Gerenciamento da AWS.