O Amazon Textract é um serviço de machine learning (ML) que extrai automaticamente texto impresso ou manuscrito e dados de documentos digitalizados. Esse recurso faz mais do que o simples reconhecimento óptico de caracteres (OCR): ele identifica, entende e extrai dados de formulários e tabelas. Com o Amazon Textract, o pagamento é feito conforme o uso. Não há taxas mínimas nem compromissos antecipados. O Amazon Textract cobra somente por páginas processadas, quer você extraia texto, texto com tabelas, dados de formulários, consultas ou processa faturas e documentos de identidade. Consulte as Perguntas frequentes para saber mais detalhes sobre as páginas e o uso aceitável do Amazon Textract.
O Amazon Textract tem cinco APIs diferentes: Detect Document Text, Analyze Document, Analyze Expense, Analyze ID e Analyze Lending.
A API Detect Document Text utiliza a tecnologia OCR para extrair texto e manuscritos de um documento.
A API Analyze Document tem quatro recursos: Forms, Tables, Queries e Signatures. Você tem a flexibilidade de chamar qualquer combinação de Forms, Tables, Queries e Signatures.
- A API Analyze Document for Forms extrai dados como pares de chave-valor (“Nome” e valor associado, como “Jane Smith”). Também utiliza a tecnologia OCR para extrair todo o texto e manuscritos de um documento.
- A API Analyze Document for Tables extrai dados tabulares ou de tabela organizados em colunas e linhas. Também utiliza a tecnologia OCR para extrair todo o texto e manuscritos de um documento.
- A API Analyze Document for Queries oferece flexibilidade para especificar as informações necessárias de um documento (por exemplo, "Qual é o nome do cliente?") e receber esses dados (por exemplo, "Jane Doe") como parte da resposta. Você não precisa se preocupar com a estrutura dos dados no documento ou com as variações na forma como os dados são dispostos em diferentes formatos e versões do documento. Também utiliza a tecnologia OCR para extrair todo o texto e manuscritos de um documento.
- A API Analyze Document para consultas personalizadas oferece a capacidade de chamar o recurso de consultas personalizadas para documentos específicos de sua empresa. Você treina um adaptador usando o console da AWS e usa o identificador do adaptador em sua solicitação da API Analyze Document para usar consultas personalizadas.
- A API Analyze Document for Signatures permite detectar assinaturas manuscritas, assinaturas eletrônicas e iniciais em qualquer documento ou imagem. Também utiliza a tecnologia OCR para extrair todo o texto e manuscritos de um documento.
Solicitar um orçamento personalizado
Para um volume alto de casos de uso, entre em contato com nossa equipe de vendas para solicitar uma proposta de preços personalizada.
Nível gratuito
Como parte do nível gratuito da AWS, você pode começar a usar o Amazon Textract gratuitamente. O nível gratuito dura três meses e novos clientes da AWS podem analisar até:
API Detect Document Text: 1.000 páginas por mês
API Analyze Document:
- 1.000 páginas por mês ao usar somente o recurso Signatures
- 100 páginas por mês ao usar os recursos de formulários, tabelas e layout
- 100 páginas por mês cada para consultas, formulários + consultas, tabelas + consultas, formulários + tabelas + consultas
- Não há nível gratuito para consultas personalizadas
API Analyze Expense: 100 páginas por mês
API Analyze ID: 100 páginas por mês
API Analyze Lending: 2.000 páginas por mês
Preços das APIs do Amazon Textract
Recursos pré-treinados
**A API Analyze Document vem com OCR incluído, independentemente do tipo de recurso selecionado
*As APIs Analyze Expense e Analyze ID incluem OCR na saída
Recursos pré-treinados e personalizados
Exemplos de preços fora do nível gratuito
Exemplo de preço 1: API Detect Document Text
Vamos supor que você queira extrair o texto de 100 mil páginas de relatórios de pesquisa usando a API Detect Document Text. O preço por página na região Oeste dos EUA (Oregon) para o primeiro um milhão de páginas é de USD 0,0015, totalizando USD 150.
Total de páginas processadas = 100.000
Preço por página = USD 0,0015
Cobrança total por mês = USD 0,0015 * 100.000 = USD 150
Exemplo de preço 2: API Detect Document Text
Digamos que você queira extrair o texto de dois milhões de páginas de relatórios de pesquisa usando a API Detect Document Text. O preço por página na região Oeste dos EUA (Oregon) para o primeiro milhão de páginas é de USD 0,0015 e as páginas após um milhão custam USD 0,0006, portanto, para o processamento de dois milhões de páginas, o custo total seria de USD 2.100.
Total de páginas processadas = 2.000.000
Preço por página = USD 0,0015 para o primeiro milhão de páginas e USD 0,0006 para páginas além de um milhão
Cobrança total por mês = USD 0,0015 * 1.000.000 + USD 0,0006 * 1.000.000 = USD 1.500 + USD 600 = USD 2.100
Exemplo de preço 3: API Analyze Document (Forms e Tables)
Digamos que você queira extrair texto e dados estruturados de 5.000 páginas de formulários fiscais usando a API Analyze Document. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com tabelas é de USD 0,015 e com formulários é de USD 0,05, para um total de USD 325.
Total de páginas processadas = 5.000 páginas
Preço por página com tabela = USD 0,015
Preço da página com formulário (par de chave-valor) = USD 0,05
Cobrança total = USD 0,015*5.000 + USD 0,05 *5.000 = USD 75 + USD 250 = USD 325
Exemplo de preço 4: API Analyze Document (Forms e Tables)
Digamos que você queira extrair texto, formulários e tabelas de dois milhões de páginas de formulários fiscais usando a API Analyze Document. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com tabelas é de USD 0,015 e USD 0,01 por página após um milhão de páginas. Páginas com formulários custam USD 0,05 para um milhão de páginas e USD 0,04 por página após um milhão. O custo total seria de USD 115.000.
Total de páginas processadas = 2.000.000 páginas
Preço da página com formulário (par de chave-valor) = USD 0,05 para o primeiro 1 milhão e USD 0,04 para o próximo 1 milhão
Cobrança total = USD 0,015 * 1.000.000 + USD 0,01 * 1.000.000 + USD 0,05 * 1.000.000 + USD 0,04 * 1.000.000 = USD 15.000 + USD 10.000 + USD 50.000 + USD 40.000 = USD 115.000
Exemplo de preço 5: API Analyze Document (Queries)
Digamos que você queira extrair o texto de 5.000 páginas de formulários hipotecários usando a API Analyze Document. Você também deseja extrair 10 pontos de dados específicos de cada página por meio do recurso Queries. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas é de USD 0,015, totalizando USD 75.
Total de páginas processadas = 5.000 páginas
Preço por página com o Queries = USD 0,015
Cobrança total = USD 0,015 x 5.000 = USD 75
Exemplo de preço 6: API Analyze Document (Forms, Tables e Queries)
Digamos que você queira extrair texto, formulários e tabelas de dois milhões de páginas de canhotos de pagamento usando a API Analyze Document. Você também deseja extrair 10 pontos de dados específicos de cada página por meio do recurso Queries. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com os recursos Tables, Forms e Queries é de USD 0,070 e USD 0,055 por página após um milhão de páginas. O custo total seria de USD 125.000.
Total de páginas processadas = 2.000.000 de páginas
Preço por página com o Tables, o Forms e o Queries= USD 0,070 para o primeiro milhão e USD 0,055 para o próximo milhão
Cobrança total = USD 0,070 x 1.000.000 + USD 0,055 x 1.000.000 = USD 70.000 + USD 55.000 = USD 125.000
Exemplo de preço 7: API Analyze Document (Forms e Tables)
Digamos que você queira extrair texto e dados de tabelas de 5.000 páginas de formulários fiscais usando a API Analyze Document. Você também deseja extrair 10 pontos de dados específicos de cada página por meio do recurso Queries. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas com os recursos Tables e Queries é de USD 0,020 e USD 0,015 por página após um milhão de páginas. O custo total seria de USD 100.
Total de páginas processadas = 5.000 páginas
Preço por página com o Tables e o Queries = USD 0,020
Cobrança total = USD 0,020 x 5.000 = USD 100
Exemplo de preço 8: API Analyze Document (Signatures)
Digamos que você queira detectar assinaturas e extrair o texto de 100 mil páginas de formulários hipotecários usando a API Analyze Document
: tipo do recurso Signatures. Os preços por página na região Oeste dos EUA (Oregon) para o primeiro milhão de páginas é de USD 0,0035, totalizando um custo de
USD 350.
Total de páginas processadas = 100.000
Preço por página = USD 0,0035
Cobrança total por mês = USD 0,00035 * 100.000 = USD 350
Exemplo de preço 9: API Analyze Document (Signatures)
Digamos que você queira detectar assinaturas e extrair o texto de cinco milhões de páginas de formulários hipotecários usando a API Analyze Document
: tipo do recurso Signatures. Os preços por página na região Oeste dos EUA (Oregon) para o primeiro milhão de páginas é de USD 0,00035, totalizando um custo de USD 20.
Total de páginas processadas = 5.000.000
Preço por página para o primeiro 1 milhão de páginas = USD 0,0035 x 1.000.000 = USD 3.500
Preço por página para os quatro milhões de páginas seguintes = USD 0,0014 x 4.000.000 = USD 5.600
Total = USD 3500 + USD 5600 = USD 9100
Exemplo de preço 10: API Analyze Expense
Vamos supor que você queira extrair dados de 100.000 faturas usando a API Analyze Expense. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas é de USD 0,01 e você processa 100.000 faturas. O custo total seria de USD 1.000. Veja o cálculo abaixo:
Total de páginas processadas = 100.000
Preço por página = USD 0,01
Cobrança total por mês = USD 0,01 x 100.000 = USD 1.000
Exemplo de preço 11: API Analyze Expense
Vamos supor que você queira extrair dados de 1.500.000 faturas usando a API Analyze Expense. O preço por página na região Oeste dos EUA (Oregon) para um milhão de páginas é de USD 0,01 por página e USD 0,008 por página após um milhão. O custo total seria de USD 14.000. Veja o cálculo abaixo:
Total de páginas processadas = 1.500.000
Preço por página = USD 0,01 para o primeiro milhão e USD 0,008 para os próximos 500.000
Cobrança total por mês = USD 0,01 x 1.000.000 + USD 0,008 x 500.000 = USD 14.000
Exemplo de preço 12: API Analyze ID
Vamos supor que você queira extrair informações de 100.000 documentos de identidade usando a API Analyze ID. O preço por página na região Oeste dos EUA (Oregon) para 100.000 páginas é USD 0,025 por página até 100.000 páginas. O custo total seria de USD 2.500.
Total de páginas processadas = 100.000
Preço por página = USD 0,025
Cobrança total por mês = USD 0,025 x 100.000 = USD 2.500
Exemplo de preço 13: API Analyze ID
Vamos supor que você queira extrair informações de 600.000 documentos de identidade usando a API Analyze ID. O preço por página na região Oeste dos EUA (Oregon) para 100.000 páginas é de USD 0,025 por página e USD 0,01 por página após 100.000. O custo total seria de USD 7.500.
Total de páginas processadas = 600.000
Preço por página = USD 0,025 para as primeiras 100.01 páginas e USD 500,000 para as próximas 500.000
Cobrança total por mês = USD 0,025 * 100.000 + USD 0,01 * 500.000 = USD 7.500
Exemplo de preço 14: API Analyze Lending
Suponha que você queira extrair informações de 200.000 páginas de documentos de empréstimo hipotecário usando a API Analyze Lending. O preço por página na região Oeste dos EUA (Oregon) é de USD 0,07 por página por página para até um milhão de páginas. Das 200 mil páginas que você processou, a Analyze Lending forneceu classificação e extração para os tipos de documento compatíveis, resultando em 100 mil páginas de classificação e extração de dados. O custo total seria de USD 7.000 para as 100 mil páginas.
Total de páginas processadas = 200.000
Total de páginas compatíveis com classificação e extração = 100.000
Preço por página = USD 0,07
Cobrança total por mês = USD 0,07 * 100.000 = USD 7.000
Exemplo de preço 15: API Analyze Lending
Suponha que você queira extrair informações de 2.000.000 páginas de documentos de empréstimo hipotecário usando a API Analyze Lending. O preço por página na região Oeste dos EUA (Oregon) é de USD 0,07 por página por página para até um milhão de páginas e de USD 0,055 por página após 1 milhão. Dos 2 milhões de páginas que você processou, a Analyze Lending forneceu classificação e extração para os tipos de documento compatíveis, resultando em 1.200.000 páginas de classificação e extração de dados. O custo total seria de USD 81.000 para 1.200.000 páginas.
Total de páginas processadas = 2.000.000
Total de páginas compatíveis com classificação e extração = 1.200.000
Preço por página = USD 0,07 para o primeiro milhão de páginas e USD 0,055 para as próximas 200 mil
Cobrança total por mês = USD 0,07 * 1.000.000 + USD 0,055 * 200.000 = USD 81.000
Exemplo de preço 16 – API Analyze Document – Layout e Tabelas
Você precisa extrair o layout e as tabelas de dois milhões de páginas de relatórios financeiros usando a API Analyze Document. O layout está disponível gratuitamente quando usado com o recurso Tabelas. O preço das tabelas na região Oeste dos EUA (Oregon) é de USD 0,015 por página para as primeiras 1 milhão de páginas em um mês e USD 0,010 por página para as páginas que excedem 1 milhão de páginas em um mês.
Total de páginas processadas = 2.000.000 de páginas
Preço das primeiras 1 milhão de páginas = USD 0,015 * 1.000.000 = USD 15.000
Preço para as próximas 1 milhão de páginas = USD 0,010 * 1.000.000 = USD 10.000
Cobrança total = USD 25.000
Exemplo de preço 17: API Analyze Document - Consultas personalizadas
Você precisa extrair dados de 5 milhões de páginas usando consultas personalizadas. O preço na região Oeste dos EUA (Oregon) é de USD 0,025 por página para as primeiras 1 milhão de páginas em um mês e USD 0,015 por página para as páginas que excederem 1 milhão de páginas em um mês.
Total de páginas processadas = 5.000.000
Preço das primeiras 1 milhão de páginas = USD 0,025 * 1000000 = USD 25.000
Preço para os próximos 4 milhões de páginas = USD 0,015 * 4.000.000 = USD 60.000
Cobrança total = USD 85.000
Exemplo de preço 18 - API de análise de documentos – Formulários pré-treinados e consultas personalizadas
Você precisa extrair pontos de dados de 2 milhões de páginas usando formulários pré-treinados e consultas personalizadas. O preço na região Oeste dos EUA (Oregon) é de USD 0,065 por página para as primeiras 1 milhão de páginas em um mês e USD 0,050 por página para as páginas que excederem 1 milhão de páginas em um mês.
Total de páginas processadas = 2.000.000 de páginas
Preço das primeiras 1 milhão de páginas = USD 0,065 * 1.000.000 = USD 65.000
Preço para as próximas 1 milhão de páginas = USD 0,050 * 1.000.000 = USD 50.000
Cobrança total = USD 115.000
Saiba mais sobre como o Amazon Textract extrai texto e dados estruturados de praticamente qualquer documento.
Obtenha acesso instantâneo ao nível gratuito da AWS.
Comece a criar com o Amazon Textract no Console de Gerenciamento da AWS.