Publicado: Jul 27, 2021

O Amazon Textract, um serviço de machine learning que extrai texto e dados estruturados de qualquer documento ou imagem, agora oferece suporte especializado para faturas e recibos. Até hoje, esses documentos importantes eram difíceis de processar em escala porque não seguem as regras de design definido e, muitas vezes, requerem contexto para interpretar corretamente. Por exemplo, os clientes podem precisar extrair o nome do fornecedor do logotipo da Amazon no topo de uma fatura, mesmo que não esteja rotulada como “Fornecedor: Amazon”. Agora, com o Textract, os clientes podem extrair dados explicitamente rotulados, dados implícitos e itens de linha da lista detalhada de bens ou serviços de quase qualquer fatura ou recibo sem quaisquer modelos ou configuração.

A partir de hoje, o Amazon Textract adiciona os seguintes recursos para recibos e faturas: 1) Identifica o nome do fornecedor: o Amazon Textract pode encontrar o nome do fornecedor em um recibo, mesmo que seja indicado apenas em um logotipo na página sem uma etiqueta explícita chamada “fornecedor”. Ele também pode encontrar e extrair itens, quantidades e preços que não são rotulados com cabeçalhos de coluna para itens de linha, 2) Permite a consolidação de saída de muitos documentos: o Textract normaliza os nomes principais e cabeçalhos de coluna ao extrair dados de faturas e recibos, em uma taxonomia padrão. Por exemplo, ele detecta que “nº da fatura”, “número da fatura” e “# do recibo” são idênticos e produz o “INVOICE_RECEIPT_ID”, de modo que as aplicações posteriores possam facilmente comparar a saída de muitos documentos e 3) Extrai detalhes do item de linha, mesmo quando os cabeçalhos das colunas estão faltando: o Textract extrai itens de linha, incluindo itens, quantidades e preços de bens individuais adquiridos de uma fatura ou recibo. Se a tabela de itens de linha não inclui cabeçalhos de coluna, o Textract agora infere no que os cabeçalhos de coluna devem ser baseados no conteúdo da tabela.

Vamos ouvir um de nossos clientes:

Fundada em 2010, a Paymerang facilita os pagamentos eletrônicos a fornecedores para empresas que são simples, seguras e lucrativas. “Ajudamos clientes em vários setores a simplificar seus processos de contas a pagar, eliminando tarefas de rotina, pagando seus fornecedores eletronicamente e obtendo descontos em dinheiro no processo”, disse Jason Losh, Diretor de Plataformas Corporativas da Paymerang. “Usamos o Amazon Textract, um serviço elegível HIPAA, para ajudar nossos clientes na vertical de saúde a extrair dados de faturas automaticamente, sem usar lógica personalizada para padronizar as informações extraídas. Ao extrair e classificar dados em um conjunto consistente de campos padrão, o Amazon Textract nos ajuda a atender clientes que usam fornecedores que não seguem um padrão comum para layouts de faturas.”

Para obter mais informações sobre este recurso, consulte a documentação que explica com mais detalhes e uma postagem do blog que descreve como usar o Textract para faturas e recibos com uma nova API chamada AnalyzeExpense. Aqui está um link para a página de preço.

O AnalyzeExpense será lançado em ondas, começando com a região Ásia-Pacífico (Singapura) em 26 de julho, seguida pela Europa (Irlanda) em 27 de julho, Ásia-Pacífico (Sydney), Leste dos EUA (Ohio), Oeste dos EUA (Norte da Califórnia) em julho 28 de julho, Europa (Frankfurt), Europa (Londres), Leste dos EUA (Norte da Virgínia) em 29 de julho, Ásia-Pacífico (Seul), Ásia-Pacífico (Mumbai), Canadá (Central), Europa (Paris), Oeste dos EUA (Oregon) em 30 de julho e regiões GovCloud (Leste dos EUA), GovCloud (Oeste dos EUA) em 2 de agosto.