Publicado: Nov 1, 2022
O Amazon Textract é um serviço de machine learning que extrai automaticamente texto impresso ou manuscrito e dados de qualquer documento ou imagem. AnalyzeExpense é uma API especializada no Textract que entende o contexto de faturas e recibos e extrai automaticamente dados relevantes, como nome do fornecedor e número da fatura. Hoje, temos o prazer de anunciar grandes melhorias na AnalyzeExpense que incluem suporte a novos campos e maior precisão para campos existentes.
A API AnalyzeExpense mais recente oferece suporte a mais de 40 campos normalizados. Os campos normalizados recentemente com suporte incluem campos de resumo, como Vendor Address (Endereço do fornecedor), e campos de item de linha, como Product Code (Código do produto). Com esse novo recurso, os clientes podem extrair diretamente as informações desejadas e economizar tempo de escrita e de manutenção do código de pós-processamento complexo. Além do suporte para novos campos, melhoramos ainda mais a precisão de campos como Vendor Name (Nome do fornecedor) e Total que já tinham suporte na versão anterior.
Juntamente com os pares de chave-valor normalizados e os pares de chave-valor regulares, o AnalyzeExpense agora fornece toda a saída de OCR na resposta da API. Os clientes podem obter os pares de chave-valor e a extração de OCR bruta por meio de uma única solicitação de API.
Esta atualização estará disponível nas regiões Leste dos EUA (Ohio, N. da Virgínia), Oeste dos EUA (N. da Califórnia), Oeste dos EUA (Oregon), Ásia-Pacífico (Mumbai, Seul, Singapura, Sydney), Canadá (Central), Europa (Frankfurt, Irlanda, Londres, Paris) e AWS GovCloud (Oeste dos EUA, Leste dos EUA) a partir de 31 de outubro.
Para começar a usá-lo, faça login no console do Amazon Textract para experimentar o novo recurso. Para saber mais sobre os recursos do Textract, consulte o site do Amazon Textract, o guia do desenvolvedor ou a página de recursos.