Publicado: Sep 28, 2023
O Amazon Textract é um serviço de machine learning que extrai automaticamente texto impresso ou manuscrito e dados de qualquer documento ou imagem. Hoje, temos o prazer de anunciar o Layout, um novo atributo do Amazon Textract que permite aos clientes extrair elementos de layout, como parágrafos, títulos, listas, cabeçalhos, rodapés e muito mais dos documentos. O Layout será um novo tipo de atributo na API Analyze Document. Os clientes podem usar o Layout como um recurso independente ou em combinação com outros tipos de atributo Analyze Document.
O Layout é pré-treinado em uma ampla variedade de documentos dos setores de serviços financeiros, jurídicos, seguros, médicos, mídia e outros. Com o Layout, os clientes poderão extrair diretamente elementos de layout dos documentos, reduzindo sua dependência do desenvolvimento e manutenção de códigos complexos de pós-processamento. Por sua vez, esperamos que o Layout melhore a eficiência das operações de processamento de documentos, como criação de índices de pesquisa, incorporações para aplicações de geração aumentada de recuperação (RAG) e muito mais.
Esse atributo estará disponível nas regiões Leste dos EUA (Ohio, N. da Virgínia), Oeste dos EUA (N. da Califórnia), Oeste dos EUA (Oregon), Ásia-Pacífico (Mumbai, Seul, Singapura, Sydney), Canadá (Central), Europa (Frankfurt, Irlanda, Londres, Paris) e AWS GovCloud (Oeste dos EUA, Leste dos EUA) a partir de 29 de setembro.
Para começar a usar, faça login no console do Amazon Textract para experimentar o novo atributo. Para saber mais sobre os recursos do Textract, consulte o site do Amazon Textract, o guia do desenvolvedor ou a página de recursos.