Publicado: Mar 30, 2022
O Amazon Textract é um serviço de machine learning que facilita a extração de texto e dados de praticamente qualquer documento. Aprimoramos continuamente os modelos subjacentes de machine learning com base no feedback dos clientes para fornecer uma precisão ainda melhor. Hoje, temos o prazer de anunciar alguns aprimoramentos de qualidade para nossos recursos de detecção de Tabelas e caixas de seleção.
Os modelos de Tabelas mais recentes oferecem suporte para detecção de células mescladas e a identificação de cabeçalhos de coluna. Especificamente, agora você pode detectar células mescladas em um documento processado usando o recurso AnalyzeDocument-Tables por meio do "Type": "MERGED_CELL" e também identificar células que compõem o cabeçalho da coluna por meio do identificador "EntityTypes": ["COLUMN_HEADER"]. Além disso, temos o prazer de anunciar melhorias de qualidade em nosso recurso de Tabelas. A partir de hoje, o Textract detecta com mais precisão os limites externos da tabela, limites de linha e coluna e conteúdo da tabela. Os clientes agora podem esperar maior precisão com menor pós-processamento na extração de tabelas em uma ampla variedade de tipos de documentos, incluindo aqueles encontrados em empréstimos, seguros, serviços financeiros, jurídico, saúde, energia e setor público.
Por fim, aprimoramos os recursos de detecção de caixas de seleção no modelo Forms. Com essa melhoria, agora você pode aproveitar o Amazon Textract para detectar com mais precisão informações selecionadas/não selecionadas manuscritas em caixas de seleção nos campos de formulário.
Para começar a usar, faça login no console do Amazon Textract para experimentar o recurso de detecção de tabelas e caixa de seleção mais recente. Para saber mais sobre os recursos do Textract, consulte o site do Amazon Textract, o guia do desenvolvedor ou a página de recursos.