Publicado: Dec 18, 2019
O Amazon Textract é um serviço de machine learning que torna fácil e rápido recuperar textos e dados estruturados como tabelas e formulários usando nossos APIs DetectText ou AnalyzeDoc, sem exigir qualquer configuração ou modelo personalizados. Uma vantagem de um serviço gerenciado como o Amazon Textract é que os clientes se beneficiam da melhoria contínua ao longo do tempo. Hoje, nós temos o prazer de anunciar que o Amazon Textract agora tem certificação PCI DSS. Isso significa que agora você pode usar o Amazon Textract para todas as cargas de trabalho que exijam padrões de segurança da informação conforme o Padrão de segurança de dados da Indústria de cartões de pagamento (PCI DSS), tais como dados do titular do cartão (CHD) ou dados confidenciais de autenticação (SAD). A partir de hoje, a AWS também lançou um conjunto de melhorias de qualidade que fazem com que o Amazon Textract seja ainda mais preciso para nossos recursos de tabelas e formulários.
Em primeiro lugar, nosso modelo de tabelas agora funciona melhor com estruturas de tabelas complexas que contenham células divididas e mescladas o que dificulta alinhar os valores das células com o header da coluna ou da linha corretos. Depois, o Amazon Textract aprimorou ainda mais a identificação de linhas e colunas para células com texto quebrado (texto presente entre múltiplas linhas), mesmo para tabelas sem limites claros. Agora o Amazon Textract determina de forma mais precisa quais células possuem conteúdo entre múltiplas linhas ou quando é uma nova linha sem um limite claro. Finalmente, o Amazon Textract também aprimorou o modelo de formulários para dar resultados mais precisos para identificação de pares de chave-valor. Esses benefícios se aplicam a muitos tipos de documentos, mas são especialmente evidentes para documentos onde as tabelas e pares de chave-valor estão presentes numa mesma página. Agora o Amazon Textract identifica corretamente os pares de chave-valor incorporados em uma tabela.
Saiba mais sobre essas atualizações clicando aqui.