Veröffentlicht am: Apr 19, 2023

Amazon Comprehend gab bekannt, dass die Amazon Comprehend-APIs für die Dokumentenklassifizierung nun zusätzlich zum Text das Layout des Dokuments verwenden, um eine höhere Genauigkeit zu gewährleisten. 

Amazon Comprehend ist ein NLP-Service (Natural Language Processing), der vortrainierte und benutzerdefinierte APIs bereitstellt, um Erkenntnisse aus Textdaten abzuleiten. Auf der re:Invent 2022 vereinfachte Comprehend die Dokumentenklassifizierung, indem es Unterstützung für Inferenzen auf gängige Dokumenttypen hinzufügte. Zu diesem Zeitpunkt waren Kunden nicht in der Lage, benutzerdefinierte Dokumentenklassifizierungsmodelle für PDF-/Word-/Bilddateien mit Layoutdaten zu trainieren, um eine höhere Genauigkeit zu erzielen. Mit denselben APIs zur Dokumentenklassifizierung können Kunden nun benutzerdefinierte Klassifizierungsmodelle mit PDF-Dokumenten, Microsoft Word-Dateien und Bildern trainieren, um die Verwendung von Layoutinformationen zu unterstützen und eine höhere Genauigkeit bei der Klassifizierung zu erzielen. Diese höhere Genauigkeit ist für verschiedene Szenarien wie Versicherungsansprüche und die Klassifizierung von Hypothekendokumenten von Vorteil. Kunden können die neue Funktion für asynchrone Verarbeitung oder für Echtzeit-Anwendungsfälle nutzen.

Der Kunde kann Dokumente in englischer Sprache verarbeiten, um Layoutinformationen zu unterstützen. Diese Funktionen sind in allen AWS-Regionen verfügbar, in denen Amazon Comprehend angeboten wird.

Weitere Informationen und erste Schritte finden Sie auf der Seite für die intelligente Dokumentenverarbeitung von Amazon Comprehend, im AWS-Blog und in unserer Dokumentation