Veröffentlicht am: Dec 18, 2019

Amazon Textract ist ein Machine Learning-Service, mit dem Sie mithilfe unserer DetectText- oder AnalyzeDoc-APIs einfach und schnell Text und strukturierte Daten wie Tabellen und Formulare abrufen können, ohne dass eine benutzerdefinierte Konfiguration oder Vorlagen erforderlich sind. Ein Vorteil eines verwalteten Services wie Amazon Textract besteht darin, dass Kunden von einer kontinuierlichen Verbesserung im Laufe der Zeit profitieren. Wir freuen uns, Ihnen heute mitteilen zu können, dass Amazon Textract jetzt PCI DSS-zertifiziert ist. Dies bedeutet, dass Sie Amazon Textract jetzt für alle Workloads verwenden können, für die der PCI-DSS-Informationssicherheitsstandard (PCI = Payment Card Industry Data Security Standard) erforderlich ist, z. B. für Karteninhaberdaten (CHD) oder vertrauliche Authentifizierungsdaten (SAD). Ebenfalls ab heute hat AWS eine Reihe von Qualitätsverbesserungen eingeführt, mit denen Amazon Textract für unsere Tabellen- und Formularfunktionen noch genauer wird. 

Erstens funktioniert unser Tabellenmodell jetzt besser mit komplexen Tabellenstrukturen, die geteilte Zellen und zusammengeführte Zellen enthalten, was es schwierig macht, die Zellenwerte an der richtigen Spaltenüberschrift oder Zeilenüberschrift auszurichten. Als nächstes hat Amazon Textract die Identifizierung von Zeilen und Spalten für Zellen mit umbrochenem Text (Text, der über mehrere Zeilen verteilt ist) weiter verbessert, auch für Tabellen ohne explizite Grenzen. Amazon Textract ermittelt jetzt Zellen mit mehrzeiligem Inhalt genauer als eine neue Zeile ohne explizite Begrenzung. Schließlich hat Amazon Textract auch das Formularmodell verbessert, um genauere Ergebnisse für die Identifizierung von Schlüssel-Wert-Paaren zu erhalten. Diese Vorteile gelten für viele Dokumenttypen, sind jedoch besonders ausgeprägt für Dokumente, bei denen Tabellen und Schlüsselwertpaare auf derselben Seite vorhanden sind. Jetzt identifiziert Amazon Textract Schlüssel-Wert-Paare, die in eine Tabelle eingebettet sind, korrekt. 

Hier erfahren Sie mehr über diese Updates.