Veröffentlicht am: Nov 2, 2022

Amazon Textract ist ein Machine-Learning-Service, der automatisch Text, Handschrift und Daten aus Dokumenten oder Bildern extrahiert. Wir verbessern konsequent die stützenden Machine-Learning-Modelle basierend auf dem Feedback der Kunden, um eine noch bessere Genauigkeit zu gewährleisten. Wir freuen uns, heute Qualitätsverbesserungen an unserer über die AnalyzeDocument-API verfügbaren Textextraktionsfunktion bekannt zu geben.

Amazon Textract bietet jetzt eine verbesserte Genauigkeit bei der Extraktion von Schlüssel-Wert-Paaren und ist speziell für Formulare mit einzelnen Zeichen geeignet, die häufig in Dokumenten wie Steuer- und Einwanderungsformularen vorkommen. Die Extraktion von Informationen aus diesen Dokumenten war bislang aufgrund der Komplexität, mit der die Wörter in den Feldern erfasst werden, eine Herausforderung. Textract kann seine Kenntnisse über diese Formulare mit einzelnen Zeichen nutzen, um eine höhere Genauigkeit bei der Extraktion von Schlüssel-Wert-Paaren zu erzielen.

Darüber hinaus freuen wir uns, die Unterstützung von E13B-Schriftarten, die häufig in Schecks verwendet werden, sowie Verbesserungen bei der Erkennung von internationalen Kontonummern in Bankdokumenten und langen Wörtern (z. B. E-Mail-Adressen) über die AnalyzeDocument-API ankündigen zu können. Kunden in Branchen wie dem Versicherungs-, Gesundheits- und Finanzwesen nutzen diese Dokumente bei ihren Geschäftsabläufen und werden die Vorteile dieser Aktualisierung automatisch erkennen, wenn sie die AnalyzeDocument API von Textract verwenden.

Diese Aktualisierung wird ab dem 31. Oktober in US-Ost (Ohio, Nordvirginia), US West (Nordkalifornien), US West (Oregon), Asien-Pazifik (Mumbai, Seoul, Singapur, Sydney), Kanada (Zentral), Europa (Frankfurt, Irland, London, Paris) und AWS GovCloud (US-Ost, US-West) verfügbar sein.

Um zu beginnen, melde dich in der Amazon-Textract-Konsole an und probiere die neue Funktion aus. Um mehr über die Möglichkeiten von Textract zu erfahren, besuche bitte die Amazon-Textract-Website, das Entwicklerhandbuch oder die Ressourcen-Seite.