Veröffentlicht am: Jul 27, 2021

Amazon Textract ist ein Machine-Learning-Service, der Text und strukturierte Daten aus jedem Dokument oder Bild extrahiert und jetzt spezielle Unterstützung für Rechnungen und Belege bietet. Bisher war es schwierig, diese wichtigen Dokumente in großem Maßstab zu verarbeiten, da sie keinen festen Gestaltungsregeln folgen und oft nur im Kontext richtig interpretiert werden konnten. Beispielsweise könnten Kunden den Verkäufernamen aus dem Amazon-Logo oben auf einer Rechnung extrahieren müssen, auch wenn diese nicht mit „Anbieter: Amazon“ beschriftet ist. Kunden können jetzt mit Textract explizit gekennzeichnete Daten, implizite Daten und Einzelposten aus der Auflistung von Waren oder Dienstleistungen aus fast jeder Rechnung oder jedem Beleg ohne Vorlagen oder Konfiguration extrahieren.

Ab sofort bietet Amazon Textract die folgenden Funktionen für Belege und Rechnungen: 1) Identifizierung des Anbieternamens - Amazon Textract kann den Anbieternamen auf einem Beleg auch dann finden, wenn er nur in einem Logo auf der Seite angegeben ist und nicht explizit als „Anbieter“ bezeichnet wird. Außerdem können Artikel, Mengen und Preise gefunden und extrahiert werden, die nicht mit Spaltenüberschriften für Positionen versehen sind. 2) Ermöglicht die Zusammenführung von Ausgaben aus mehreren Dokumenten - Textract normalisiert bei dem Extrahieren von Daten aus Rechnungen und Belegen die Schlüsselwörter und Spaltenüberschriften in eine Standardtaxonomie. Beispielsweise erkennt es, dass „Rechnungs-Nr.“ „Rechnungsnummer“ und „Belegnummer“ identisch sind, und gibt „INVOICE_RECEIPT_ID“ aus, sodass nachgelagerte Anwendungen die Ausgabe aus mehreren Dokumenten leicht vergleichen können, und 3) Extrahiert Positionsdetails, selbst wenn die Spaltenüberschriften fehlen - Textract extrahiert Positionen, einschließlich der Artikel, Mengen und Preise der einzelnen gekauften Waren aus einer Rechnung oder einem Beleg. Sollte die Tabelle der Einzelposten keine Spaltenüberschriften enthalten, schließt Textract nun aus dem Inhalt der Tabelle auf die Bedeutung der Spaltenüberschriften.

Ein Kunde berichtet uns davon:

Das 2010 gegründete Unternehmen Paymerang bietet einfache, sichere und profitable elektronische Lieferantenzahlungen für Unternehmen. „Wir unterstützen Kunden in verschiedenen Branchen bei der Vereinfachung ihrer Kreditorenbuchhaltung, indem Routineaufgaben eliminiert werden, die Lieferanten elektronisch bezahlt werden und dabei Bargeldrabatte erzielt werden“, so Jason Losh, Director of Enterprise Platforms bei Paymerang. „Wir verwenden Amazon Textract, einen HIPAA-konformen Service, um unsere Kunden im Gesundheitswesen bei dem automatischen Extrahieren von Daten aus Rechnungen zu unterstützen, ohne dass eine benutzerdefinierte Logik zur Standardisierung der extrahierten Informationen erforderlich ist. Durch das Extrahieren und Klassifizieren von Daten in eine einheitliche Reihe von Standardfeldern hilft Amazon Textract uns, Kunden mit Lieferanten zu bedienen, die keinem gemeinsamen Muster für Rechnungslayouts folgen.“

Weitere Informationen zu dieser Funktion finden Sie in der Dokumentation und in einem Blogbeitrag, in dem beschrieben wird, wie Textract mit einer neuen API namens AnalyzeExpense für Rechnungen und Belege verwendet werden kann. Hier ist ein Link zu der Preisseite.

AnalyzeExpense wird schrittweise eingeführt, beginnend mit der Region Asien-Pazifik (Singapur) am 26. Juli, gefolgt von Europa (Irland) am 27. Juli, Asien-Pazifik (Sydney), US-Ost (Ohio), US-West (Nordkalifornien) am 28. Juli, Europa (Frankfurt), Europa (London), US-Ost (N. Virginia) am 29. Juli, Asien-Pazifik (Seoul), Asien-Pazifik (Mumbai), Kanada (Zentral), Europa (Paris), US-West (Oregon) am 30. Juli, und GovCloud (US-Ost), GovCloud (US-West) Regionen am 2. August.