Amazon Textract

Extrahieren Sie Text und Daten ganz einfach aus praktisch jedem Dokument
Amazon Textract ist ein Service, der automatisch Text und Daten aus gescannten Dokumenten extrahiert. Amazon Textract geht über die einfache optische Zeichenerkennung (optical character recognition, OCR) hinaus und identifiziert auch den Inhalt von Feldern in Formularen sowie Informationen in Tabellen.

Viele Unternehmen extrahieren Daten aus Dokumenten heutzutage entweder mit manueller Dateneingabe, die langsam und teuer ist, oder mithilfe optischer Zeichenerkennungssoftware (OCR), die manuell angepasst oder konfiguriert werden muss. Die Regeln und Workflows für jedes Dokument und Formular müssen oft fest einprogrammiert und bei jeder Änderung oder im Falle von mehrseitigen Formularen geändert werden. Weicht das Formular von den Regeln ab, kommt es oft zu einer unleserlichen Ausgabe, die nicht verwendet werden kann.

Amazon Textract überwindet diese Herausforderungen mit Machine Learning. Es kann damit sofort praktisch jede Art von Dokument „lesen“ und Texte und Daten korrekt extrahieren – ganz ohne manuellen Eingriff oder angepassten Code. Mit Textract können Sie Dokumenten-Workflows schnell automatisieren und so eine Million Dokumentenseiten in wenigen Stunden verarbeiten. Nach dem Erfassen der Informationen können Sie diese innerhalb ihrer Geschäftsanwendungen nutzen, um etwa die nächsten Schritte für einen Darlehensantrag einzuleiten oder Krankenversicherungsansprüche zu verarbeiten. Außerdem können Sie intelligente Suchindizes sowie automatisierte Genehmigungs-Workflows erstellen und Dokumentenarchivierungsregeln durch die Markierung möglicherweise schwärzungspflichtiger Daten leichter einhalten.

Einführung in Amazon Textract (3:04)

Vorteile

Schnelle und genaue Datenextraktion

Amazon Textract macht die schnelle und genaue Datenextraktion aus Dokumenten, Formularen und Tabellen zum Kinderspiel. Amazon Textract erkennt automatisch das Layout eines Dokuments und die Schlüsselelemente auf der Seite, versteht die Datenbeziehungen in eingebetteten Formularen oder Tabellen und extrahiert sämtliche Informationen mit intaktem Kontext. So können Sie die extrahierten Daten sofort in einer Anwendung verwenden oder in einer Datenbank speichern - ohne komplizierte Programmierung als Zwischenschritt.



Keine Pflege von Code oder Vorlagen nötig

Die vortrainierten Machine-Learning-Modelle von Amazon Textract machen die Programmierung von Code zur Datenextraktion oberflüssig, da sie bereits mit mehreren Millionen Dokumenten aus fast jeder Branche trainiert wurden - darunter Verträge, Steuerdokumente, Verkaufsaufträge, Anmeldungsformulare, Antragsformulare für Leistungen, Versicherungsforderungen, Richtliniendokumente und mehr. Sie müssen keinen Code mehr für jedes mögliche Dokument oder Formular pflegen oder sich Gedanken um die mögliche Änderung an Seitenlayouts machen.

Senken Sie die Dokumentverarbeitungskosten

Amazon Textract bietet optische Zeichenerkennung und strukturierte Datenextraktion (Formulare und Tabellen) zu geringen Kosten und Sie zahlen nur für das, was Sie verbrauchen. Es gibt keine Vorauszahlungen oder langfristigen Verträge. Mit den Textextraktions-APIs von Amazon Textract können Sie problemlos Millionen von Dokumenten verarbeiten.

Anwendungsfälle

Erstellen Sie intelligente Suchindizes

Extrahieren Sie strukturierte Daten aus Dokumenten und erstellen Sie einen intelligenten Index, mit dem Sie schnell Millionen von Finanzberichten durchsuchen können. Zum Beispiel könnte ein Finanzierungsunternehmen Amazon Textract verwenden, um innerhalb weniger Stunden Millionen von gescannten Darlehensanträgen zu scannen und die extrahierten Daten in Amazon Elasticsearch zu indizieren. So wäre das Unternehmen in der Lage, Suchanfragen wie „Darlehensanträge suchen, bei denen der Name des Antragstellers Max Mustermann lautet“ zu erstellen, oder „Verträge suchen, bei denen der Zinssatz 2 Prozent beträgt“.

Erstellen Sie automatisierte Dokumentenverarbeitungs-Workflows

Amazon Textract kann die erforderlichen Eingaben bereitstellen, um Formulare automatisch und ohne menschliches Zutun zu verarbeiten. Beispielsweise können Banken Kreditanträge mithilfe von Amazon Textract automatisieren. Die in den Dokumenten enthaltenen Informationen könnten verwendet werden, um alle zur Genehmigung des Darlehens erforderlichen Hintergrund- und Kreditwürdigkeitsprüfungen zu initiieren. So können Kunden eine sofortige Entscheidung über ihren Antrag erhalten, statt mehrere Tage bis zum Abschluss der manuellen Prüfung und Validierung warten zu müssen.

Bewahren Sie Compliance in Dokumentarchiven

Da Amazon Textract Datentypen und Formularbeschriftungen automatisch erkennt, lässt sich die Einhaltung von Informationskontrollen leicht wahren. Zum Beispiel könnte ein Versicherungsunternehmen Amazon Textract verwenden, um in einem Workflow vor der Archivierung von Antragsformularen personenbezogene Informationen automatisch zur Prüfung zu schwärzen, indem es die wichtigen, zu schützenden Schlüsselwertpaare automatisch erkennt.

Product-Page_Standard-Icons_01_Product-Features_SqInk
Sehen Sie sich die Merkmale von Amazon Textract an

Entdecken Sie weitere Amazon Textract-Funktionen

Erfahren Sie mehr 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Registrieren Sie sich und erhalten Sie ein kostenloses Konto

Sie erhalten sofort Zugriff auf das kostenlose AWS-Kontingent. 

Registrieren 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Beginnen Sie mit der Entwicklung in der Konsole

Beginnen Sie mit der Entwicklung mit Amazon Textract in der AWS-Managementkonsole.

Registrieren