Amazon Textract

Extrahieren Sie Text und Daten ganz einfach aus praktisch jedem Dokument
Amazon Textract ist ein Service, der automatisch Text und Daten aus gescannten Dokumenten extrahiert. Amazon Textract geht über die einfache optische Zeichenerkennung (optical character recognition, OCR) hinaus und identifiziert auch den Inhalt von Feldern in Formularen sowie Informationen in Tabellen.

Viele Unternehmen extrahieren Daten aus Dokumenten heutzutage entweder mit manueller Dateneingabe, die langsam und teuer ist, oder mithilfe optischer Zeichenerkennungssoftware (OCR), die manuell angepasst oder konfiguriert werden muss. Die Regeln und Workflows für jedes Dokument und Formular müssen oft fest einprogrammiert und bei jeder Änderung oder im Falle von mehrseitigen Formularen geändert werden. Weicht das Formular von den Regeln ab, kommt es oft zu einer unleserlichen Ausgabe, die nicht verwendet werden kann.

Amazon Textract überwindet diese Herausforderungen mit Machine Learning. Es kann damit sofort praktisch jede Art von Dokument „lesen“ und Texte und Daten korrekt extrahieren – ganz ohne manuellen Eingriff oder angepassten Code. Mit Textract können Sie Dokumenten-Workflows schnell automatisieren und so eine Million Dokumentenseiten in wenigen Stunden verarbeiten. Nach dem Erfassen der Informationen können Sie diese innerhalb ihrer Geschäftsanwendungen nutzen, um etwa die nächsten Schritte für einen Darlehensantrag einzuleiten oder Krankenversicherungsansprüche zu verarbeiten. Außerdem können Sie intelligente Suchindizes sowie automatisierte Genehmigungs-Workflows erstellen und Dokumentenarchivierungsregeln durch die Markierung möglicherweise schwärzungspflichtiger Daten leichter einhalten.

Einführung in Amazon Textract (3:04)

Vorteile

Schnelle und genaue Datenextraktion

Amazon Textract macht die schnelle und genaue Datenextraktion aus Dokumenten, Formularen und Tabellen zum Kinderspiel. Amazon Textract erkennt automatisch das Layout eines Dokuments und die Schlüsselelemente auf der Seite, versteht die Datenbeziehungen in eingebetteten Formularen oder Tabellen und extrahiert sämtliche Informationen mit intaktem Kontext. So können Sie die extrahierten Daten sofort in einer Anwendung verwenden oder in einer Datenbank speichern - ohne komplizierte Programmierung als Zwischenschritt.



Keine Pflege von Code oder Vorlagen nötig

Die vortrainierten Machine-Learning-Modelle von Amazon Textract machen die Programmierung von Code zur Datenextraktion oberflüssig, da sie bereits mit mehreren Millionen Dokumenten aus fast jeder Branche trainiert wurden - darunter Verträge, Steuerdokumente, Verkaufsaufträge, Anmeldungsformulare, Antragsformulare für Leistungen, Versicherungsforderungen, Richtliniendokumente und mehr. Sie müssen keinen Code mehr für jedes mögliche Dokument oder Formular pflegen oder sich Gedanken um die mögliche Änderung an Seitenlayouts machen.

Senken Sie die Dokumentverarbeitungskosten

Amazon Textract bietet optische Zeichenerkennung und strukturierte Datenextraktion (Formulare und Tabellen) zu geringen Kosten und Sie zahlen nur für das, was Sie verbrauchen. Es gibt keine Vorauszahlungen oder langfristigen Verträge. Mit den Textextraktions-APIs von Amazon Textract können Sie problemlos Millionen von Dokumenten verarbeiten.

Anwendungsfälle

Erstellen Sie intelligente Suchindizes

Extrahieren Sie strukturierte Daten aus Dokumenten und erstellen Sie einen intelligenten Index, mit dem Sie schnell Millionen von Finanzberichten durchsuchen können. Zum Beispiel könnte ein Finanzierungsunternehmen Amazon Textract verwenden, um innerhalb weniger Stunden Millionen von gescannten Darlehensanträgen zu scannen und die extrahierten Daten in Amazon Elasticsearch zu indizieren. So wäre das Unternehmen in der Lage, Suchanfragen wie „Darlehensanträge suchen, bei denen der Name des Antragstellers Max Mustermann lautet“ zu erstellen, oder „Verträge suchen, bei denen der Zinssatz 2 Prozent beträgt“.

Erstellen Sie automatisierte Dokumentenverarbeitungs-Workflows

Amazon Textract kann die erforderlichen Eingaben bereitstellen, um Formulare automatisch und ohne menschliches Zutun zu verarbeiten. Beispielsweise können Banken Kreditanträge mithilfe von Amazon Textract automatisieren. Die in den Dokumenten enthaltenen Informationen könnten verwendet werden, um alle zur Genehmigung des Darlehens erforderlichen Hintergrund- und Kreditwürdigkeitsprüfungen zu initiieren. So können Kunden eine sofortige Entscheidung über ihren Antrag erhalten, statt mehrere Tage bis zum Abschluss der manuellen Prüfung und Validierung warten zu müssen.

Bewahren Sie Compliance in Dokumentarchiven

Da Amazon Textract Datentypen und Formularbeschriftungen automatisch erkennt, lässt sich die Einhaltung von Informationskontrollen leicht wahren. Zum Beispiel könnte ein Versicherungsunternehmen Amazon Textract verwenden, um in einem Workflow vor der Archivierung von Antragsformularen personenbezogene Informationen automatisch zur Prüfung zu schwärzen, indem es die wichtigen, zu schützenden Schlüsselwertpaare automatisch erkennt.

Kundenerfolg

Cox Auto_logo
"Bei Cox Automotive wollen wir die Art und Weise verändern, wie die Welt Autos kauft, verkauft, besitzt und nutzt. Um unsere Automotive-Lösungen weiter zu modernisieren, werden wir Amazon Textract nutzen, um die Geschwindigkeit der Fahrzeugtransaktionen zu beschleunigen. Mit Amazon Textract können wir Daten aus Dokumenten und Formularen, wie z. B. Kreditanträge oder Fahrzeugtitel, automatisch erfassen und validieren, um Entscheidungen schneller treffen zu können. Dies reduziert den Aufwand für den Kunden und optimiert den Prozess für alle Beteiligten weiter – vom Hersteller bis zum Käufer."

Bryan Landerman, Chief Technology Officer – Cox Automotive


Healthfirst

Healthfirst ist eine gemeinnützige Pflegedienstorganisation mit einem der am schnellsten wachsenden Gesundheitsplänen in New York. Die Organisation zählt mehr als 1,4 Millionen Mitglieder unterschiedlichster sozialer Schichten und Professionen, wobei sie unter ihrem Dach mehr als 35 000 Anbieter and 4 500 Mitarbeiter beschäftigt.

"Bei Healthfirst entwickeln wir Datenpipelines, durch die gescannte Patientenakten in verwertbare klinische Informationen konvertiert werden. Dadurch können wir unseren Pflegedienst besser koordinieren, qualitativ hochwertige Ergebnisse liefern und korrekte Rückerstattungen für die von uns abgedeckten Mitglieder sicherstellen. Wir nutzen Amazon Textract und Amazon Comprehend Medical, um aus unstrukturierten Datenquellen auf effiziente Weise wirklichen Wert zu gewinnen. Dadurch erreichen wir gegenüber unserem üblichen nachgelagerten Betrieb Umsatzeinsparungen um das 10- bis 20-Fache. Durch eine Erweiterung unserer Analysen auf mehr als 50 000 Akten stoßen wir auch auf undokumentierte Diagnosen und können etwa 5 000 Mitglieder an die für sie nötigen Pflegedienststellen verweisen."

Steve Prewitt, Chief Analytics Officer – Healthfirst


met-office-logo

Das Met Office ist der nationale Wetterdienst des Vereinigten Königreichs. Als solches bietet es weltweit führende Wetter- und Klimaforschungsdienste.

"Wir hoffen, mit Textract Millionen historischer Wetterbeobachtungen aus unseren Dokumentarchiven digitalisieren zu können. Diese Beobachtungen der Wissenschaft in digitaler Form verfügbar zu machen, wird unser Verständnis der klimatischen Abweichungen und Änderungen enorm verbessern."

Philip Brohan, Klimawissenschaftler – Met Office


the-globe-and-mail-logo

The Globe and Mail ist eine nationale Ikone und Kanadas bekannteste Medienmarke.

"Als Nachrichtendienst arbeiten wir noch mit gescannten Dokumenten bzw. mit Dokumenten im PDF-Format, beispielsweise mit Freedom of Information-Anfragen (FOIs, Anträgen auf Zugang zu Informationen), deren für uns wichtigen tabellarischen Informationen für uns bislang nicht elektronisch zugänglich waren. Diese Dokumente wurden noch weit zu wenig genutzt, da unsere Journalisten nicht auf sie zugreifen konnten bzw. gar nicht wussten, dass sie existieren. Mit Amazon Textract können wir Informationen aus Tabellen in PDFs extrahieren und die Daten problemlos in CSV-Dateien ausgeben. Damit stehen sie unseren Journalisten für Suchabfragen bequem zur Verfügung. Für unsere Journalisten steigert sich damit die Effizienz des Informationszugriffs um das Zehnfache."

Michael O’Neill, Managing Director, Digital and Data Science – The Globe and Mail


Roche
"Das NAVIFY-Entscheidungsunterstützungsportfolio von Roche bietet Lösungen, die die Forschung beschleunigen und eine personalisierte Medizin ermöglichen. Aufgrund der Petabyte an medizinischen PDF-Dokumenten, die täglich in Krankenhaussystemen generiert werden, suchten wir nach einem Dokumentenextraktionsservice, der auch in der Lage wäre, nicht standardisierte Dokumente zu verarbeiten. Amazon Textract bietet uns Funktionalität zur Extraktion von Text aus medizinischen Dokumenten, aus dem wir dann mittels Natural Language Processing (NLP) eine umfassende Längsansicht der Patienten erstellen können, was sowohl Entscheidungsprozesse als auch Bevölkerungsanalysen unterstützt."

Ram Balasubramanian, Sr. Director of Software Engineering – Roche Diagnostics Information Solutions

Product-Page_Standard-Icons_01_Product-Features_SqInk
Sehen Sie sich die Merkmale von Amazon Textract an

Entdecken Sie weitere Amazon Textract-Funktionen

Erfahren Sie mehr 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Registrieren Sie sich und erhalten Sie ein kostenloses Konto

Sie erhalten sofort Zugriff auf das kostenlose AWS-Kontingent. 

Registrieren 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Beginnen Sie mit der Entwicklung in der Konsole

Beginnen Sie mit der Entwicklung mit Amazon Textract in der AWS-Managementkonsole.

Registrieren