Amazon Textract

Extrahieren Sie Text und Daten ganz einfach aus praktisch jedem Dokument
Amazon Textract ist ein vollständig verwalteter Machine-Learning-Service, der Text und Daten automatisch aus eingescannten Dokumenten extrahiert. Dieser Vorgang geht über eine einfache optische Zeichenerkennung (Optical Character Recognition, OCR) zum Identifizieren, Verstehen und Extrahieren von Daten aus Formularen und Tabellen hinaus.

Viele Unternehmen extrahieren heute Daten aus eingescannten Dokumenten wie PDF-Dateien, Tabellen und Formularen durch manuelle Texteingaben (langsam, teuer und fehleranfällig) oder durch einfache OCR-Software, die manuell konfiguriert und bei jeder Änderung der Form aktualisiert werden muss, um zu funktionieren.
 
Um diese manuellen Prozesse abzuschaffen, verwendet Textract Machine Learning zum sofortigen Lesen und Verarbeiten beliebiger Dokumenttypen, zum präzisen Extrahieren von Text, Formularen, Tabellen und anderen Daten, ohne dass manuelle Arbeit oder benutzerdefinierter Code erforderlich ist.

Mit Textract können Sie manuelle Dokumentenaktivitäten schnell automatisieren und so Millionen Dokumentenseiten in wenigen Stunden verarbeiten. Nach dem Erfassen der Informationen können Sie diese innerhalb ihrer Geschäftsanwendungen nutzen, um etwa die nächsten Schritte für einen Darlehensantrag, ein Steuerdokument oder ein Registrierungsformular einzuleiten oder Krankenversicherungsansprüche zu verarbeiten. Außerdem können Sie intelligente Suchindizes erstellen oder menschliche Überprüfungen mit Amazon Augmented AI hinzufügen, um nuancierte oder vertrauliche Daten zu überprüfen.

Vorteile

Schnelles und präzises Extrahieren strukturierter und unstrukturierter Daten

Amazon Textract verwendet künstliche Intelligenz, um Dokumente ähnlich wie ein Mensch zu "lesen" und Texte, Tabellen, Formulare sowie andere strukturierte Daten ohne Konfiguration, Training oder benutzerdefinierten Code zu extrahieren. Amazon Textract erkennt automatisch das Layout eines Dokuments und die Schlüsselelemente auf der Seite, versteht die Datenbeziehungen in eingebetteten Formularen oder Tabellen und extrahiert alles mit intaktem Kontext.

Mehr als eine einfache optische Zeichenerkennung (Optical Character Recognition, OCR)

Amazon Textract verwendet OCR-Technologie zum Identifizieren von Formularbeschriftungen und -werten und extrahiert Informationen aus Tabellen, ohne die Struktur zu gefährden – alles zu niedrigen Kosten. Sie zahlen nur für das, was Sie tatsächlich nutzen, und es gibt keine Vorabverpflichtungen oder langfristigen Vertragsbindungen. 

Sicherheit und Compliance

Textract kann für Workloads verwendet werden, die zur Einhaltung der Service Organization Control (SOC), der International Organization for Standardization (ISO), PCI, HIPAA und DSGVO unterliegen. Kunden aus dem Finanzsektor, dem Gesundheitswesen und anderen Branchen können Einblicke in die Sicherheitsprozesse und -kontrollen, die ihre Kundendaten schützen, erhalten. Textract unterstützt auch Amazon Virtual Private Cloud (Amazon VPC)-Endpunkte über den AWS PrivateLink, weswegen Kunden API-Aufrufe an Amazon Textract sicher von ihrem VPC aus initiieren und die Nutzung des öffentlichen Internets vermeiden können.

Einfache Implementierung der Überprüfung durch Menschen

Amazon Textract ist direkt in Amazon Augmented AI (Amazon A2I) integriert, sodass Sie für Texte, die aus Dokumenten extrahiert werden, problemlos die Überprüfung durch Menschen implementieren können. Sie können Überprüfungen durch Menschen integrieren, um nuancierte oder vertrauliche Workloads zu verwalten, die menschliches Urteilsvermögen erfordern, um Vorhersagen mit hoher Zuverlässigkeit zu erhalten oder Vorhersagen laufend zu prüfen.

Was ist Amazon Textract (1:49)

Anwendungsfälle

Erstellen Sie intelligente Suchindizes

Extrahieren Sie strukturierte Daten aus Dokumenten und erstellen Sie einen intelligenten Index, mit dem Sie schnell Millionen von Finanzberichten durchsuchen können. Zum Beispiel könnte ein Finanzierungsunternehmen Amazon Textract verwenden, um innerhalb weniger Stunden Millionen von gescannten Darlehensanträgen zu scannen und die extrahierten Daten in Amazon Elasticsearch zu indizieren. So wäre das Unternehmen in der Lage, Suchanfragen wie „Darlehensanträge suchen, bei denen der Name des Antragstellers Max Mustermann lautet“ zu erstellen, oder „Verträge suchen, bei denen der Zinssatz 2 Prozent beträgt“.

Erstellen Sie automatisierte Dokumentenverarbeitungs-Workflows

Amazon Textract kann die erforderlichen Eingaben bereitstellen, um Formulare automatisch und ohne menschliches Zutun zu verarbeiten. Beispielsweise können Banken Kreditanträge mithilfe von Amazon Textract automatisieren. Die in den Dokumenten enthaltenen Informationen könnten verwendet werden, um alle zur Genehmigung des Darlehens erforderlichen Hintergrund- und Kreditwürdigkeitsprüfungen zu initiieren. So können Kunden eine sofortige Entscheidung über ihren Antrag erhalten, statt mehrere Tage bis zum Abschluss der manuellen Prüfung und Validierung warten zu müssen.

Bewahren Sie Compliance in Dokumentarchiven

Da Amazon Textract Datentypen und Formularbeschriftungen automatisch erkennt, lässt sich die Einhaltung von Informationskontrollen leicht wahren. Zum Beispiel könnte ein Versicherungsunternehmen Amazon Textract verwenden, um in einem Workflow vor der Archivierung von Antragsformularen personenbezogene Informationen automatisch zur Prüfung zu schwärzen, indem es die wichtigen, zu schützenden Schlüsselwertpaare automatisch erkennt.

Kundenerfolg

machine leanring_kabbage logo

Kabbage ist ein Daten- und Technologieunternehmen, das Cash-Flow-Lösungen für kleine Unternehmen anbietet, darunter Zugang zu flexiblen Kreditlinien, Online-Zahlungen, Cash-Flow-Einblicke und Geschäftsgirokonten.

"Amazon Textract hat uns geholfen, 80% der PPP-Anwendungen zu unterstützen, um eine vollautomatische Ausleihe zu ermöglichen und die Genehmigungszeiten von mehreren Tagen auf eine durchschnittliche Geschwindigkeit von 4 Stunden zu reduzieren. Am Ende des Programms waren wir, gemessen am Volumen der Anwendungen, der zweitgrößte PPP-Kreditgeber in den USA und übertrafen die großen US-Banken - mit über 297.000 kleinen Unternehmen und schätzungsweise 945.000 Arbeitsplätzen in ganz Amerika."

Anthony Sabelli, Head of Data Science bei Kabbage



change-healthcare-600x400

Change Healthcare ist eine führende unabhängige Gesundheitstechnikfirma, die zur Verbesserung klinischer, finanzieller und patientenengagementbezogener Ergebnisse im US-Gesundheitssystem Daten und analysegetriebene Lösungen anbietet.

„Bei Change Healthcare glauben wir daran, dass wir das Gesundheitswesen für alle bezahlbar und zugänglich gestalten können, indem wir die Zeitrahmen und Qualität von Finanz- und Verwaltungsentscheidungen verbessern. Dies kann durch die Kraft der Machine Learning-Technologie zwecks besseren Verständnisses unserer Daten bewerkstelligt werden. Doch die Freisetzung des Potentials dieser Informationen ist oft schwierig, da sie in Tabellen und Formularen gespeichert sind, die von herkömmlicher optischer Schrifterkennung nicht analysiert werden können. Amazon Textract fördert mit seiner Fähigkeit zur Extraktion strukturierter Daten zusätzlich zu Text das Verständnis von Dokumenten, und da der Service nun HIPPA-konform wird, können wir die Informationen aus Millionen von Dokumenten befreien und für Patienten, Zahler und Anbieter noch mehr Wert schöpfen.“

Nick Giannasi, EVP und Chief AI Officer – Change Healthcare


filevine-600x400

Filevine ist der operative Kern für Rechtsexperten, einschließlich der Cloud-basierten Fall- und Sachverhaltsverwaltung, der Dokumentenverwaltung und der umfassenden Analyse von Berichten. Seit der Markteinführung im Jahr 2015 konzentrierte sich Filevine auf schnelle Innovation und preisgekröntes Design. Unabhängigen Prüfstellen haben Filevine die höchsten Bewertungen gegeben.

„Es werden jeden Tag Millionen von Sachverhalten und Fallakten in Filevine bearbeitet. Wir haben uns für Amazon Web Services entschieden, weil wir unseren Kunden erstklassige Lösungen für die Dokumentensuche bieten wollten. Amazon Textract ist schnell, genau und skalierbar – es hilft Filevine, die hohen Anforderungen der weltweit größten und anspruchsvollsten juristischen Organisationen zu erfüllen. Mit Filevine und Amazon war es für Juristen noch nie einfacher, die sprichwörtliche Nadel im Heuhaufen zu finden.“

Ryan Anderson, Chief Executive Officer – Filevine


Product-Page_Standard-Icons_01_Product-Features_SqInk
Sehen Sie sich die Merkmale von Amazon Textract an

Entdecken Sie weitere Amazon Textract-Funktionen

Weitere Informationen 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Registrieren Sie sich und erhalten Sie ein kostenloses Konto

Sie erhalten sofort Zugriff auf das kostenlose AWS-Kontingent. 

Registrieren 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Beginnen Sie mit der Entwicklung in der Konsole

Beginnen Sie mit der Entwicklung mit Amazon Textract in der AWS-Managementkonsole.

Registrieren