Amazon Textract

Extrahieren Sie Text und Daten ganz einfach aus praktisch jedem Dokument
Amazon Textract ist ein Service, der automatisch Text und Daten aus gescannten Dokumenten extrahiert. Amazon Textract geht über die einfache optische Zeichenerkennung (optical character recognition, OCR) hinaus und identifiziert auch den Inhalt von Feldern in Formularen sowie Informationen in Tabellen.

Viele Unternehmen extrahieren Daten aus Dokumenten heutzutage entweder mit manueller Dateneingabe, die langsam und teuer ist, oder mithilfe optischer Zeichenerkennungssoftware (OCR), die manuell angepasst oder konfiguriert werden muss. Die Regeln und Workflows für jedes Dokument und Formular müssen oft fest einprogrammiert und bei jeder Änderung oder im Falle von mehrseitigen Formularen geändert werden. Weicht das Formular von den Regeln ab, kommt es oft zu einer unleserlichen Ausgabe, die nicht verwendet werden kann.

Amazon Textract überwindet diese Herausforderungen mit Machine Learning. Es kann damit sofort praktisch jede Art von Dokument „lesen“ und Texte und Daten korrekt extrahieren – ganz ohne manuellen Eingriff oder angepassten Code. Mit Textract können Sie Dokumenten-Workflows schnell automatisieren und so eine Million Dokumentenseiten in wenigen Stunden verarbeiten. Nach dem Erfassen der Informationen können Sie diese innerhalb ihrer Geschäftsanwendungen nutzen, um etwa die nächsten Schritte für einen Darlehensantrag einzuleiten oder Krankenversicherungsansprüche zu verarbeiten. Außerdem können Sie intelligente Suchindizes sowie automatisierte Genehmigungs-Workflows erstellen und Dokumentenarchivierungsregeln durch die Markierung möglicherweise schwärzungspflichtiger Daten leichter einhalten.

Einführung in Amazon Textract (3:04)

Vorteile

Schnelle und genaue Datenextraktion

Amazon Textract macht die schnelle und genaue Datenextraktion aus Dokumenten, Formularen und Tabellen zum Kinderspiel. Amazon Textract erkennt automatisch das Layout eines Dokuments und die Schlüsselelemente auf der Seite, versteht die Datenbeziehungen in eingebetteten Formularen oder Tabellen und extrahiert sämtliche Informationen mit intaktem Kontext. So können Sie die extrahierten Daten sofort in einer Anwendung verwenden oder in einer Datenbank speichern - ohne komplizierte Programmierung als Zwischenschritt.



Keine Pflege von Code oder Vorlagen nötig

Die vortrainierten Machine-Learning-Modelle von Amazon Textract machen die Programmierung von Code zur Datenextraktion oberflüssig, da sie bereits mit mehreren Millionen Dokumenten aus fast jeder Branche trainiert wurden - darunter Verträge, Steuerdokumente, Verkaufsaufträge, Anmeldungsformulare, Antragsformulare für Leistungen, Versicherungsforderungen, Richtliniendokumente und mehr. Sie müssen keinen Code mehr für jedes mögliche Dokument oder Formular pflegen oder sich Gedanken um die mögliche Änderung an Seitenlayouts machen.

Senken Sie die Dokumentverarbeitungskosten

Amazon Textract bietet optische Zeichenerkennung und strukturierte Datenextraktion (Formulare und Tabellen) zu geringen Kosten und Sie zahlen nur für das, was Sie verbrauchen. Es gibt keine Vorauszahlungen oder langfristigen Verträge. Mit den Textextraktions-APIs von Amazon Textract können Sie problemlos Millionen von Dokumenten verarbeiten.

Anwendungsfälle

Erstellen Sie intelligente Suchindizes

Extrahieren Sie strukturierte Daten aus Dokumenten und erstellen Sie einen intelligenten Index, mit dem Sie schnell Millionen von Finanzberichten durchsuchen können. Zum Beispiel könnte ein Finanzierungsunternehmen Amazon Textract verwenden, um innerhalb weniger Stunden Millionen von gescannten Darlehensanträgen zu scannen und die extrahierten Daten in Amazon Elasticsearch zu indizieren. So wäre das Unternehmen in der Lage, Suchanfragen wie „Darlehensanträge suchen, bei denen der Name des Antragstellers Max Mustermann lautet“ zu erstellen, oder „Verträge suchen, bei denen der Zinssatz 2 Prozent beträgt“.

Erstellen Sie automatisierte Dokumentenverarbeitungs-Workflows

Amazon Textract kann die erforderlichen Eingaben bereitstellen, um Formulare automatisch und ohne menschliches Zutun zu verarbeiten. Beispielsweise können Banken Kreditanträge mithilfe von Amazon Textract automatisieren. Die in den Dokumenten enthaltenen Informationen könnten verwendet werden, um alle zur Genehmigung des Darlehens erforderlichen Hintergrund- und Kreditwürdigkeitsprüfungen zu initiieren. So können Kunden eine sofortige Entscheidung über ihren Antrag erhalten, statt mehrere Tage bis zum Abschluss der manuellen Prüfung und Validierung warten zu müssen.

Bewahren Sie Compliance in Dokumentarchiven

Da Amazon Textract Datentypen und Formularbeschriftungen automatisch erkennt, lässt sich die Einhaltung von Informationskontrollen leicht wahren. Zum Beispiel könnte ein Versicherungsunternehmen Amazon Textract verwenden, um in einem Workflow vor der Archivierung von Antragsformularen personenbezogene Informationen automatisch zu ihrer Prüfung zu schwärzen, indem es die wichtigen, zu schützenden Schlüsselwertpaare automatisch erkennt.

Kundenerfolg

600x400-cambia-health-solutions_logo

Cambia Health Solutions ist ein Komplettanbieter für Gesundheitslösungen und Mutterunternehmen sechs regionaler Krankenversicherer, darunter Regence, ein Versicherungsunternehmen mit 2,6 Millionen Kunden in den Bundesstaaten Oregon, Idaho, Utah und Washington.

„In den letzten hundert Jahren hat sich Cambia für die Verbesserung der Gesundheitswesens für Menschen und ihre Familien eingesetzt. Zur Unterstützung bei der Erreichung dieses Ziels bewerten wir stets neue Innovationen und Gelegenheiten zur Optimierung der Koordination der Gesundheitspflege. Ein Schwerpunktbereich ist die Optimierung zeit- und arbeitsintensiver Verwaltungsvorgänge. Mit großer Aufregung erforschen wir die Möglichkeiten von Amazon Textract zur Hilfe bei der Automatisierung des Vorgangs der genauen und effizienten Extraktion wertvoller Daten aus Papierformularen. Die starke Kombination aus Datenwissenschaft, K.I. und einem personenbezogenen Ansatz ist für unsere Mission zur Verwandlung des Gesundheitssystems entscheidend.“

Faraz Shafiq, Chief Artificial Intelligence Officer - Cambia Health Solutions


Change Healthcare_red_blue_logo_CMYK-01

Change Healthcare ist eine führende unabhängige Gesundheitstechnikfirma, die zur Verbesserung klinischer, finanzieller und patientenengagementbezogener Ergebnisse im US-Gesundheitssystem Daten und analysegetriebene Lösungen anbietet.

„Bei Change Healthcare glauben wir daran, dass wir das Gesundheitswesen für alle bezahlbar und zugänglich gestalten können, indem wir die Zeitrahmen und Qualität von Finanz- und Verwaltungsentscheidungen verbessern. Dies kann durch die Kraft der Machine Learning-Technologie zwecks besseren Verständnisses unserer Daten bewerkstelligt werden. Doch die Freisetzung des Potentials dieser Informationen ist oft schwierig, da sie in Tabellen und Formularen gespeichert sind, die von herkömmlicher optischer Schrifterkennung nicht analysiert werden können. Amazon Textract fördert mit seiner Fähigkeit zur Extraktion strukturierter Daten zusätzlich zu Text das Verständnis von Dokumenten, und da der Service nun HIPPA-konform wird, können wir die Informationen aus Millionen von Dokumenten befreien und für Patienten, Zahler und Anbieter noch mehr Wert schöpfen.“

Nick Giannasi, EVP and Chief AI Officer - Change Healthcare


CD_2018_Primary_Logo_w_TM

ClearDATAs innovative Lösungs- und Serviceplattform schützt Kunden vor Datensicherheitsrisiken, verbessert ihr Datenmanagement und skaliert ihre Gesundheitswesen-IT-Infrastruktur, so dass es der Branche möglich ist, sich durch Verbesserung der täglichen Erbringung von Gesundheitsdienstleistungen an jedem Tag aufs Neue auf die Verbesserung des Gesundheitswesens zu konzentrieren.

„Es ist aufregend, zu verfolgen, wie AWS ihren von Machine Learning unterstützten optischen Schrifterkennungsservice Textract in seine Liste HIPAA-geeigneter Services aufnimmt. Viele zwischen Zahlern und Anbietern ausgetauschte Daten sind in bildbasierten Dateien wie PDFs gefangen. Statt diese Art Daten manuell zu bearbeiten, können Gesundheitsorganisationen nun den Amazon Textract-Service zur Extraktion medizinischer Daten aus Dateien nutzen, die zuvor nicht maschinell lesbar waren. Das schafft die Gelegenheit, diese Daten mit ihren elektronischen Gesundheitsaufzeichnungen oder anderen Cloud-Technologien wie Amazon Comprehend Medical zu integrieren, die geschützte Gesundheitsinformationen im Datensatz erkennen können. Das ist ein weiterer Schritt vorwärts bei der Verbesserung der Gelegenheit zur Nutzung dieser sich entwickelnden Technologien, um den Zugang zu Daten zu verbessern, bessere Einblicke zu gewinnen und die Erfahrung von Patienten und Mitgliedern zu verbessern.“

Matt Ferrari, Chief Technology Officer - ClearDATA

Product-Page_Standard-Icons_01_Product-Features_SqInk
Sehen Sie sich die Merkmale von Amazon Textract an

Entdecken Sie weitere Amazon Textract-Funktionen

Erfahren Sie mehr 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Registrieren Sie sich und erhalten Sie ein kostenloses Konto

Sie erhalten sofort Zugriff auf das kostenlose AWS-Kontingent. 

Registrieren 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Beginnen Sie mit der Entwicklung in der Konsole

Beginnen Sie mit der Entwicklung mit Amazon Textract in der AWS-Managementkonsole.

Registrieren