Amazon Textract

Estrazione semplificata di testo e dati da qualsiasi documento
Amazon Textract è un servizio basato sul machine learning completamente gestito che estrae automaticamente testo e dati da documenti scansionati andando oltre il semplice riconoscimento ottico dei caratteri (OCR) per identificare, capire ed estrarre i dati da moduli e tabelle.

Oggi molte aziende estraggono dati da documenti scansionati, come PDF, tabelle e moduli tramite l'immissione manuale dei dati, un processo lento e costoso e suscettibile di errori, o attraverso semplici software OCR che richiedono una configurazione manuale da aggiornare ogni volta che il modulo cambia per renderne possibile l'utilizzo.
 
Per superare questi processi manuali, Textract usa il machine learning per leggere ed elaborare istantaneamente qualsiasi tipo di documento estraendo in modo preciso testo, moduli, tabelle e altri dati senza che sia necessario un intervento manuale o un codice personalizzato.

Grazie a Textract puoi automatizzare velocemente le attività manuali per i documenti, rendendo così possibile l'elaborazione di milioni di pagine di documenti nel giro di poche ore. Una volta acquisita l'informazione, è possibile intervenire con le applicazioni aziendali per avviare le fasi successive di una richiesta di prestito, di un documento fiscale, di un modulo di iscrizione o dell'elaborazione di reclami nel settore medico. Inoltre, è possibile creare indici per ricerca intelligente o aggiungere revisioni manuali tramite Amazon Augmented AI per controllare dati sfumati o sensibili.

Vantaggi

Estrazione veloce e precisa di dati strutturati e non

Amazon Textract usa l'intelligenza artificiale per "leggere" i documenti proprio come farebbe una persona, in modo da estrarre non solo il testo ma anche tabelle, moduli e altri dati strutturati senza la necessità di configurazione, formazione o codice personalizzato. Amazon Textract identifica automaticamente il layout di un documento e gli elementi principali della pagina, comprende le relazioni tra i dati in qualsiasi modulo o tabella incorporati ed estrae gli elementi insieme al relativo contesto senza alterarli.

Oltre il semplice riconoscimento ottico dei caratteri (OCR)

Amazon Textract usa la tecnologia OCR per individuare etichette e valori dei moduli ed estrae le informazioni dalle tabelle senza comprometterne la struttura a un costo ridotto. I prezzi sono calcolati solo in base all'uso effettivo senza necessità di impegni anticipati né contratti a lungo termine. 

Sicurezza e compliance

Textract può essere utilizzato per carichi di lavoro soggetti alla conformità SOC (Service Organization Control), alla conformità ISO (International Organization for Standardization), PCI, HIPAA e GPDR. I clienti dei settori finanziario, sanitario e di altri settori possono ottenere analisi dei processi e controlli di sicurezza che proteggono i loro dati clienti. Textract supporta anche gli endpoint Amazon Virtual Private Cloud (Amazon VPC) tramite AWS PrivateLink, che consente ai clienti di avviare in sicurezza le chiamate API ad Amazon Textract dall'interno del loro VPC ed evitare così l'uso dell'Internet pubblica.

Implementazione semplice delle revisioni umane

Amazon Textract è direttamente integrata con Amazon Augmented AI (Amazon A2I) e permette così di implementare facilmente la revisione umana dei testi estratti dai documenti. È possibile incorporare revisioni umane per gestire flussi di lavoro sfumati o sensibili che richiedono un giudizio umano per ottenere previsioni ad elevata attendibilità o per controllare le previsioni su base continuativa.

What is Amazon Textract (1:49)

Casi d'uso

Creazione di indici per ricerca intelligente

Estrai dati strutturati da documenti e crea un indice intelligente con per effettuare ricerche rapidamente in milioni di rendiconti finanziari. Ad esempio, un'azienda che concede mutui può sfruttare Amazon Textract per elaborare milioni di richieste di prestito scansionate in poche ore e disporre dell'indice dei dati estratti in Amazon Elasticsearch. Così facendo, si crea una memoria di ricerca del tipo: "cerca richieste di prestito a nome Mario Rossi" o "cerca contratti con tasso di interesse del 2%".

Creazione di flussi di lavoro di elaborazione di documenti automatizzati

Amazon Textract fornisce gli input necessari per elaborare moduli automaticamente e senza l'intervento umano. Per esempio, le banche possono automatizzare le richieste di prestito utilizzando Amazon Textract. Le informazioni contenute nel documento potrebbero essere utilizzate per avviare i controlli preliminari e di verifica del credito necessari per l'approvazione della richiesta di prestito, affinché i clienti possano conoscerne il risultato in breve tempo, non dovendo quindi aspettare tanti giorni come in caso di verifica manuale e convalida.

Mantenimento della conformità negli archivi dei documenti

Poiché Amazon Textract identifica i tipi di dati e modelli automaticamente, è semplice mantenere la conformità nei controlli delle informazioni. Ad esempio, un assicuratore potrebbe usare Amazon Textract per alimentare un flusso di lavoro che redige automaticamente informazioni identificabili personalmente (PII) per la loro verifica prima di archiviare moduli di registrazione, riconoscendo automaticamente coppie di valori chiave importanti che richiedono protezione.

Storie di successo

change-healthcare-600x400

Change Healthcare è una compagnia di tecnologia sanitaria indipendente leader del settore che fornisce soluzioni basate sui dati e sulle analisi per migliorare i risultati clinici, finanziari e aumentare il coinvolgimento dei pazienti nel sistema sanitario americano.

"A Change Healthcare crediamo che sia possibile rendere l'assistenza sanitaria accessibile a tutti aumentando la velocità e la qualità delle decisioni amministrative e finanziarie. Questo è possibile grazie alla tecnologia di machine learning che permette di ottenere di più dai dati. Ma spesso può essere difficile ottenere tutto il potenziale di queste informazioni che si trovano incasellate in tabelle e moduli che i sistemi di riconoscimento ottico dei caratteri tradizionali non sono in grado di analizzare. Amazon Textract migliora notevolmente la comprensione dei documenti grazie alla possibilità di recuperare dati strutturati oltre al testo e ora che il servizio sarà conforme HIPAA saremo in grado di ottenere informazioni da milioni di documenti e creare ancora più valore per pazienti, contribuenti e fornitori".

Nick Giannasi, EVP and Chief AI Officer - Change Healthcare


filevine-600x400

Filevine è il centro nevralgico dei professionisti del settore legale e include gestione di casi e questioni legali, gestione documenti e analisi approfondita del report basate sul cloud. Dal suo lancio nel 2015, Filevine si è concentrata innovazione rapida e premiata progettazione, ottenendo i rating più alti dai siti di recensioni indipendenti.

"Ogni giorno Filevine gestisce milioni di file di casi e questioni legali. Abbiamo scelto Amazon Web Services perché volevamo fornire ai nostri clienti le migliori soluzioni di ricerca di documenti. Amazon Textract è rapido, accurato e scalabile: consente a Filevine di soddisfare gli impegnativi requisiti delle organizzazioni legali più grandi e sofisticate al mondo. Con Filevine e Amazon, non è mai stato così facile per i professionisti del settore legale trovare il proverbiale ago nel pagliaio."

Ryan Anderson, Chief Executive Officer - Filevine


CD_2018_Primary_Logo_w_TM

La piattaforma di soluzioni e servizi ClearDATA protegge i clienti dai rischi relativi alla privacy dei dati, migliora la gestione dei dati e permette di calibrare l'infrastruttura IT sanitaria, offrendo così al settore di concentrarsi sul miglioramento dell'assistenza sanitaria ogni singolo giorno.

"È davvero magnifico che AWS abbia aggiunto Textract, il servizio di riconoscimento ottico dei caratteri alimentato da machine learning alla lista dei servizi conformi HIPAA. Molti dati medici condivisi tra contribuenti e fornitori sono bloccati in file pdf basati su immagini. Ora le organizzazioni possono smettere di elaborare questo tipo di dati manualmente e utilizzare il servizio Amazon Textract per estrarre i dati medici da file che risultavano illeggibili dalle macchine. Questo offre l'opportunità di integrare i dati con i record sanitari elettronici o altre tecnologie cloud come Amazon Comprehend Medical che può identificare le informazioni sanitarie protette nei set di dati. Questo è solo un altro passa avanti verso l'opportunità di utilizzare le tecnologie emergenti per migliorare l'accesso ai dati, ottenere informazioni più dettagliate, diminuire i costi e migliorare l'esperienza di membri e pazienti".

Matt Ferrari, Chief Technology Officer - ClearDATA

Product-Page_Standard-Icons_01_Product-Features_SqInk
Scopri le funzionalità di Amazon Textract

Scopri di più sulle funzionalità di Amazon Textract.

Ulteriori informazioni 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Registrati per creare un account gratuito

Ottieni l'accesso istantaneo al piano gratuito di AWS. 

Registrati 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Inizia subito nella console

Inizia subito a utilizzare Amazon Textract nella console di gestione AWS.

Registrati