Amazon Textract

Estrazione semplificata di testo e dati da qualsiasi documento

Amazon Textract è un servizio che estrae automaticamente testo e dati da documenti scansionati. Amazon Textract va oltre il semplice riconoscimento ottico dei caratteri (OCR) per identificare anche i contenuti dei campi nei moduli e le informazioni memorizzate nelle tabelle.

Oggi molte aziende estraggono dati da documenti e moduli con immissione dati manuale, un processo lento e costoso, o attraverso semplici software di riconoscimento ottico dei caratteri (OCR), che sono difficilmente personalizzabili. Le regole e i flussi di lavoro di ogni documento e modulo spesso devono essere scritti nel codice e aggiornati a ogni modifica del modulo o quando vengono usati più moduli. Se il modulo non rispetta le regole, l'output appare spesso cifrato e non utilizzabile

Amazon Textract rappresenta una soluzione a questi problemi: infatti, usa il machine learning per "leggere" istantaneamente e in virtuale ogni tipo di documento estraendo testo e dati in modo preciso, senza il bisogno di una revisione manuale o di un codice personalizzato. Con Textract puoi automatizzare velocemente i flussi di lavoro dei documenti, elaborando così milioni di pagine di documenti nel giro di poche ore. Una volta acquisita l'informazione, puoi intervenire con le applicazioni aziendali per avviare le fasi successive di una richiesta di prestito o dell'elaborazione di reclami nel settore medico. Inoltre, puoi creare indici di ricerca intelligente e flussi di lavoro di approvazione automatizzati, oltre a rimanere più facilmente conforme alle regole di archiviazione dei documenti segnalando i dati che potrebbero aver bisogno di una revisione.

Presentazione di Amazon Textract

Vantaggi

Estrazione di dati veloce e precisa

Amazon Textract facilita un'estrazione di dati veloce e precisa da documenti e moduli. Amazon Textract identifica automaticamente il layout di un documento e gli elementi chiave della pagina, comprende le relazioni tra i dati in qualsiasi modulo o tabella incorporati ed estrae qualsiasi elemento con il contesto senza danneggiarlo. Ciò significa che puoi usare fin da subito i dati estratti in un'applicazione o archiviarli in un database senza dover passare per diversi codici complicati.



Nessun codice o modello da gestire

I modelli di machine learning preimpostati di Amazon Textract consentono di non dover scrivere codici per l'estrazione di dati perché sono già stati sottoposti a addestramento con decine di milioni di documenti relativi a quasi qualsiasi settore: fatture, ricevute, contratti, documenti fiscali, ordini di acquisto, moduli di iscrizione, richieste di benefit, indennizzi assicurativi, documenti di policy e molti altri. Non dovrai più gestire il codice relativo a ogni documento o modulo che riceverai o preoccuparti di come i layout della pagina cambiano nel tempo.

Costi dell'elaborazione di documenti a basso livello

L'API di estrazione testuale di Amazon Textract consente di elaborare documenti al costo di 1,50 EUR ogni 1.000 pagine. Che tu elabori poche centinaia o milioni di documenti all'anno, Amazon Textract fornisce OCR ed estrazione di dati strutturati (moduli e tabelle) a basso costo, facendoti pagare in base all'utilizzo effettivo. Non sono previsti impegni anticipati né contratti a lungo termine.

Casi d'uso

Creazione di indici per ricerca intelligente

Estrai dati strutturati da documenti e crea un indice intelligente con Amazon Elasticsearch Service per effettuare ricerche rapidamente in milioni di rendiconti finanziari. Ad esempio, un'azienda che concede mutui può sfruttare Amazon Textract per elaborare milioni di richieste di prestito scansionate in poche ore e disporre dell'indice dei dati estratti in Amazon Elasticsearch. Così facendo, si crea una memoria di ricerca del tipo: "cerca richieste di prestito a nome Mario Rossi" o "cerca contratti con tasso di interesse del 2%".

Creazione di flussi di lavoro di elaborazione di documenti automatizzati

Amazon Textract fornisce gli input necessari per elaborare moduli automaticamente e senza l'intervento umano. Ad esempio, una banca potrebbe scrivere un codice per leggere richieste di prestito in formato PDF. Le informazioni contenute nel documento potrebbero essere utilizzate per avviare i controlli preliminari e di verifica del credito necessari per l'approvazione della richiesta di prestito, affinché i clienti possano conoscerne il risultato in breve tempo, non dovendo quindi aspettare tanti giorni come in caso di verifica manuale e convalida.

Mantenimento della conformità negli archivi dei documenti

Poiché Amazon Textract identifica i tipi di dati e modelli automaticamente, è semplice mantenere la conformità nei controlli delle informazioni. Ad esempio, un assicuratore potrebbe usare Amazon Textract per alimentare un flusso di lavoro che redige automaticamente informazioni identificabili personalmente (PII) per la loro verifica prima di archiviare moduli di registrazione, riconoscendo automaticamente coppie di valori chiave importanti che richiedono protezione.

Product-Page_Standard-Icons_01_Product-Features_SqInk
Scopri le funzionalità di Amazon Textract

Ulteriori informazioni su come Amazon Textract identifica coppie di valori chiave, conserva dati tabulari e molto altro.

Ulteriori informazioni 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Registrati per creare un account gratuito

Ottieni accesso istantaneo al piano gratuito di AWS. 

Registrati 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Iscriviti per l'anteprima di Amazon Textract

Inizia a creare con Amazon Textract registrandoti per ottenere l'accesso all'anteprima.

Registrati