Caratteristiche di Amazon Textract

Tutti i dati estratti vengono restituiti con coordinate di riquadri di delimitazione, ovvero cornici poligonali che racchiudono ciascun dato identificato, ad esempio una singola parola, una riga, una tabella o anche singole celle all'interno di una tabella. È una funzione utile per verificare il punto del documento sorgente da cui proviene una parola o un numero o per guidare l'utente nei sistemi di ricerca di documenti che restituiscono scansioni di documenti originali come risultato di ricerca. Ad esempio, quando ricercano dettagli sull'anamnesi di un paziente nei referti medici, gli utenti possono individuare con facilità il documento sorgente e prendere rapidamente nota per le ricerche future.

Ulteriori informazioni »

Riconoscimento ottico dei caratteri

Amazon Textract utilizza il riconoscimento ottico dei caratteri (OCR) per rilevare automaticamente testo stampato, scrittura a mano e numeri in una scansione o nel rendering di un documento, come documenti legali o un libro scansionato.

Ulteriori informazioni »

Analyze Lending

L'API Analyze Lending è un'API di elaborazione intelligente dei documenti gestita e preconfigurata che automatizza completamente l'estrazione di informazioni dai pacchetti di prestito. I clienti possono semplicemente caricare i documenti del proprio mutuo nell'API Analyze Lending e i modelli di machine learning integrati classificheranno e suddivideranno il pacchetto di documenti in base al tipo di documento.

Ulteriori informazioni »

Estrazione da moduli

È possibile individuare automaticamente coppie chiave-valore nelle immagini dei documenti e mantenere il contesto senza alcun intervento manuale. Una coppia chiave-valore è un set di elementi di dati collegati. Ad esempio, in un documento, il campo "First Name" (Nome) è la chiave e "Jane" il valore. Ciò permette di importare facilmente i dati estratti in un database o di utilizzarli come variabile in un'applicazione. Con le soluzioni OCR tradizionali, chiavi e valori vengono estratti come testo semplice e la loro relazione si perde a meno di non scrivere e mantenere regole a codifica fissa per ogni modulo.

Ulteriori informazioni »

Estrazione dalle tabelle

Amazon Textract preserva la composizione dei dati archiviati nelle tabelle durante l'estrazione. Ciò è utile per i documenti costituiti per la maggior parte da dati strutturati, come report finanziari o referti medici con tabelle in colonne e righe. È possibile caricare automaticamente i dati estratti su un database attraverso uno schema predefinito. Ad esempio, le righe di elementi numerici e quantità di un inventario manterranno la loro associazione, in modo che un'applicazione per la gestione degli inventari possa incrementare gli elementi totali in modo semplice.

Ulteriori informazioni »

Rilevamento di firme

Amazon Textract consente di rilevare le firme su qualsiasi documento o immagine. In questo modo è facile rilevare automaticamente le firme su documenti come assegni, moduli di richiesta di prestito e moduli di richiesta di risarcimento. La posizione delle firme e i punteggi di affidabilità associati sono inclusi nella risposta API.

Ulteriori informazioni »

Estrazione basata su query

Amazon Textract ti fornisce la flessibilità di specificare i dati che devi estrarre dai documenti utilizzando query. È possibile specificare le informazioni necessarie sotto forma di domande in linguaggio naturale (ad esempio, "Come si chiama il cliente?") e ricevere l'informazione esatta (ad esempio, "John Doe") come parte della risposta dell'API. Non è necessario conoscere la struttura dei dati nel documento (tabella, modulo, campo implicato, dati annidati) o preoccuparsi delle variazioni tra versioni e formati dei documenti. Le query di Textract sono pre-addestrate su un'ampia varietà di documenti, tra cui buste paga, estratti conto, moduli W-2, moduli di richiesta di prestito, note ipotecarie, richieste di risarcimento e tessere sanitarie. La flessibilità fornita dalle query di Textract riduce la necessità di post-elaborazione, affidamento alle revisioni manuali dei dati estratti o addestramento di modelli di ML.

Ulteriori informazioni »

Riconoscimento della scrittura a mano

Molti documenti, come moduli di ricovero ospedaliero e domande di lavoro, includono sia testo manoscritto sia testo stampato. Amazon Textract può estrarre entrambi da documenti scritti in inglese con alti punteggi di affidabilità, a prescindere che il testo sia in forma libera o racchiuso in tabelle. I documenti possono anche contenere un misto di testo stampato e manoscritto.

Ulteriori informazioni »

Fatture e ricevute

Fatture e ricevute possono avere un'ampia gamma di layout, pertanto l'estrazione di dati manuale su larga scala è un processo lungo e difficile. Amazon Textract sfrutta il machine learning (ML) per capire il contesto di fatture e ricevute ed estrae automaticamente dati rilevanti, ad esempio nome del fornitore, numero della fattura, prezzi delle voci, importo totale e termini di pagamento.

Ulteriori informazioni »

Documenti d'identità

Amazon Textract sfrutta il machine learning (ML) per capire il contesto di documenti d'identità come passaporti e patenti di guida statunitensi senza la necessità di modelli o configurazione. È possibile estrarre automaticamente informazioni specifiche come data di scadenza e data di nascita oppure identificare ed estrarre in modo intelligente le informazioni implicite come il nome e l'indirizzo. Utilizzando Analyze ID, le aziende che forniscono servizi di verifica dei documenti d'identità e quelle che operano nei settori finanziario, sanitario e assicurativo possono facilmente automatizzare la creazione di account, la pianificazione di appuntamenti, le domande di lavoro e altro, permettendo ai clienti di inviare un'immagine o una scansione del proprio documento d'identità.

Ulteriori informazioni »

Riquadri di delimitazione

Tutti i dati estratti vengono restituiti con coordinate di riquadri di delimitazione, cioè cornici poligonali che racchiudono ciascun dato identificato, ad esempio una parola, una riga, una tabella o singole celle all'interno di una tabella. Ciò ti aiuta a verificare il punto del documento sorgente da cui proviene una parola o un numero e ti guida quando i risultati della ricerca forniscono scansioni di documenti originali. Ad esempio, quando ricerchi dettagli sull'anamnesi di un paziente nei referti medici, puoi facilmente trovare il documento sorgente e prendere nota per le ricerche future.

Ulteriori informazioni »

Soglie di affidabilità regolabili

Quando si estraggono informazioni dai documenti, Amazon Textract restituisce un punteggio di affidabilità per tutti gli elementi che identifica, così puoi prendere decisioni informate su come utilizzare i risultati. Ad esempio, se estrai informazioni da registri fiscali e desideri garantire una precisione elevata, puoi contrassegnare ogni voce con un punteggio di affidabilità inferiore al 95% in modo che venga rivista da una persona. È possibile impostare una soglia inferiore per altri documenti in cui gli errori avrebbero meno conseguenze negative, come nell'elaborazione di CV o nella digitalizzazione di registri archiviati.

Ulteriori informazioni »

Flusso di lavoro di revisione umana integrato

Amazon Textract è direttamente integrato con Amazon Augmented AI (A2I) e permette così di implementare facilmente la revisione umana di testo stampato e scrittura a mano estratti dai documenti. Molte applicazioni di estrazione di testo richiedono la revisione umana di previsioni a bassa affidabilità per garantire che i risultati siano corretti, ma la creazione di sistemi atti allo scopo può essere un processo lungo e dispendioso. Amazon A2I fornisce flussi di lavoro di revisione umana per consentirti di rivedere facilmente le previsioni. Scegli una soglia di affidabilità per la tua applicazione e tutte le previsioni con un'affidabilità inferiore a tale soglia verranno automaticamente sottoposte alla convalida di revisori umani. È inoltre possibile specificare quali coppie chiave-valore dovrebbero essere sottoposte alla revisione umana e configurare A2I in modo che sottoponga a revisione anche documenti selezionati in modo casuale. Approfitta di un pool di revisori all'interno della tua organizzazione o accedi alla forza lavoro di oltre 500.000 liberi professionisti che sono già impegnati in attività di machine learning attraverso Amazon Mechanical Turk. Puoi anche utilizzare la forza lavoro di fornitori che sono stati pre-selezionati da AWS in virtù della qualità e della conformità alle procedure di sicurezza. Per saperne di più sull'implementazione dei flussi di lavoro di revisione umana, consulta il sito Web di Amazon A2I e Amazon A2I Integration with Amazon Textract (Integrazione di Amazon A2I con Amazon Textract) nella guida per gli sviluppatori. 

Prezzi di Amazon Textract

Amazon Textract è un servizio di machine learning (ML) che estrae automaticamente testo, scrittura a mano e dati da documenti scansionati. Si spinge oltre il semplice riconoscimento ottico dei caratteri (OCR) per identificare, capire ed estrarre dati da moduli e tabelle. Con Amazon Textract paghi solo in base all'uso effettivo. Non sono previste tariffe minime né impegni anticipati. Amazon Textract addebita solo le pagine elaborate, a prescindere che tu estragga testo, testo con tabelle, dati di moduli, query o che elabori fatture e documenti di identità. Consulta le domande frequenti per avere ulteriori dettagli sulle pagine e sull'uso accettabile di Textract.

Prezzi di Amazon Textract
Ulteriori informazioni sui prezzi di Amazon Textract

Inizia a utilizzare Amazon Textract senza impegni anticipati o contratti a lungo termine.

Ulteriori informazioni 
Registrati per creare un account gratuito
Registrati per creare un account gratuito

Ottieni l'accesso immediato al piano gratuito di AWS. 

Registrati 
Inizia a lavorare nella console
Inizia a lavorare nella console

Inizia subito a utilizzare Amazon Textract nella Console di gestione AWS.

Registrati