Amazon Comprehend offre l'elaborazione del linguaggio naturale, il rilevamento e la redazione delle informazioni personali di identificazione (PII), il rilevamento di entità e classificazioni personalizzate, il modeling dell'argomento, a supporto di un'ampia gamma di applicazioni che possono analizzare il testo non elaborato e, grazie ad alcune API, i documenti in vari formati, tra cui PDF e Word.

  • Elaborazione del linguaggio naturale: le API di Amazon Comprehend per il riconoscimento delle entità, l'analisi del sentimento, l'analisi della sintassi, l'estrazione di frasi chiave e il rilevamento della lingua possono essere utilizzate per estrarre informazioni dettagliate dal testo del linguaggio naturale. Le richieste vengono misurate in unità di 100 caratteri (1 unità = 100 caratteri), con una tariffa minima di 3 unità (300 caratteri) a richiesta.
  • Informazioni personali di identificazione (PII): l'API per il rilevamento delle PII trova, all'interno di un documento, le ubicazioni delle entità "PII" (informazioni personali di identificazione) scelte e può essere utilizzata per creare versioni redatte di documenti. L'API Contiene PII indica se un documento contiene o meno l'entità PII scelta. Anche queste richieste vengono misurate in unità di 100 caratteri (1 unità = 100 caratteri), con una tariffa minima di 3 unità (300 caratteri) a richiesta.
  • Comprehend personalizzato: le API per le entità e classificazioni personalizzate possono addestrare il modello NLP personalizzato affinché suddivida in categorie il testo ed estragga le entità personalizzate. Le richieste di inferenza asincrona vengono misurate in unità di 100 caratteri, con una tariffa minima di 3 unità (300 caratteri) a richiesta. Ti vengono addebitati 3 USD all'ora per il training del modello (fatturati a secondo) e 0,50 USD al mese per la gestione del modello personalizzata. Per le richieste di sincronizzazione della classificazione personalizzata e delle inferenze delle entità, fornisci un endpoint con prestazioni appropriate. Paghi per l'intervallo di tempo che va dall'avvio del tuo endpoint fino alla sua eliminazione.
  • Modeling dell'argomento: identifica termini o argomenti rilevanti da una raccolta di documenti archiviati in Amazon S3. L'API identifica gli argomenti più comuni nella raccolta e li organizza in gruppi, quindi associa ogni documento a un argomento. I costi addebitati dipendono dalle dimensioni totali dei documenti elaborati per ogni processo. Per i primi 100 MB viene addebitata una tariffa fissa. Oltre i 100 MB, paghi per MB.
  • Ulteriori informazioni sui prezzi di Amazon Comprehend Medical sono disponibili qui.
  • Puoi stimare i tuoi costi con il Calcolatore prezzi di AWS.
Contattaci per conoscere i prezzi di volumi superiori a 100 milioni di unità al mese.
Le richieste di elaborazione del linguaggio naturale vengono misurate in unità di 100 caratteri, con una tariffa minima di 3 unità (300 caratteri) a richiesta.

Con le API di Amazon Comprehend, è possibile elaborare sia testo non elaborato e non strutturato che, grazie ad alcune API, altri file di testo come documenti PDF e Word. 

Comprehend personalizzato

Entità personalizzate e classificazione
Per il riconoscimento asincrono di entità su documenti PDF*, Word e testo semplice

Le richieste di inferenza vengono misurate in unità di 100 caratteri, con una tariffa minima di 3 unità (300 caratteri) a richiesta.

Per la classificazione asincrona

Le richieste di inferenza vengono misurate in unità di 100 caratteri, con una tariffa minima di 3 unità (300 caratteri) a richiesta.

Per la classificazione sincrona e il riconoscimento delle entità

Gli endpoint vengono fatturati in secondi, con un minimo di 60 secondi. Continui a pagare dal momento in cui fai partire l’endpoint fino a quando non lo elimini, anche se non viene analizzato alcun documento.

Una unità di inferenza (IU) fornisce una prestazione di 100 caratteri al secondo sul tuo endpoint gestito. Puoi fornire IU aggiuntive per aumentare le prestazioni. Ciascuna IU comporterà un costo di 0,0005 USD al secondo.

3 USD all'ora per la formazione del modello

*per estrarre testo da documenti PDF scansionati viene chiamata l'API Detect Document Text di Amazon Textract.

Topic modeling

Per i primi 100 MB

Per ogni MB oltre i 100 MB

I costi addebitati dipendono dalle dimensioni totali dei documenti elaborati per ogni processo. Per i primi 100 MB viene addebitata una tariffa fissa. Oltre i 100 MB, paghi per MB.

Piano gratuito

50.000 UNITÀ DI TESTO (5 MILIONI DI CARATTERI)

Amazon Comprehend offre un livello gratuito che include 50.000 unità di testo (5 milioni di caratteri) per API al mese.

Le API idonee includono Key Phrase Extraction, Sentiment, Targeted Sentiment, Entity Recognition, Language Detection, Event Detection, Syntax Analysis, Detect PII e Contains PII.

Nota: il Comprehend personalizzato (ovvero entità e classificazioni personalizzate) non offre un livello gratuito. Include un modello di addestramento, l'inferenza e la gestione dei modelli.

5 PROCESSI FINO A 1 MB CIASCUNO (modeling dell'argomento)

Il piano gratuito di Amazon Comprehend è disponibile per tutti i clienti AWS, sia nuovi sia esistenti, per 12 mesi, a partire dalla data della loro prima richiesta di Amazon Comprehend.

Esempi di prezzi di Amazon Comprehend

Esempio 1 - Analisi dei commenti dei clienti

Supponiamo che tu abbia creato un'applicazione usando Amazon Comprehend per analizzare i commenti dei clienti nel tuo store online. Hai ricevuto 10.000 commenti cliente di 550 caratteri ciascuno e sei nel secondo anno di utilizzo del servizio.

Calcolo dei costi totali:

Dimensioni di ciascuna richiesta = 550 caratteri

Numero di unità per richiesta = 6

Totale unità: 10.000 (richieste) x 6 (unità per richiesta) = 60.000

Prezzo per unità = 0,0001 USD

Costi totali: [n. di unità] x [costo per unità] = 60.000 x 0,0001 USD = 6,00 USD


Esempio 2 - Suddivisione in categorie dei documenti per argomenti

Immaginiamo che tu abbia un insieme di documenti per un totale di 240 MB di dimensioni che vuoi categorizzare per argomento e raccomandare documenti ai tuoi clienti in base alle loro aree di interesse. Supponiamo anche che tu sia nel secondo anno di utilizzo del servizio e che non sia idoneo all'offerta di piano gratuito.

Calcolo dei costi totali:

Megabyte totali elaborati = 240

Megabyte fatturati a una tariffa fissa di 1 USD = 100

Megabyte fatturati a 0,004 USD/MB = 140 [240-100]

Costo totale del processo = 1,00 USD + [140 x 0,004 USD] = 1,00 USD + 0,56 USD = 1,56 USD


Esempio 3 - Classificazione delle risposte del cliente tramite l'API di classificazione personalizzazione

Supponiamo di voler addestrare un classificatore in modo che organizzi automaticamente il feedback dei nuovi clienti provenienti da un sito Web. 10 clienti forniscono ogni minuto un feedback, ciascuno dei quali ha 300 caratteri. È necessaria un'ora per la formazione del modello personalizzato e pensi di conservarlo per un mese. Il costo per la formazione di un modello sarà dunque di 3 USD e di 0,5 USD al mese per un modello di storage. Supponiamo anche che tu sia nel secondo anno di utilizzo del servizio e che non sia idoneo all'offerta di piano gratuito. 

Per classificare i feedback asincroni paghi in relazione al numero di caratteri nei tuoi documenti. Per la classificazione in tempo reali predisponi un endpoint con prestazioni sufficienti a gestire il tuo caso d’uso e paga per fino a quando l’endpoint non è attivo.

Calcolo del costo di una inferenza per la classificazione asincrona:

Dimensioni di ciascuna richiesta giornaliera = 4.320.000 caratteri [300 caratteri * 10 documenti * 1.440 minuti]

Numero di unità a richiesta = 43.200 unità [432.000 caratteri ÷ 100 caratteri per unità]

Prezzo per unità = 0,0005 USD

Costo totale per unità = 21,60 USD [43.200 unità per 0,0005 USD]

Costo totale = 25,10 USD [21,60 USD per inferenza + 3 USD per la formazione del modello + 0,50 USD per un modello di storage]

Calcolo dell’addebito complessivo per la classificazione sincrona:

Innanzitutto calcoliamo le prestazioni richieste. Ogni minuto classificheremo 10 documenti da 300 caratteri ciascuno. Quindi è:

50 caratteri per secondo [300 caratteri x 10 documenti ÷ 60 secondi]

Avrai quindi bisogno di fornire un endpoint con 1 unità di inferenza (IU) che darà una prestazione di 100 caratteri al secondo.

Prezzo per 1 IU = 0,0005 USD al secondo

Pagherai in base a quanto tempo terrai attivo l’endpoint con classificazione in tempo reale, indipendentemente da quante chiamate inferenziali farai.

Se gestisci il tuo endpoint con classificazione in tempo reale per 12 ore al giorno:

Costo totale dell’inferenza = 21,60 USD [0,0005 USD x 3600 secondi x 12 ore]

Costo totale = 25,10 USD [21,60 USD per inferenza + 3 USD per la formazione del modello + 0,50 USD per un modello di storage]

Ti ricordiamo che ti verrà addebitato il costo per le prestazioni fornite e per la quantità di tempo in cui l’endpoint sarà attivo. Se hai bisogno di maggiori prestazioni, il prezzo sarà:

Prezzo per 2 IU = 0,001 USD al secondo [0,0005 USD x 2]

Prezzo per 3 IU = 0,0015 USD al secondo [0,0005 USD x 3]


Esempio 4 - Analisi dei commenti dei clienti tramite l'API Entità personalizzate

Supponiamo di voler addestrare un modello di entità personalizzato in modo che estragga automaticamente i termini personalizzati dai nuovi clienti provenienti da un sito Web. Il lavoro di training dura 1,5 ore e vengono analizzata 10.000 estratti di commenti cliente ognuno di 550 caratteri. Stai pensando di conservare questo modello per un mese Supponiamo anche che tu sia nel secondo anno di utilizzo del servizio e che non sia idoneo all'offerta di piano gratuito.

Calcolo dei costi totali:

Dimensioni di ciascuna richiesta = 5,500,000 caratteri

Numero di unità a richiesta = 55.000 unità [5.500.000 caratteri ÷ 100 caratteri per unità]

Prezzo per unità = 0,0005 USD

Costo totale per unità = 27,5 USD [55.000 unità x 0,0005 USD]

Ore totali per la formazione del modello = 1,5 ore

Prezzo all'ora = 3 USD

Costo totale per la formazione del modello = 4.5 USD [1,5 ore x 3 USD]

Numero di mesi per la gestione del modello = 1 mese

Prezzo al mese = 0,50 USD 

Costo totale per gestione del modello = 0,50 USD [1 mese x 0,50 USD]

Costo totale = 37 USD [27,5 USD + 4,5 USD + 0,50 USD]


Esempio 5 - Estrazione di eventi e informazioni associate tramite Rilevamento eventi

Supponiamo che tu voglia estrarre 3 tipi di evento da 3.000 articoli di 500 caratteri ciascuno e che tu sia nel secondo anno di utilizzo del servizio.

Calcolo dei costi totali:

Numero di caratteri elaborati = 1.500.000 caratteri [3.000 articoli x 500 caratteri]

Numero di unità elaborate = 45.000 unità [1.500.000 x 3 tipi di evento ÷ 100 caratteri per unità]

Prezzo per unità = 0,003 USD

Costo totale per unità = 135 USD [45.000 unità x 0,003 USD]


Esempio 6 - Identificazione di documenti con informazioni personali di identificazione (PII) tramite l'API Contiene PII

Supponiamo che tu abbia creato un'applicazione usando Amazon Comprehend per analizzare i commenti dei clienti nel tuo store online. Hai ricevuto 10.000 commenti dei clienti di 550 caratteri ciascuno e hai bisogno di identificare quali documenti contengono PII in modo che possano essere archiviati in un'ubicazione sicura. Supponiamo che tu sia nel secondo anno di utilizzo del servizio.

Calcolo dei costi totali:

Dimensioni di ciascuna richiesta = 550 caratteri

Numero di unità per richiesta = 6

Totale unità: 60.000 [10.000 richieste x 6 unità per richiesta]

Prezzo per unità = 0,000002 USD

Costo totale = 0,12 USD [60.000 unità x 0,000002 USD]


Esempio 7 - Redazione di informazioni personali di identificazione (PII) da documenti tramite l'API Rilevamento PII

Supponiamo che tu abbia creato un'applicazione usando Amazon Comprehend per analizzare i commenti dei clienti nel tuo store online. Hai ricevuto 10.000 commenti dei clienti di 550 caratteri ciascuno e hai bisogno di creare versioni redatte dei documenti prima che vengano archiviati. Supponiamo che tu sia nel secondo anno di utilizzo del servizio.

Calcolo dei costi totali:

Dimensioni di ciascuna richiesta = 550 caratteri

Numero di unità per richiesta = 6

Totale unità: 60.000 [10.000 richieste x 6 unità per richiesta]

Prezzo per unità = 0,0001 USD

Costo totale = 6 USD [60.000 unità x 0,0001 USD]

Esempio 8 - Estrazione delle entità di una richiesta di mutuo tramite l'API Entità personalizzate

Supponiamo che tu voglia addestrare un modello di estrazione di entità personalizzate affinché estragga 10 entità personalizzate da una richiesta di mutuo. Ogni giorno un centinaio di clienti fa richiesta, e ognuno di essi fornisce un documento PDF di 10 pagine scansionato che contiene 2.500 caratteri per pagina. Con Amazon Textract, supponiamo di dover estrarre il testo da ogni singola pagina elaborata prima di estrarre le entità utilizzando l'API Detect Document Text. È necessaria un'ora per l’addestramento del modello personalizzato e pensi di conservarlo per un mese. Il costo per la formazione di un modello sarà dunque di 3 USD e di 0,50 USD al mese per l'archiviazione del modello. Supponiamo anche che tu sia nel secondo anno di utilizzo del servizio e che non sia idoneo all'offerta di piano gratuito. Per estrarre le entità personalizzate in modo asincrono paghi in relazione al numero di caratteri presenti nei tuoi documenti. Per estrarre le entità in tempo reale effettui il provisioning di un endpoint con velocità effettiva sufficiente a gestire il tuo caso d'uso e paghi per il tempo in cui l'endpoint è attivo.

Calcolo del costo di un'inferenza per la classificazione asincrona:

Dimensioni di ciascuna richiesta giornaliera = 2.500.000 caratteri [100 domande al giorno * 10 documenti * 2.500 caratteri]

Numero di unità a richiesta = 25.000 unità [2.500.000 caratteri ÷ 100 caratteri per unità]

Prezzo per unità = 0,0005 USD

Costo di inferenza totale per unità = 12,50 USD [25.000 unità x 0,0005 USD]

Costo dell'API Detect Document Text di Amazon Textract = 1,50 USD [100 domande/giorno * 10 documenti * prezzo per pagina di 0,0015 USD, fino a 1 milione di pagine]

Costo totale = 17,50 USD [12,50 USD per inferenza + 1,50 USD per Textract + 3 USD per addestramento modelli + 0,50 USD per archiviazione modelli]

 

Esempio 9 - Analisi delle risposte del sondaggio sui dipendenti

Supponiamo che si sia progettata un'applicazione utilizzando Amazon Comprehend Targeted Sentiment per analizzare le risposte dei sondaggi dei dipendenti per l’azienda. Hai ricevuto 100.000 risposte al sondaggio di 350 caratteri ciascuna, e sei nel secondo anno di utilizzo del servizio.

Calcolo dei costi totali:

Dimensioni di ciascuna richiesta = 350 caratteri

Numero di unità per richiesta = 4

Totale unità: 100.000 [4 richieste x 400,000 unità per richiesta]

Prezzo per unità = 0.0001 USD (da 0-10M unità)

Costo totale: [n. di unità] x [costo per unità] = 400.000 x 0,0001 USD = 40,00 USD

 

Ulteriori informazioni sulle caratteristiche di Amazon Comprehend

Visita la pagina delle caratteristiche
Sei pronto per iniziare?
Registrati
Hai altre domande?
Contattaci