Funzionalità di Amazon Comprehend

Avviso di fine del supporto

Le funzionalità di Topic modeling, Rilevamento di eventi e Classificazione di sicurezza del prompt di Amazon Comprehend non saranno più disponibili per i nuovi clienti a partire dal 30 aprile 2026. Se vuoi utilizzare queste funzionalità con nuovi account, ti consigliamo di farlo prima di tale data. Gli account che hanno utilizzato queste funzionalità negli ultimi 12 mesi non devono effettuare alcuna azione e potranno continuare ad accedervi. Scopri le alternative di offboarding e le fasi di migrazione qui. Nota: ciò non influisce sulla disponibilità di altre funzionalità di Amazon Comprehend.

Perché dovrei scegliere Amazon Comprehend?

Amazon Comprehend è un servizio di elaborazione del linguaggio naturale (NLP, Natural Language Processing) che utilizza la tecnologia del machine learning (ML) per estrapolare approfondimenti pratici dal testo. Amazon Comprehend fornisce servizi di riconoscimento personalizzato di entità, classificazione personalizzata, estrazione di frasi chiave, analisi del sentiment, riconoscimento delle entità e altre tipologie di API per permettere di integrare facilmente il servizio di NLP nelle applicazioni. Dovrai semplicemente chiamare le API Amazon Comprehend nella tua applicazione e specificare la posizione del documento o del testo di origine. Le API restituiranno entità, frasi chiave, emozioni e lingua in formato JSON, che potrai utilizzare nell'applicazione.

Riconoscimento personalizzato di entità

Il riconoscimento personalizzato di entità consente di personalizzare Amazon Comprehend per identificare termini specifici del dominio. Tramite AutoML, Amazon Comprehend apprende da un piccolo insieme di esempi (come un elenco di numeri di polizza, numeri di richieste o SSN) e poi addestra un modello privato e personalizzato per riconoscere questi termini, come i numeri di richiesta, in qualsiasi altro blocco di testo in PDF, testo semplice, o documenti Microsoft Word, senza aver bisogno del ML. Per ulteriori informazioni, consulta questa pagina della documentazione.

Esempio: una società di assicurazioni vorrebbe analizzare i documenti di testo per determinate le entità delle aziende e i numeri di polizza.

Testo di esempio: Ciao, mi chiamo Sam Ford e sto inviando una richiesta per un incidente d'auto. Il mio numero di polizza è 456-YQT.

Esempio

Entità	Categoria	Conteggio	Affidabilità
456-YQT	Policy_ID	1	0,95

Amazon Comprehend

Classificazione personalizzata

L’API di classificazione personalizzata permette di creare con facilità modelli personalizzati di classificazione dei testi utilizzando etichette specifiche di ogni azienda e senza dover conoscere il ML. Per esempio, il dipartimento di assistenza clienti può utilizzare la classificazione personalizzata per suddividere automaticamente le richieste in entrata per tipo di problema, in base alla descrizione fornita dal cliente. Il modello personalizzato semplifica le attività di moderazione di commenti su un sito Web, valutazione del feedback dei clienti e di organizzazione dei documenti di gruppi di lavoro. Per ulteriori informazioni, consulta questa pagina della documentazione.

Esempio: desideri organizzare il feedback relativo all'assistenza clienti di una linea aerea. Ciascun elemento del feedback deve essere organizzato nella sezione Domande sull'account, Rimborsi dei biglietti e Reclami sui voli. Per addestrare il servizio, devi creare un file CSV contenente esempi di testo per ciascun problema e assegnare a ciascun esempio una delle tre etichette applicabili. Il servizio addestrerà automaticamente un modello personalizzato per tuo conto. Per utilizzare il tuo modello per analizzare tutte le chiamate del giorno successivo, invia al servizio ciascun file di testo. Riceverai i risultati etichettati insieme a un punteggio di affidabilità delle etichette.

Esempio

Testo	Etichetta	Punteggio di affidabilità
Riga 0	Domanda sull’account	0,92
Riga 1	Rimborso biglietto	1
Riga 2	Lamentela sul volo	1
Riga 3	Lamentela sul volo	0,91
Doc5.csv	Rimborso biglietto	1

Riconoscimento di entità

L'API di riconoscimento di entità restituisce le entità denominate ("persona", "luogo", "località" e così via), automaticamente classificate in base al testo fornito. Per ulteriori informazioni, consulta questa pagina della documentazione.

Esempio: in questo esempio osserviamo la descrizione di un'azienda. L'API identifica entità come organizzazione, data e luogo e restituisce un punteggio di affidabilità.

Testo di esempio: Amazon.com ha sede a Seattle, Washington, ed è stata fondata il 5 luglio 1994 da Jeff Bezos, per permettere ai clienti di acquistare qualsiasi articolo, dai libri ai frullatori. Seattle si trova a nord di Portland e a sud di Vancouver, British Columbia. Altre illustri aziende con sede a Seattle sono Starbucks e Boeing.

Esempio

Entità	Categoria	Affidabilità
Amazon.com, Inc.	Organizzazione	0,96
Seattle, WA	Luogo	0,96
5 luglio 1994	0,99
Jeff Bezos	Persona	0,99
Seattle	Luogo	0,98
Portland	Luogo	0,99
Vancouver, British Columbia	Luogo	0,97
Starbucks	Organizzazione	0,91
Boeing	Organizzazione	0,99

Analisi del sentiment

L'API di analisi del sentiment restituisce il sentiment complessivo di un testo (positivo, negativo, neutro o misto). Per ulteriori informazioni, consulta questa pagina della documentazione.

Esempio: un cliente pubblica il proprio feedback su un paio di scarpe. L'API identifica l'emozione espressa dal cliente insieme a un punteggio di affidabilità.

Testo di esempio: Ho ordinato un numero 38 e mi aspettavo che mi calzassero bene, ma si sono rivelate piuttosto un 39-40. La qualità è eccezionale. È un marrone più chiaro di quello nella fotografia, ma abbastanza simile. Sarebbero dieci volte migliori se fossero foderate con lana o cotone all'interno.

Esempio

Sentiment	Punteggio
Misto	0,89
Positivo	0,09
Negativo	0,01
Neutro	0,00

Sentiment mirato

Il sentiment mirato fornisce approfondimenti pratici granulari identificando il sentiment (positivo, negativo, neutro o misto) rispetto alle entità all'interno del testo. Per ulteriori informazioni, consulta questa pagina della documentazione.

Esempio: un ristorante sta controllando la recensione di un cliente per capire come migliorare la propria attività.

Testo di esempio: Secondo me, l'hamburger era buonissimo, ma il servizio era lento.

Esempio

Testo	Tipo di entità	Punteggio di affidabilità dell'entità	Sentiment	Punteggio
Me	Persona	0,99	Neutro	0,99
Hamburger	Altro	0,99	Positivo	0,99
Servizio	Attributo	0,99	Negativo	0,99

Identificazione e oscuramento delle informazioni di identificazione personale

Utilizza le funzionalità ML di Amazon Comprehend per rilevare e redigere le informazioni di identificazione personale (PII) in e-mail dei clienti, ticket di assistenza, recensioni prodotti, social media e altri ancora. Non sono necessarie competenze in campo ML. Ad esempio, è possibile analizzare i ticket di assistenza e i file di caratteristiche del caso per rilevare le entità PII e revisionare il testo prima di indicizzare i documenti nella soluzione di ricerca. Dopodiché, le soluzioni di ricerca saranno dei documenti senza entità PII. Oscurare le entità PII permette di proteggere la privacy e garantire la conformità alle leggi e alle normative locali. Per ulteriori informazioni, consulta questa pagina della documentazione.

Esempio: un cliente vuole revisionare le informazioni personali e finanziarie da un rendiconto bancario. L'API di oscuramento delle PII identifica e oscura le PII, fornendo un punteggio di affidabilità.

Testo di esempio: Ciao, John Smith. Il suo conto numero 1111-0000-1111-0008 collegato alla carta di credito AnyCompany Financial Services LLC ha un pagamento minimo di 24,53 USD da saldare entro il 31 luglio. In base alle impostazioni di pagamento automatico, l'importo verrà prelevato alla data di scadenza dal suo conto bancario numero XXXXXX1111, con numero di routing XXXXX0000.

Esempio

Entità	Tipo	Punteggio
John Smith	Nome	0,99+
1111-0000-111-0008	Numero carta di debito	0,99+
31 luglio	Data	0,99+
XXXXXX111	Numero conto bancario	0,99+
XXXXX0000	Numero routing bancario	0,99+

Rilevamento di contenuti inappropriati

Il rilevamento di contenuti inappropriati di Comprehend è una soluzione semplice basata sull'elaborazione del linguaggio naturale (NLP) per il rilevamento di contenuti inappropriati nei documenti testuali. Questa funzionalità è disponibile da subito per moderare le conversazioni peer-to-peer su piattaforme online e gli input/output dell'IA generativa. Per ulteriori informazioni, consulta questa pagina della documentazione.

Classificazione di sicurezza del prompt

Comprehend fornisce un classificatore binario pre-addestrato in grado di classificare il prompt di input come dannoso o innocuo. Questo può essere integrato per permettere ai modelli linguistici di grandi dimensioni (LLM, Large Language Model) di rispondere solo a contenuti innocui. Per ulteriori informazioni, consulta questa pagina della documentazione.

Estrazione di frasi chiave

L'API di estrazione di frasi chiave restituisce frasi chiave o argomenti di discussione insieme a un punteggio di affidabilità per specificare che si tratta effettivamente di una frase chiave. Per ulteriori informazioni, consulta questa pagina della documentazione.

Esempio: un cliente confronta una fotocamera DSLR con una fotocamera a sviluppo istantaneo. L'API estrae frasi chiave e restituisce un punteggio di attendibilità sui risultati.

Testo di esempio: Sono un fotografo appassionato e di solito scatto foto con la mia DSLR o la mia fotocamera a sviluppo istantaneo che mi porto sempre dietro per l'uso occasionale. Anche se nulla batte la mia DSLR in quanto a potenza e praticità, la fotocamera a sviluppo istantaneo ha qualcosa di magico. Forse è il fatto di imprimere realmente su pellicola un'immagine o forse è la consapevolezza che ogni scatto è un oggetto fisico unico, qualcosa di speciale nel mondo di oggi, in cui spopolano Instagram e Facebook, strapieni di foto. Quello che so con certezza è che sono fotocamere incredibilmente divertenti da utilizzare e suscitano sempre l'entusiasmo di chiunque a una festa.

Esempio

Frase chiave	Affidabilità
un fotografo appassionato	0,99
la mia DSLR	0,97
la mia fotocamera a sviluppo istantaneo	0,99
uso occasionale	0,99
potenza e praticità	0,94
realmente su pellicola	0,99
ogni scatto	0,92
un manufatto fisico unico	0,99
oggi	0,91
mondo	0,99
Instagram e Facebook	0,99

Rilevamento di eventi

Comprehend Events consente di estrarre la struttura di un evento da un documento, distillando pagine di testo in dati processati in modo semplice per il consumo da parte delle applicazioni IA o dello strumento di visualizzazione a grafo. Questa API consente di rispondere a domande del tipo chi-cosa-dove-quando su grandi insiemi di documenti, su vasta scala e senza esperienza pregressa in elaborazione del linguaggio naturale (NLP). Utilizza gli eventi di Comprehend per estrarre dettagli granulari su eventi della vita quotidiana ed entità associate espressi in testi non strutturati. Per ulteriori informazioni, consulta questa pagina della documentazione.

Rilevamento della lingua

L'API di rilevamento della lingua identifica automaticamente il testo scritto in oltre 100 lingue e restituisce la lingua dominante con un punteggio di affidabilità per specificare che si tratta della lingua dominante. Per ulteriori informazioni, consulta questa pagina della documentazione.

Esempio: l'API analizza il testo per identificare l'italiano come lingua dominante, restituendo un punteggio di affidabilità.

Testo di esempio: Amazon Elastic Compute Cloud (Amazon EC2) è un servizio Web che fornisce capacità di elaborazione sicura e scalabile nel cloud. È concepito per rendere più semplice il cloud computing su scala Web per gli sviluppatori.

Esempio

Codice lingua ISO-639-1	Lingua	Affidabilità
it	Italiano	1,0

Analisi della sintassi

L'API di sintassi di Amazon Comprehend permette ai clienti di analizzare i testi utilizzando tokenizzazione e categorie morfo-sintattiche, nonché di identificare i confini delle parole e le parti del discorso, come nomi e aggettivi. Per ulteriori informazioni, consulta questa pagina della documentazione.

Esempio: supponiamo di dover analizzare un breve documento utilizzando l'API di sintassi di Comprehend. Questa API tokenizza il testo (ovvero definisce i confini delle parole) ed etichetta ciascuna parola con la categoria morfo-sintattica appropriata, ad esempio nome o verbo. Oltre a definire punto iniziale e finale di una parola per individuarla nel testo, fornisce anche un punteggio di affidabilità.

Testo di esempio: I love my fast, new Kindle Fire!

Esempio

Testo	Tag
Me	Pronome
Love	Verbo
My	Pronome
Rapidità	Aggettivo
,	Punteggiatura
Novità	Aggettivo
Kindle	Nome proprio
Fire	Nome proprio
!	Punteggiatura

Topic modeling

L'API di topic modeling identifica termini o argomenti rilevanti da una raccolta di documenti memorizzati in Amazon S3. Identifica gli argomenti più comuni nella raccolta e li organizza in gruppi, quindi associa ogni documento a un argomento. Per ulteriori informazioni, consulta questa pagina della documentazione.

Esempio: se i documenti (Doc1.txt, Doc2.txt, Doc3.txt e Doc4.txt) sono archiviati in Amazon S3 e ad Amazon Comprehend vengono indicate le rispettive posizioni, il servizio analizza i documenti e restituisce due visualizzazioni:

1. Raggruppamento di parole chiave che corrispondono ad argomenti

Ogni gruppo di parole chiave viene associato a un gruppo di argomenti. Il peso si riferisce alla prevalenza della parola chiave all'interno del gruppo. Le parole chiave con peso vicino a 1 sono le più indicative del contesto del gruppo di argomenti.

Esempio 1

Gruppo di argomenti	Parole chiave	Peso
1	Amazon	0,87
1	Seattle	0,65
2	Festività	0,78
2	Shopping	0,67

2. Raggruppamento di documenti per argomenti

Ogni documento viene associato a un gruppo di argomenti in base alla proporzione delle parole chiave pesate del gruppo di argomenti presenti nel documento.

Esempio

Nome del documento	Gruppo di argomenti	Proporzione
Doc1.txt	1	0,87
Doc2.txt	0,65
Doc3.txt	0,78
Doc4.txt	2	0,67

Supporto multilingue

Amazon Comprehend è in grado di eseguire l'analisi di testo in tedesco, inglese, spagnolo, italiano, portoghese, francese, giapponese, coreano, hindi, arabo, cinese (semplificato), cinese (tradizionale). Per costruire applicazioni in altre lingue, i clienti hanno a disposizione Amazon Translate per convertire il testo in una lingua supportata da Amazon Comprehend, per poi utilizzarlo per effettuare l'analisi del testo. Per ulteriori informazioni sul supporto in lingua, consulta la pagina della documentazione.

Ulteriori informazioni

Ulteriori informazioni sui prezzi di Amazon Comprehend

Visita la pagina dei prezzi

Tutto pronto per iniziare?

Registrati

Hai altre domande?

Contattaci

Funzionalità di Amazon Comprehend

Avviso di fine del supporto

Perché dovrei scegliere Amazon Comprehend?

Riconoscimento personalizzato di entità

Esempio

Classificazione personalizzata

Esempio

Riconoscimento di entità

Esempio

Analisi del sentiment

Esempio

Sentiment mirato

Esempio

Identificazione e oscuramento delle informazioni di identificazione personale

Esempio

Rilevamento di contenuti inappropriati

Classificazione di sicurezza del prompt

Estrazione di frasi chiave

Esempio

Rilevamento di eventi

Rilevamento della lingua

Esempio

Analisi della sintassi

Esempio

Topic modeling

Esempio 1

2. Raggruppamento di documenti per argomenti

Esempio

Supporto multilingue

Ulteriori informazioni

Ulteriori informazioni sui prezzi di Amazon Comprehend

Tutto pronto per iniziare?

Hai altre domande?

Scopri

Risorse

Sviluppatori

Assistenza