Funzionalità di Amazon Comprehend
Avviso di fine del supporto
Le funzionalità di Topic modeling, Rilevamento di eventi e Classificazione di sicurezza del prompt di Amazon Comprehend non saranno più disponibili per i nuovi clienti a partire dal 30 aprile 2026. Se vuoi utilizzare queste funzionalità con nuovi account, ti consigliamo di farlo prima di tale data. Gli account che hanno utilizzato queste funzionalità negli ultimi 12 mesi non devono effettuare alcuna azione e potranno continuare ad accedervi. Scopri le alternative di offboarding e le fasi di migrazione qui. Nota: ciò non influisce sulla disponibilità di altre funzionalità di Amazon Comprehend.
Perché dovrei scegliere Amazon Comprehend?
Riconoscimento personalizzato di entità
Il riconoscimento personalizzato di entità consente di personalizzare Amazon Comprehend per identificare termini specifici del dominio. Tramite AutoML, Amazon Comprehend apprende da un piccolo insieme di esempi (come un elenco di numeri di polizza, numeri di richieste o SSN) e poi addestra un modello privato e personalizzato per riconoscere questi termini, come i numeri di richiesta, in qualsiasi altro blocco di testo in PDF, testo semplice, o documenti Microsoft Word, senza aver bisogno del ML. Per ulteriori informazioni, consulta questa pagina della documentazione.
Esempio: una società di assicurazioni vorrebbe analizzare i documenti di testo per determinate le entità delle aziende e i numeri di polizza.
Testo di esempio: Ciao, mi chiamo Sam Ford e sto inviando una richiesta per un incidente d'auto. Il mio numero di polizza è 456-YQT.
Esempio
|
Entità
|
Categoria
|
Conteggio
|
Affidabilità
|
|---|---|---|---|
|
456-YQT
|
Policy_ID |
1 |
0,95 |
Classificazione personalizzata
L’API di classificazione personalizzata permette di creare con facilità modelli personalizzati di classificazione dei testi utilizzando etichette specifiche di ogni azienda e senza dover conoscere il ML. Per esempio, il dipartimento di assistenza clienti può utilizzare la classificazione personalizzata per suddividere automaticamente le richieste in entrata per tipo di problema, in base alla descrizione fornita dal cliente. Il modello personalizzato semplifica le attività di moderazione di commenti su un sito Web, valutazione del feedback dei clienti e di organizzazione dei documenti di gruppi di lavoro. Per ulteriori informazioni, consulta questa pagina della documentazione.
Esempio: desideri organizzare il feedback relativo all'assistenza clienti di una linea aerea. Ciascun elemento del feedback deve essere organizzato nella sezione Domande sull'account, Rimborsi dei biglietti e Reclami sui voli. Per addestrare il servizio, devi creare un file CSV contenente esempi di testo per ciascun problema e assegnare a ciascun esempio una delle tre etichette applicabili. Il servizio addestrerà automaticamente un modello personalizzato per tuo conto. Per utilizzare il tuo modello per analizzare tutte le chiamate del giorno successivo, invia al servizio ciascun file di testo. Riceverai i risultati etichettati insieme a un punteggio di affidabilità delle etichette.
Esempio
|
Testo
|
Etichetta
|
Punteggio di affidabilità
|
|---|---|---|
|
Riga 0
|
Domanda sull’account |
0,92 |
|
Riga 1
|
Rimborso biglietto |
1 |
|
Riga 2
|
Lamentela sul volo |
1 |
|
Riga 3
|
Lamentela sul volo |
0,91 |
|
Doc5.csv
|
Rimborso biglietto |
1 |
Riconoscimento di entità
L'API di riconoscimento di entità restituisce le entità denominate ("persona", "luogo", "località" e così via), automaticamente classificate in base al testo fornito. Per ulteriori informazioni, consulta questa pagina della documentazione.
Esempio: in questo esempio osserviamo la descrizione di un'azienda. L'API identifica entità come organizzazione, data e luogo e restituisce un punteggio di affidabilità.
Testo di esempio: Amazon.com ha sede a Seattle, Washington, ed è stata fondata il 5 luglio 1994 da Jeff Bezos, per permettere ai clienti di acquistare qualsiasi articolo, dai libri ai frullatori. Seattle si trova a nord di Portland e a sud di Vancouver, British Columbia. Altre illustri aziende con sede a Seattle sono Starbucks e Boeing.
Esempio
|
Entità
|
Categoria
|
Affidabilità
|
|---|---|---|
|
Amazon.com, Inc.
|
Organizzazione |
0,96 |
|
Seattle, WA
|
Luogo |
0,96 |
|
5 luglio 1994
|
0,99 |
|
|
Jeff Bezos
|
Persona |
0,99 |
|
Seattle
|
Luogo |
0,98 |
|
Portland
|
Luogo |
0,99 |
|
Vancouver, British Columbia
|
Luogo |
0,97 |
|
Starbucks
|
Organizzazione |
0,91 |
|
Boeing
|
Organizzazione |
0,99 |
Analisi del sentiment
L'API di analisi del sentiment restituisce il sentiment complessivo di un testo (positivo, negativo, neutro o misto). Per ulteriori informazioni, consulta questa pagina della documentazione.
Esempio: un cliente pubblica il proprio feedback su un paio di scarpe. L'API identifica l'emozione espressa dal cliente insieme a un punteggio di affidabilità.
Testo di esempio: Ho ordinato un numero 38 e mi aspettavo che mi calzassero bene, ma si sono rivelate piuttosto un 39-40. La qualità è eccezionale. È un marrone più chiaro di quello nella fotografia, ma abbastanza simile. Sarebbero dieci volte migliori se fossero foderate con lana o cotone all'interno.
Esempio
|
Sentiment
|
Punteggio
|
|---|---|
|
Misto
|
0,89 |
|
Positivo
|
0,09 |
|
Negativo
|
0,01 |
|
Neutro
|
0,00 |
Sentiment mirato
Il sentiment mirato fornisce approfondimenti pratici granulari identificando il sentiment (positivo, negativo, neutro o misto) rispetto alle entità all'interno del testo. Per ulteriori informazioni, consulta questa pagina della documentazione.
Esempio: un ristorante sta controllando la recensione di un cliente per capire come migliorare la propria attività.
Testo di esempio: Secondo me, l'hamburger era buonissimo, ma il servizio era lento.
Esempio
|
Testo
|
Tipo di entità
|
Punteggio di affidabilità dell'entità
|
Sentiment
|
Punteggio
|
|---|---|---|---|---|
|
Me
|
Persona |
0,99 |
Neutro |
0,99 |
|
Hamburger
|
Altro |
0,99 |
Positivo |
0,99 |
|
Servizio
|
Attributo |
0,99 |
Negativo |
0,99 |
Identificazione e oscuramento delle informazioni di identificazione personale
Utilizza le funzionalità ML di Amazon Comprehend per rilevare e redigere le informazioni di identificazione personale (PII) in e-mail dei clienti, ticket di assistenza, recensioni prodotti, social media e altri ancora. Non sono necessarie competenze in campo ML. Ad esempio, è possibile analizzare i ticket di assistenza e i file di caratteristiche del caso per rilevare le entità PII e revisionare il testo prima di indicizzare i documenti nella soluzione di ricerca. Dopodiché, le soluzioni di ricerca saranno dei documenti senza entità PII. Oscurare le entità PII permette di proteggere la privacy e garantire la conformità alle leggi e alle normative locali. Per ulteriori informazioni, consulta questa pagina della documentazione.
Esempio: un cliente vuole revisionare le informazioni personali e finanziarie da un rendiconto bancario. L'API di oscuramento delle PII identifica e oscura le PII, fornendo un punteggio di affidabilità.
Testo di esempio: Ciao, John Smith. Il suo conto numero 1111-0000-1111-0008 collegato alla carta di credito AnyCompany Financial Services LLC ha un pagamento minimo di 24,53 USD da saldare entro il 31 luglio. In base alle impostazioni di pagamento automatico, l'importo verrà prelevato alla data di scadenza dal suo conto bancario numero XXXXXX1111, con numero di routing XXXXX0000.
Esempio
|
Entità
|
Tipo
|
Punteggio
|
|---|---|---|
|
John Smith
|
Nome |
0,99+ |
|
1111-0000-111-0008
|
Numero carta di debito |
0,99+ |
|
31 luglio
|
Data |
0,99+ |
|
XXXXXX111
|
Numero conto bancario |
0,99+ |
|
XXXXX0000
|
Numero routing bancario |
0,99+ |
Rilevamento di contenuti inappropriati
Il rilevamento di contenuti inappropriati di Comprehend è una soluzione semplice basata sull'elaborazione del linguaggio naturale (NLP) per il rilevamento di contenuti inappropriati nei documenti testuali. Questa funzionalità è disponibile da subito per moderare le conversazioni peer-to-peer su piattaforme online e gli input/output dell'IA generativa. Per ulteriori informazioni, consulta questa pagina della documentazione.
Classificazione di sicurezza del prompt
Comprehend fornisce un classificatore binario pre-addestrato in grado di classificare il prompt di input come dannoso o innocuo. Questo può essere integrato per permettere ai modelli linguistici di grandi dimensioni (LLM, Large Language Model) di rispondere solo a contenuti innocui. Per ulteriori informazioni, consulta questa pagina della documentazione.
Estrazione di frasi chiave
L'API di estrazione di frasi chiave restituisce frasi chiave o argomenti di discussione insieme a un punteggio di affidabilità per specificare che si tratta effettivamente di una frase chiave. Per ulteriori informazioni, consulta questa pagina della documentazione.
Esempio: un cliente confronta una fotocamera DSLR con una fotocamera a sviluppo istantaneo. L'API estrae frasi chiave e restituisce un punteggio di attendibilità sui risultati.
Testo di esempio: Sono un fotografo appassionato e di solito scatto foto con la mia DSLR o la mia fotocamera a sviluppo istantaneo che mi porto sempre dietro per l'uso occasionale. Anche se nulla batte la mia DSLR in quanto a potenza e praticità, la fotocamera a sviluppo istantaneo ha qualcosa di magico. Forse è il fatto di imprimere realmente su pellicola un'immagine o forse è la consapevolezza che ogni scatto è un oggetto fisico unico, qualcosa di speciale nel mondo di oggi, in cui spopolano Instagram e Facebook, strapieni di foto. Quello che so con certezza è che sono fotocamere incredibilmente divertenti da utilizzare e suscitano sempre l'entusiasmo di chiunque a una festa.
Esempio
|
Frase chiave
|
Affidabilità
|
|---|---|
|
un fotografo appassionato
|
0,99 |
|
la mia DSLR
|
0,97 |
|
la mia fotocamera a sviluppo istantaneo
|
0,99 |
|
uso occasionale
|
0,99 |
|
potenza e praticità
|
0,94 |
|
realmente su pellicola
|
0,99 |
|
ogni scatto
|
0,92 |
|
un manufatto fisico unico
|
0,99 |
|
oggi
|
0,91 |
|
mondo
|
0,99 |
|
Instagram e Facebook
|
0,99 |
Rilevamento di eventi
Comprehend Events consente di estrarre la struttura di un evento da un documento, distillando pagine di testo in dati processati in modo semplice per il consumo da parte delle applicazioni IA o dello strumento di visualizzazione a grafo. Questa API consente di rispondere a domande del tipo chi-cosa-dove-quando su grandi insiemi di documenti, su vasta scala e senza esperienza pregressa in elaborazione del linguaggio naturale (NLP). Utilizza gli eventi di Comprehend per estrarre dettagli granulari su eventi della vita quotidiana ed entità associate espressi in testi non strutturati. Per ulteriori informazioni, consulta questa pagina della documentazione.
Rilevamento della lingua
L'API di rilevamento della lingua identifica automaticamente il testo scritto in oltre 100 lingue e restituisce la lingua dominante con un punteggio di affidabilità per specificare che si tratta della lingua dominante. Per ulteriori informazioni, consulta questa pagina della documentazione.
Esempio: l'API analizza il testo per identificare l'italiano come lingua dominante, restituendo un punteggio di affidabilità.
Testo di esempio: Amazon Elastic Compute Cloud (Amazon EC2) è un servizio Web che fornisce capacità di elaborazione sicura e scalabile nel cloud. È concepito per rendere più semplice il cloud computing su scala Web per gli sviluppatori.
Esempio
|
Codice lingua ISO-639-1
|
Lingua
|
Affidabilità
|
|---|---|---|
|
it
|
Italiano |
1,0 |
Analisi della sintassi
L'API di sintassi di Amazon Comprehend permette ai clienti di analizzare i testi utilizzando tokenizzazione e categorie morfo-sintattiche, nonché di identificare i confini delle parole e le parti del discorso, come nomi e aggettivi. Per ulteriori informazioni, consulta questa pagina della documentazione.
Esempio: supponiamo di dover analizzare un breve documento utilizzando l'API di sintassi di Comprehend. Questa API tokenizza il testo (ovvero definisce i confini delle parole) ed etichetta ciascuna parola con la categoria morfo-sintattica appropriata, ad esempio nome o verbo. Oltre a definire punto iniziale e finale di una parola per individuarla nel testo, fornisce anche un punteggio di affidabilità.
Testo di esempio: I love my fast, new Kindle Fire!
Esempio
|
Testo
|
Tag
|
|---|---|
|
Me
|
Pronome |
|
Love
|
Verbo |
|
My
|
Pronome |
|
Rapidità
|
Aggettivo |
|
,
|
Punteggiatura |
|
Novità
|
Aggettivo |
|
Kindle
|
Nome proprio |
|
Fire
|
Nome proprio |
|
!
|
Punteggiatura |
Topic modeling
L'API di topic modeling identifica termini o argomenti rilevanti da una raccolta di documenti memorizzati in Amazon S3. Identifica gli argomenti più comuni nella raccolta e li organizza in gruppi, quindi associa ogni documento a un argomento. Per ulteriori informazioni, consulta questa pagina della documentazione.
Esempio: se i documenti (Doc1.txt, Doc2.txt, Doc3.txt e Doc4.txt) sono archiviati in Amazon S3 e ad Amazon Comprehend vengono indicate le rispettive posizioni, il servizio analizza i documenti e restituisce due visualizzazioni:
1. Raggruppamento di parole chiave che corrispondono ad argomenti
Ogni gruppo di parole chiave viene associato a un gruppo di argomenti. Il peso si riferisce alla prevalenza della parola chiave all'interno del gruppo. Le parole chiave con peso vicino a 1 sono le più indicative del contesto del gruppo di argomenti.
Ogni gruppo di parole chiave viene associato a un gruppo di argomenti. Il peso si riferisce alla prevalenza della parola chiave all'interno del gruppo. Le parole chiave con peso vicino a 1 sono le più indicative del contesto del gruppo di argomenti.
Esempio 1
|
Gruppo di argomenti
|
Parole chiave
|
Peso
|
|---|---|---|
|
1
|
Amazon |
0,87 |
|
1
|
Seattle |
0,65 |
|
2
|
Festività |
0,78 |
|
2
|
Shopping |
0,67 |
2. Raggruppamento di documenti per argomenti
Ogni documento viene associato a un gruppo di argomenti in base alla proporzione delle parole chiave pesate del gruppo di argomenti presenti nel documento.
Esempio
|
Nome del documento
|
Gruppo di argomenti
|
Proporzione
|
|---|---|---|
|
Doc1.txt
|
1 |
0,87 |
|
Doc2.txt
|
0,65 |
|
|
Doc3.txt
|
0,78 |
|
|
Doc4.txt
|
2 |
0,67 |
Supporto multilingue
Amazon Comprehend è in grado di eseguire l'analisi di testo in tedesco, inglese, spagnolo, italiano, portoghese, francese, giapponese, coreano, hindi, arabo, cinese (semplificato), cinese (tradizionale). Per costruire applicazioni in altre lingue, i clienti hanno a disposizione Amazon Translate per convertire il testo in una lingua supportata da Amazon Comprehend, per poi utilizzarlo per effettuare l'analisi del testo. Per ulteriori informazioni sul supporto in lingua, consulta la pagina della documentazione.