Amazon Comprehend è un servizio di elaborazione del linguaggio naturale (NLP) che usa l'apprendimento automatico per individuare informazioni dal testo. Amazon Comprehend offre le API Keyphrase Extraction, Sentiment Analysis, Entity Recognition, Topic Modeling e Language Detection per permetterti di integrare facilmente l'elaborazione del linguaggio naturale nelle tue applicazioni. Dovrai semplicemente chiamare le API Amazon Comprehend nella tua applicazione e specificare la posizione del documento o del testo di origine. Le API restituiranno entità, frasi chiave, emozioni e lingua in formato JSON, che potrai usare nell'applicazione.

Estrazione di frasi chiave

L'API Keyphrase Extraction restituisce le frasi chiave o gli argomenti di discussione e un punteggio di affidabilità per specificare che si tratta di una frase chiave.

Analisi delle emozioni

L'API Sentiment Analysis restituisce l'emozione complessiva di un testo (positiva, negativa, neutra o mista).

Analisi della sintassi

L'API Syntax di Amazon Comprehend permette ai clienti di analizzare i testi utilizzando tokenizzazione e categorie morfo-sintattiche e identificare i confini delle parole e le parti del discorso quali nomi e aggettivi.

Riconoscimento delle entità

L'API Entity Recognition restituisce le entità denominate ("persona", "luogo", "località" e così via), automaticamente classificate in base al testo fornito.

Medical Named Entity and Relationship Extraction (NERe)

L’API Medical NERe API restituisce le informazioni mediche su malattie, esami, trattamenti e procedure (TTP), anatomia e informazioni sanitarie protette (PHI). Identifica inoltre le relazioni esistenti tra i sottotipi estratti associati ai farmaci e alle TTP. Fornisce inoltre informazioni contestuali sotto forma di “tratti” delle entità (negazione o se una diagnosi è un segno o un sintomo). Nella tabella riportata di seguito sono mostrate le informazioni estratte con i sottotipi e i tratti delle entità pertinenti.

Per estrarre solo le PHI, è possibile utilizzare l’API Protected Health Information Data Identification (PHId).

Entità personalizzate

Le entità personalizzate consentono di personalizzare Amazon Comprehend per identificare i termini specifici del dominio. Con AutoML, Comprehend imparerà da un piccolo indice privato di esempi (un elenco di numeri di policy e testo in cui sono utilizzati) e quindi darà forma a un modello privato e personalizzato per riconoscere questi termini in qualsiasi altro blocco di testo. Non ci sono server da gestire e algoritmi da acquisire.

Rilevamento della lingua

L'API Language Detection identifica automaticamente il testo scritto in oltre 100 lingue e restituisce la lingua dominante con un punteggio di affidabilità per specificare che si tratta della lingua dominante.

Classificazione personalizzata

L’API Custom Classification permette di creare con facilità modelli personalizzati di classificazione dei testi utilizzando le etichette specifiche della tua azienda senza dover imparare Machine Learning. Per esempio, il dipartimento di assistenza clienti può utilizzare Custom Classification per suddividere automaticamente le richieste in entrata per tipo di problema, in base alla descrizione fornita dal cliente. Creare un modello personalizzato è una procedura semplice. Tu fornisci esempi di testo per ciascuna etichetta da usare e Comprehend si addestra su di esse per creare il modello personalizzato. Non è necessaria un'esperienza di Machine Learning; è possibile creare il modello personalizzato senza usare una singola riga di codice. Per integrare il classificatore personalizzato alle applicazioni attuali è disponibile un SDK. Il modello personalizzato semplifica le attività di moderazione di commenti su un sito web, valutazione del feedback dei clienti e di organizzazione dei documenti di gruppi di lavoro Per ulteriori dettagli, consulta questa pagina della documentazione.

Topic modeling

L'API Topic Modeling identifica termini o argomenti rilevanti da una raccolta di documenti memorizzati in Amazon S3. L'API identifica gli argomenti più comuni nella raccolta e li organizza in gruppi, quindi associa ogni documento a un argomento.

  • Esempio: se i documenti (Doc1.txt, Doc2.txt, Doc3.txt e Doc4.txt) sono memorizzati in Amazon S3 e se ne indicano ad Amazon Comprehend le rispettive posizioni, il servizio analizza i documenti e restituisce due visualizzazioni:

    1. Raggruppamento di parole chiave che corrispondono ad argomenti.

    Ogni gruppo di parole chiave viene associato a un gruppo di argomenti. Il peso si riferisce alla prevalenza della parola chiave all'interno del gruppo. Le parole chiave con peso vicino a 1 sono le più indicative del contesto del gruppo di argomenti.
    Gruppo di argomenti Parole chiave Peso
    1 Amazon 0,87
    1 Seattle 0,65
    2 Festività 0,78
    2 Shopping 0,67
    Ogni gruppo di parole chiave viene associato a un gruppo di argomenti. Il peso si riferisce alla prevalenza della parola chiave all'interno del gruppo. Le parole chiave con peso vicino a 1 sono le più indicative del contesto del gruppo di argomenti.

    2. Raggruppamento di documenti per argomenti.

    Nome del documento Gruppo di argomenti Proporzione
    Doc1.txt 1 0,87
    Doc2.txt 1 0,65
    Doc3.txt 2 0,78
    Doc4.txt 2 0,67
    Ogni documento viene associato a un gruppo di argomenti in base alla proporzione delle parole chiave pesate del gruppo di argomenti presenti nel documento.

Supporto multilingue

Amazon Comprehend può eseguire l'analisi del testo di testi in inglese, francese, tedesco, italiano e spagnolo. Di conseguenza, puoi creare applicazioni in grado di rilevare il testo in più lingue, convertire il testo in inglese, francese, tedesco, italiano e spagnolo con Amazon Translate e quindi usare Amazon Comprehend per eseguire l'analisi del testo.

Ulteriori informazioni sui prezzi di Amazon Comprehend

Visita la pagina dei prezzi
Sei pronto per iniziare?
Registrati
Hai altre domande?
Contattaci