Inserito il: Jan 18, 2018
Ora puoi utilizzare l'implementazione BlazingText dell'algoritmo Word2Vec di Amazon SageMaker per generare word embedding di un grande numero di documenti. I word embedding rappresentano ogni singola parola nell'intera collezione di documenti di testo come un vettore di numeri. Le parole simili avranno vettori simili - esatto, saranno vicine nello spazio sotto dimensionato degli embedding - mentre le parole meno affini saranno molto più lontane. Questo algoritmo viene usato in moltissime attività di elaborazione del linguaggio naturale (Natural Language Understanding, NLU) come la somiglianza semantica, l'analisi del sentiment, la traduzione automatica e il question answering. Word2Vec inoltre è stato recentemente utilizzato efficacemente in attività come suggerimenti e segmentazioni, dove embedding simili possono denotare che, per esempio, due film tendono a essere guardati da utenti simili nello stesso orario. L'implementazione BlazingText d Amazon SageMaker è stata progettata avendo ben in mente velocità e dimensionamento per produrre embedding estremamente veloci con entrambi gli hardware GPU o CPU.
L'implementazione BlazingText dell'algoritmo Word2Vec è disponibile oggi nelle regioni AWS di Stati Uniti orientali (Virginia settentrionale e Ohio), UE (Irlanda) e Stati Uniti occidentali (Oregon). Per avere ulteriori informazioni, visita la documentazione per BlazingText Word2Vec di Amazon SageMaker.