Publicado: Jan 18, 2018
Agora, você pode usar a implementação do BlazingText do Amazon SageMaker do algoritmo Word2Vec para gerar integrações de palavras (word embeddings) a partir de um grande número de documentos. As integrações de palavras representam cada palavra única em toda a coleção de documentos de texto como um vetor de números. Os termos que são semelhantes terão vetores semelhantes, ou seja, eles estarão próximos no espaço de baixa dimensão das integrações, ao passo que as palavras menos semelhantes estarão bem separadas. Esse algoritmo é usado em uma série de tarefas de Natural Language Understanding (NLU – Entendimento natural de linguagem), como similaridade semântica, análise de sentimento, tradução por máquina e resposta a perguntas. Recentemente, o Word2Vec também tem sido usado com sucesso em tarefas como recomendação e segmentação, onde integrações semelhantes podem denotar que, por exemplo, dois filmes tendem a ser assistidos por usuários semelhantes em momentos semelhantes. A implementação do BlazingText do Amazon SageMaker foi projetada tendo e mente a velocidade e a escalabilidade para produzir integrações extremamente rápidas em hardware de GPU ou CPU.
A implementação do BlazingText do algoritmo Word2Vec está disponível nas seguintes regiões da AWS: Leste dos EUA (Norte da Virgínia e Ohio), Oeste dos EUA (Oregon) e UE (Irlanda). Para saber mais, consulte a documentação do Amazon SageMaker para o BlazingText Word2Vec.