Publié le: Jan 18, 2018
Vous pouvez désormais utiliser l'implémentation de BlazingText pour l'algorithme Word2Vec d'Amazon SageMaker pour générer des plongements de mots extraits d'une multitude de documents. Les plongements de mots permettent de représenter chaque mot unique d'un ensemble de textes par un vecteur de nombres. Des mots semblables seront représentés par des vecteurs similaires et seront donc proches dans l'espace de faible dimension des plongements, tandis que des mots différents seront relativement éloignés. Cet algorithme est utilisé dans de nombreuses tâches de compréhension du langage naturel (CLN), telles que la similarité sémantique, l'opinion mining, la traduction machine et les systèmes de question-réponse. D'autre part, Word2Vec a récemment démontré son efficacité dans des tâches de recommandation et de segmentation, dans lesquelles des plongements proches peuvent par exemple indiquer que deux films ont tendance à être visionnés par des utilisateurs semblables et à des moments similaires. L'implémentation de BlazingText d'Amazon SageMaker a été conçue de manière à offrir à la fois vitesse et diminution en charge afin de générer des plongements particulièrement rapides, que l'on utilise un GPU ou un CPU.
L'implémentation de BlazingText pour l'algorithme Word2Vec est actuellement disponible dans les régions AWS USA Est (Virginie du Nord et Ohio), USA Ouest (Oregon) et UE (Irlande). Pour en savoir plus, consultez la documentation relative à BlazingText Word2Vec d'Amazon SageMaker.