发布于: Jan 18, 2018

您现在可以在 Amazon SageMaker 中使用 Word2Vec 算法的 BlazingText 实施,从大量文档中生成词嵌入。词嵌入会将整个文本文档集中的每个唯一字词表示为一个数字矢量。相似的字词可使用相似的矢量,如此一来,它们将在嵌入的低维空间比较接近,而相似度较低的字词则相隔较远。此算法用于各种自然语言理解 (NLU) 任务,例如语义相似性、情感分析、机器翻译和问答。Word2Vec 最近还成功用于推荐和划分等任务,例如,相似的嵌入可能表示:两部电影往往会由相似的用户在相似的时间观看。Amazon SageMaker 的 BlazingText 实施在开发过程中充分考虑了速度和规模,能够以极快的速度使用 GPU 或 CPU 硬件生成嵌入。

Word2Vec 算法的 BlazingText 实施目前在 AWS 区域美国东部 (弗吉尼亚北部和俄亥俄)、欧洲 (爱尔兰) 和美国西部 (俄勒冈) 提供。要了解更多信息,请访问 Amazon SageMaker 关于 BlazingText Word2Vec 的文档