投稿日: Jan 18, 2018
Word2Vec アルゴリズムの Amazon SageMaker の BlazingText の実装を使用して、大量の文書からワードの埋め込みを生成することができるようになりました。ワードの埋め込みは、テキスト文書のコレクション全体のそれぞれの固有のワードを数値のベクトルとして表します。類似するワードは類似するベクトルを持ちます。つまり、埋め込みの低次元の空間で近くの位置にあり、あまり類似していないワードはさらに離れた位置にあります。このアルゴリズムは、意味的類似性、感情分析、機会翻訳、質疑応答などのさまざまな自然言語理解(NLU)タスクで使用されます。Word2Vec は最近、また、たとえば、2 人のムービーが類似する時間に類似するユーザーにより視聴される傾向があることを意味するなど、類似する埋め込みが示される場合に、推奨およびセグメンテーションのようなタスクで、適切に使用されています。Amazon SageMaker の BlazingText の実装は、GPU または CPU ハードウェアのいずれかを使用して非常に高速に埋め込みを作成するために、速度とスケールを考慮して設計されています。
Word2Vec アルゴリズムの BlazingText の実装は、米国東部 (バージニア北部およびオハイオ)、欧州 (アイルランド)、米国西部 (オレゴン) の各 AWS リージョンで本日利用可能となります。詳細については、Amazon SageMaker 文書 BlazingText Word2Vec を参照してください。