投稿日: Apr 30, 2024
Amazon Bedrock で、Amazon Titan Text Embeddings V2 の一般提供が開始されました。これは Amazon Titan モデルファミリーの新しい埋め込みモデルです。Titan Text Embeddings V2 を使用すると、テキストデータを数値ベクトルとして表現して (埋め込みと呼ばれる)、さまざまな自然言語処理 (NLP) のタスクを実行できます。このような埋め込みにより、高次元のベクトルスペース内で単語、フレーズ、文書間の意味の関係や文脈の関係がキャプチャされます。このモデルは、検索拡張生成 (RAG) のユースケースに合わせて最適化されており、また情報検索、質問と回答のチャットボット、分類、パーソナライズされたレコメンデーションなど、その他のさまざまなタスクにも適しています。
Amazon Text Embeddings V2 は、さまざまな次元での高精度の取り出しタスクに最適な、軽量で効率的なモデルです。このモデルでは適応性のある埋め込みサイズ (256、512、1,024) がサポートされています。次元サイズが小さいほど精度の維持が優先され、精度を損なうことなくストレージのコストを減らせます。Titan Text Embeddings V2 モデルでは、1,024 次元から 512 次元にサイズを小さくしても約 99% の取り出し精度が保持され、1,024 次元から 256 次元にサイズを小さくしても 97% の精度が維持されます。さらに Titan Text Embeddings V2 には、100 以上の言語の事前トレーニングされている多言語サポートや、ベクトル類似性を測定する際の精度を向上させる単位ベクトルの正規化が含まれています。
Amazon Titan Text Embeddings V2 は、米国東部 (バージニア北部) および米国西部 (オレゴン) の各 AWS リージョンで使用可能です。詳細については、AWS ニュースのリリースブログ、Amazon Titan 製品ページ、ドキュメントをご覧ください。Amazon Bedrock で Titan Text Embeddings V2 を使い始めるには、Amazon Bedrock コンソールにアクセスしてください。