Amazon Bedrock の Titan Text Embeddings モデルでバイナリ埋め込みを導入
投稿日:
2024年11月19日
Amazon Titan Text Embeddings V2 がバイナリ埋め込みをサポートするようになりました。バイナリ埋め込みを使用すると、通常の埋め込みと同様の精度を維持しながら、検索拡張生成 (RAG) アプリケーションのストレージコストを削減できます。
Amazon Titan Text Embeddings モデルは、ドキュメント、段落、および文のセマンティック表現を 1,024 次元 (デフォルト)、512 次元、または 256 次元のベクトルとして生成します。バイナリ埋め込みを使用する場合、Titan Text Embeddings V2 はデータをバイナリベクトルとして表現し、各次元は 1 つのバイナリ数字 (0 または 1) としてエンコードされます。このバイナリ表現は、高次元のデータをより効率的な形式に変換し、Amazon OpenSearch Serverless の Bedrock ナレッジベースに保存することで、費用対効果の高い RAG アプリケーションを実現します。
バイナリ埋め込みは、Amazon Titan Text Embeddings V2 がサポートされているすべてのリージョンの Titan Text Embeddings V2、Amazon OpenSearch Serverless、および Amazon Bedrock ナレッジベースでサポートされています。詳細については、バイナリ埋め込みのドキュメントをご覧ください。