投稿日: Sep 28, 2023
Amazon Titan Embeddings は、1 つの単語、フレーズ、さらには大きなドキュメントを含む自然言語テキストを数値表現に変換するテキスト埋め込みモデルです。数値表現は、検索、パーソナライズ、セマンティックな類似性に基づくクラスタリングなどのユースケースを強化するために使用されます。Amazon Titan Embeddings は、Retrieval Augmented Generation (RAG) のユースケースを実現するためにテキスト検索に最適化されています。Amazon Titan Embeddings を使用すれば、テキストデータを数値表現またはベクトルに変換した後に、それらのベクトルを使用してベクトルデータベースから関連する文章を正確に検索し、独自のデータを他の基盤モデル (FM) と組み合わせて最大限に活用できます。
Titan Embeddings は、英語、中国語、スペイン語を含む 25 以上の言語をサポートしています。最大 8192 個のトークンを入力でき、ユースケースに応じて 1 つの単語、フレーズ、またはドキュメント全体を適切に扱うことができます。このモデルは 1,536 次元の出力ベクトルを返し、高い精度を実現すると同時に、低遅延で費用対効果の高い結果が得られるように最適化されています。Titan Embeddings は Amazon Bedrock のサーバーレスエクスペリエンスを通して利用できるため、インフラストラクチャを管理することなく、単一の API を使用して簡単にアクセスできます。
Amazon Titan Embeddings は、米国東部 (バージニア北部) および米国西部 (オレゴン) の AWS リージョンを含め、Amazon Bedrock が利用可能なすべての AWS リージョンでご利用いただけます。Amazon Titan を使用した生成系 AI アプリケーションの構築を開始するには、Amazon Titan の ウェブページを参照してください。