Amazon Bedrock が Cohere Embed からの圧縮埋め込みのサポートを開始
Amazon Bedrock で Cohere Embed モデルからの圧縮埋め込み (int8 およびバイナリ) のサポートが開始されました。開発者や企業はパフォーマンスを犠牲にすることなく、構築する生成 AI アプリケーションの効率を高めることができます。Cohere Embed は優れたテキスト埋め込みモデルです。これは検索拡張生成 (RAG) やセマンティック検索のシステムの強化に最もよく使用されるモデルです。
Cohere Embed モデルで出力されるテキスト埋め込みは、ベクトル検索機能のあるデータベースに保存する必要があります。この場合、ストレージコストが埋め込みの出力のサイズと数字の形式の精度に直接関係するようになります。このモデルでは、Cohere の圧縮に対応したモデルトレーニングの手法を使用して、埋め込みをバイナリと int8 の精度の形式で出力できます。これらの形式は、よく使用される FP32 精度の形式よりもサイズが大幅に小さくなり、精度の低下も最小限に抑えられます。したがって、エンタープライズ検索アプリケーションをより速く、より安価に、より効率的に実行できるようになります。int8 とバイナリの埋め込みは、数百万の埋め込みを数ミリ秒以内に検索できることがビジネス上大幅に有利になる大規模なマルチテナンシーのセットアップにとって特に関心を引くものです。Cohere の圧縮埋め込みにより、大規模に本番環境に導入できるほど効率の高いアプリケーションを構築でき、従業員や顧客のサポートに対する AI 戦略を促進できます。
Cohere Embed の int8 とバイナリの埋め込みは、Cohere Embed モデルが利用可能なすべての AWS リージョン内の Amazon Bedrock でご利用いただけるようになりました。詳細については、Amazon Bedrock での Cohere に関する製品ページ、ドキュメント、Cohere のこのリリースに関するブログ記事をご覧ください。Amazon Bedrock で Cohere のモデルを使い始めるには、Amazon Bedrock コンソールにアクセスしてください。