Amazon Bedrock kini mendukung penyematan terkompresi dari Cohere Embed

Dikirim di: 20 Jun 2024

Amazon Bedrock kini mendukung penyematan terkompresi (int8 dan biner) dari model Cohere Embed, memungkinkan pengembang dan bisnis untuk membangun aplikasi AI generatif yang lebih efisien tanpa mengorbankan kinerja. Cohere Embed adalah model penyematan teks terkemuka. Model ini paling sering digunakan untuk mendukung Retrieval-Augmented Generation (RAG) dan sistem pencarian semantik.

Output penyematan teks oleh model Cohere Embed harus disimpan dalam basis data dengan kemampuan pencarian vektor, dengan biaya penyimpanan yang terkait langsung dengan dimensi output penyematan serta presisi format angka. Teknik pelatihan model sadar kompresi Cohere memungkinkan model ini untuk menampilkan penyematan dalam format presisi biner dan int8, yang ukurannya jauh lebih kecil daripada format presisi FP32 yang sering digunakan, dengan degradasi akurasi yang minimal. Model ini membuka kemampuan untuk menjalankan aplikasi pencarian perusahaan Anda dengan lebih cepat, lebih murah, dan lebih efisien. Embedding int8 dan biner sangat menarik untuk pengaturan multi-tenancy yang besar, yang kemampuannya untuk mencari jutaan penyematan dalam milidetik merupakan keuntungan bisnis yang penting. Penyematan terkompresi Cohere memungkinkan Anda membangun aplikasi yang cukup efisien untuk dimasukkan ke dalam produksi dalam skala yang dibutuhkan, yang mempercepat strategi AI untuk mendukung karyawan dan pelanggan Anda.

Cohere Embed int8 dan penyematan biner sekarang tersedia di Amazon Bedrock di semua AWS Region tempat model Cohere Embed tersedia. Untuk mempelajari selengkapnya, baca halaman produk Cohere di Amazon Bedrock, dokumentasi, dan blog perilisan Cohere. Untuk mulai menggunakan model Cohere di Amazon Bedrock, kunjungi konsol Amazon Bedrock.

Amazon Bedrock kini mendukung penyematan terkompresi dari Cohere Embed

Pelajari

Sumber Daya

Developer

Bantuan