Mengumumkan pencarian vektor untuk Amazon ElastiCache

Dikirim di: 13 Okt 2025

Pencarian vektor untuk Amazon ElastiCache sekarang tersedia secara umum. Pelanggan sekarang dapat menggunakan ElastiCache untuk mengindeks, mencari, dan memperbarui miliaran sematan vektor dimensi tinggi dari penyedia populer seperti Amazon Bedrock, Amazon SageMaker, Anthropic, dan OpenAI dengan latensi serendah mikrodetik dan penarikan hingga 99%.

Kasus penggunaan utama termasuk caching semantik untuk model bahasa besar (LLM) dan agen percakapan multi-putaran, yang secara signifikan mengurangi latensi dan biaya dengan menyimpan kueri yang serupa secara semantik. Pencarian vektor untuk ElastiCache juga mendukung sistem AI agentik dengan Retrieval Augmented Generation (RAG) untuk memastikan hasil yang sangat relevan dan latensi rendah secara konsisten di beberapa langkah pengambilan. Kasus penggunaan tambahan termasuk mesin rekomendasi, deteksi anomali, dan aplikasi lain yang memerlukan pencarian efisien di beberapa modalitas data.

Pencarian vektor untuk simpul tersedia dengan Valkey versi 8.2 pada klaster berbasis simpul di semua AWS Region tanpa biaya tambahan. Untuk memulai, buat klaster Valkey 8.2 menggunakan Konsol Manajemen AWS, Kit Pengembangan Perangkat Lunak (SDK), atau Antarmuka Baris Perintah (CLI) AWS. Anda juga dapat menggunakan pencarian vektor pada klaster yang ada dengan memutakhirkan dari versi Valkey atau Redis OSS ke Valkey 8.2 dalam beberapa klik tanpa waktu henti. Untuk mempelajari lebih lanjut tentang pencarian vektor untuk ElastiCache untuk Valkey baca blog ini dan untuk daftar perintah yang didukung lihat dokumentasi ElastiCache.

Mengumumkan pencarian vektor untuk Amazon ElastiCache

Pelajari

Sumber Daya

Developer

Bantuan