Amazon Bedrock artık RAG Değerlendirmesi'ni destekliyor (genel olarak kullanılabilir)

Yayınlanma Tarihi: 20 Mar 2025

Amazon Bedrock RAG değerlendirmesi genel kullanıma sunuldu. Amazon Bedrock Bilgi Tabanları veya özel bir RAG sistemi üzerinde oluşturulmuş, almayla artırılmış üretim (RAG) uygulamalarınızı değerlendirebilirsiniz. Geri alma veya uçtan uca üretimi değerlendirebilirsiniz. Değerlendirmeler, çeşitli jüri modellerinden oluşan seçim ile değerlendirici olarak LLM tarafından desteklenmektedir. Geri alma için bağlam alaka düzeyi ve kapsama alanı gibi ölçütler arasından seçim yapabilirsiniz. Uçtan uca geri alma ve üretim için doğruluk, eksiksizlik ve sadakat (halüsinasyon algılama) gibi kalite ölçütlerinin yanı sıra zararlılık, yanıt reddetme ve klişeleştirme gibi sorumlu yapay zeka ölçütleri arasından seçim yapabilirsiniz. Bilgi Tabanlarınız veya özel RAG uygulamalarınız üzerinde yığınlama stratejisi veya vektör uzunluğu, yeniden sıralayıcılar ya da farklı içerik oluşturma modelleri gibi farklı ayarlarla yineleme yapmak için değerlendirme işleri arasında karşılaştırma da yapabilirsiniz.

*Yepyeni ve daha esnek!* Bugünden itibaren Bedrock Bilgi Tabanlarına ek olarak, Amazon Bedrock'un RAG değerlendirmeleri özel RAG işlem hattı değerlendirmelerini desteklemektedir. Özel RAG işlem hatlarını değerlendiren müşteriler artık girdi-çıktı çiftlerini ve alınan bağlamları doğrudan giriş veri setlerinde değerlendirme işine getirerek Bedrock Bilgi Tabanına yapılan çağrıyı atlayabilir ("kendi çıkarım yanıtlarınızı getirin"). Ayrıca Bedrock Bilgi Tabanları değerlendirmesi için alıntı kesinliği ve alıntı kapsamı ölçütleri ekledik. Değerlendirmenizin bir parçası olarak bir Bedrock Bilgi Tabanı kullanıyorsanız Amazon Bedrock Bütünlük Koruması'nı doğrudan dahil edebilirsiniz.

Daha fazla bilgi edinmek için Amazon Bedrock Değerlendirmeleri sayfasını ve belgeleri inceleyin. Başlamak için Amazon Bedrock Konsolu'nda oturum açın veya Amazon Bedrock API'lerini kullanın.