Amazon Bedrock Model Değerlendirmesi'nde değerlendirici olarak LLM genel kullanıma sunuldu
Amazon Bedrock Model Değerlendirmesi'nin değerlendirici olarak LLM özelliği genel kullanıma sunuldu. Amazon Bedrock Model Değerlendirmesi, kullanım durumunuz için doğru modelleri değerlendirmenize, karşılaştırmanıza ve seçmenize olanak tanır. Değerlendirici modelleri ve değerlendirilen modellerin doğru kombinasyonunu elde ettiğinizden emin olmak için Bedrock'ta bulunan birkaç model arasından değerlendiriciniz olarak bir LLM seçebilirsiniz. Doğruluk, eksiksizlik ve profesyonel stil ve ton gibi kalite ölçütlerinin yanı sıra zararlılık ve cevap reddi gibi sorumlu yapay zeka ölçütlerini de seçebilirsiniz. Sunucusuz modeller, Converse API'si ile uyumlu Bedrock Marketplace modelleri, özelleştirilmiş ve damıtılmış modeller, içe aktarılan modeller ve model yönlendiricileri dahil olmak üzere Amazon Bedrock'taki tüm mevcut modelleri değerlendirebilirsiniz. Ayrıca değerlendirme işlerindeki sonuçları karşılaştırmanız da mümkündür.
*Yepyeni ve daha esnek!* Bugün, değerlendirme işi için giriş istemi veri kümenize önceden getirdiğiniz kendi çıkarım yanıtlarınızı getirerek ("kendi çıkarım yanıtlarınızı getirin") herhangi bir yerde barındırılan her türlü modeli veya sistemi değerlendirebilirsiniz. Bu yanıtlar bir Amazon Bedrock modelinden veya Amazon Bedrock dışında barındırılan herhangi bir modelden ya da uygulamadan olabilir. Bu da değerlendirme işinde bir Amazon Bedrock modelini çağırma adımını atlamanıza ve uygulamanızın tüm ara adımlarını nihai yanıtlarınıza dahil etmenize olanak tanır.
Değerlendirici olarak LLM ile insanlar tarafından yapılan değerlendirmelerin kalitesine benzer kaliteyi daha düşük maliyetle elde ederken, haftalarca zaman kazanabilirsiniz.
Daha fazla bilgi edinmek için Amazon Bedrock Değerlendirmeleri sayfasını ve belgeleri inceleyin. Kullanmaya başlamak için AWS Konsolu'nda oturum açın veya Amazon Bedrock API'lerini kullanın.