Amazon Bedrock تدعم الآن تقييم RAG (متاح بشكل عام)
أصبح تقييم التوليد المعزز بالاسترداد (RAG) لـ Amazon Bedrock متاحًا الآن بشكل عام. يمكنك تقييم تطبيقات التوليد المعزز بالاسترداد (RAG)، سواء تلك المبنية على قواعد المعرفة لـ Amazon Bedrock أو على نظام RAG مخصص. يمكنك تقييم الاسترداد أو التوليد من البداية إلى النهاية. يتم تشغيل التقييمات بواسطة تقنية LLM-as-a-judge، حيث يمكن اختيار العديد من نماذج التحكيم. للاسترداد، يمكنك الاختيار من بين مقاييس مثل ملاءمة السياق والتغطية. للاسترداد والتوليد من البداية إلى النهاية، يمكنك الاختيار من بين مقاييس الجودة مثل الصحة والاكتمال والصدق (كشف الهلوسة)، ومقاييس الذكاء الاصطناعي المسؤول مثل الضرر ورفض الإجابة والنمطية. يمكنك أيضًا المقارنة عبر وظائف التقييم للتكرار في قواعد المعرفة الخاصة بك أو تطبيقات RAG المخصصة بإعدادات مختلفة مثل إستراتيجية التقسيم أو طول المتجه أو عمليات إعادة الترتيب أو نماذج توليد المحتوى المختلفة.
*جديد تمامًا - المزيد من المرونة!* ابتداءً من اليوم، إضافة إلى قواعد المعرفة لـ Bedrock، تدعم تقييمات التوليد المعزز بالاسترداد (RAG) لـ Amazon Bedrock تقييمات مسارات RAG المخصصة. يمكن للعملاء الذين يقومون بتقييم مسارات RAG المخصصة الآن إحضار أزواج المدخلات والمخرجات والسياقات المستردة إلى وظيفة التقييم مباشرة في مجموعة بيانات الإدخال الخاصة بهم، وهذا يمكنهم من تجاوز الاستدعاء إلى قاعدة المعرفة لـ Bedrock («إحضار استجابات الاستدلال الخاصة بك»). أضفنا أيضًا مقاييس دقة الاقتباس وتغطية الاقتباس لتقييم قواعد المعرفة لـ Bedrock. إذا كنت تستخدم قاعدة معرفة لـ Bedrock كجزء من تقييمك، يمكنك دمج حواجز حماية Amazon Bedrock مباشرةً.
لمعرفة المزيد، تفضل بزيارة صفحة تقييمات Amazon Bedrock والوثائق. للبدء، قم بتسجيل الدخول إلى وحدة تحكم Amazon Bedrock أو استخدم واجهات API لـ Amazon Bedrock.