قدرة LLM-as-a-Judge لتقييم النماذج لـ Amazon Bedrock متاحةً الآن بشكل عام
أصبحت قدرة LLM-as-a-Judge لتقييم نموذج Amazon Bedrock متاحةً الآن بشكل عام. يتيح لك تقييم نماذج Amazon Bedrock تقييم ومقارنة واختيار النماذج الأنسب لحالة الاستخدام الخاصة بك. يمكنك اختيار نموذج لغة كبير (LLM) كحَكَم لك من بين العديد من الخيارات المتاحة على Bedrock لضمان حصولك على المزيج الصحيح من نماذج المُقيّم والنماذج التي يتم تقييمها. يمكنك تحديد مقاييس الجودة مثل الصحة والاكتمال والأسلوب والنبرة المهنية، بالإضافة إلى مقاييس الذكاء الاصطناعي المسؤول مثل الضرر ورفض الإجابة. يمكنك تقييم جميع النماذج المتاحة على Amazon Bedrock، بما في ذلك النماذج بلا خادم، ونماذج Bedrock Marketplace المتوافقة مع Converse API، والنماذج المخصصة والملخَّصة، والنماذج المستوردة، وأجهزة توجيه النماذج. يمكنك أيضًا مقارنة النتائج عبر وظائف التقييم.
*جديد تمامًا - المزيد من المرونة! * اليوم، يمكنك تقييم أي نموذج أو نظام مستضاف في أي مكان عن طريق إحضار استجابات الاستدلال الخاصة بك التي جلبتها بالفعل إلى مجموعة بيانات أمر الإدخال لوظيفة التقييم («إحضار استجابات الاستدلال الخاصة بك»). يمكن أن تكون هذه الردود من نموذج Amazon Bedrock أو من أي نموذج أو تطبيق مستضاف خارج Amazon Bedrock، مما يتيح لك تجاوز استدعاء نموذج Amazon Bedrock في وظيفة التقييم، ويسمح لك بدمج جميع الخطوات الوسيطة لتطبيقك في استجاباتك النهائية.
مع LLM-as-a-judge، يمكنك الحصول على جودة تقييم تشبه جودة تقييم الإنسان بتكلفة أقل، مع توفير أسابيع من الوقت.
لمعرفة المزيد، تفضل بزيارة صفحة تقييمات Amazon Bedrock والوثائق. للبدء، قم بتسجيل الدخول إلى وحدة تحكم AWS أو استخدم واجهات برمجة تطبيقات Amazon Bedrock.