Amazon Bedrock AgentCore تطلق إمكانات لتحسين أداء الوكلاء في نسخة المعاينة
تطلق Amazon Bedrock AgentCore توصيات وطريقتين للتحقق من الأداء (التقييمات المجمعة واختبارات A/B). هذا يكمل حلقة المراقبة والتقييم والتحسين لوكلاء الذكاء الاصطناعي في بيئات الإنتاج. حتى الآن، كان تحويل نتائج التقييم إلى تحسينات ملموسة ومعتمدة يتطلب تدخلًا يدويًا من المطور واعتمادًا على الحدس بدلاً من اتباع نهج منهجي. مع توفر التوصيات والتقييمات المجمعة واختبارات A/B، أصبح لدى المطورين الآن الأدوات اللازمة لاتخاذ إجراءات بناءً على ما تكشفه عمليات التقييم.
مع تطور النماذج وتغير سلوك المستخدمين، تتدهور جودة الوكيل بهدوء بمرور الوقت. تقوم ميزة التوصيات بتحليل آثار الإنتاج ومخرجات التقييم التي تم إنشاؤها بواسطة AgentCore لإنشاء أوامر محسنة للنظام وأوصاف أدوات مصممة خصيصًا لعبء العمل المحدد الخاص بك. يتم بعد ذلك استخدام التقييمات المجمعة للتحقق من صحة التوصيات مقابل حالات الاختبار المحددة مسبقًا. وتعمل اختبارات A/B أيضًا على التحقق من صحة هذه التوصيات من خلال اختبار A/B المتحكم فيه مقابل مجموعات الاختبار المحددة مسبقًا أو حركة بيانات الإنتاج المباشرة، مع تقديم تقارير حول الدلالة الإحصائية قبل اعتماد أي تغيير. تتطلب كل توصية موافقتك قبل تطبيقها. تعمل هذه الإمكانات معًا على إكمال دورة تحسين الأداء للوكلاء. فالوكلاء لا يعملون فحسب، بل يتطورون للأفضل وفقًا لشروطك الخاصة.
يمكنك استخدام إمكانات التحسين في جميع مناطق AWS حيث تتوفر تقييمات AgentCore. لمعرفة المزيد، راجع وثائق AgentCore.