تقدم Amazon Bedrock المستويين Priority وFlex من خدمة الاستدلال
واليوم، تقدم Amazon Bedrock مستويين جديدين من خدمات الاستدلال لتحسين التكاليف والأداء لأعباء عمل الذكاء الاصطناعي المختلفة. يوفر مستوى Flex الجديد أسعارًا فعالة من حيث التكلفة للتطبيقات غير الحرجة مثل تقييمات النماذج وتلخيص المحتوى بينما يوفر مستوى Priority أداءً متميزًا ومعالجة تفضيلية للتطبيقات ذات المهام الحرجة. بالنسبة لمعظم الموديلات التي تدعم مستوى Priority، يمكن للعملاء تحقيق زمن استجابة لرموز الإخراج في الثانية (OTPS) أفضل بنسبة تصل إلى 25% مقارنة بالمستوى القياسي. وتنضم هذه التطبيقات إلى مستوى Standard الحالي لتطبيقات الذكاء الاصطناعي اليومية ذات الأداء الموثوق.
تعالج مستويات الخدمة هذه التحديات الرئيسية التي تواجهها المؤسسات عند نشر الذكاء الاصطناعي على نطاق واسع. تم تصميم فئة Flex لأعباء العمل غير التفاعلية التي يمكنها تحمل فترات استجابة أطول، مما يجعلها مثالية لتقييمات النماذج، وتلخيص المحتوى، ووضع العلامات والتعليقات التوضيحية، وسير العمل الوكيل متعدد الخطوات، ويتم تسعيرها بسعر مخفض بالنسبة لمستوى Standard. خلال فترات الطلب المرتفع، تحظى طلبات Flex بأولوية أقل مقارنة بمستوى Standard. يُعد مستوى الأولوية مناسبًا تمامًا للتطبيقات المهمة وتفاعلات المستخدم النهائي في الوقت الفعلي والتجارب التفاعلية حيث تكون الاستجابات المتسقة والسريعة ضرورية. خلال فترات الطلب المرتفع، تحظى طلبات Priority بأولوية المعالجة، بسعر ممتاز، على مستويات الخدمة الأخرى. تتوفر مستويات الخدمة الجديدة هذه اليوم لمجموعة من النماذج الأساسية الرائدة، بما في ذلك OpenAI (gpt-oss-20b, gpt-oss-120b) وDeepSeek (DeepSeek V3.1) وQwen3 (Coder-480B-A35B-Instruct, Coder-30B-A3B-Instruct, 32B dense, Qwen3-235B-A22B-2507) وAmazon Nova (Nova Pro وNova Premier). من خلال هذه الخيارات الجديدة، تساعد Amazon Bedrock العملاء على اكتساب قدر أكبر من التحكم في موازنة كفاءة التكلفة مع متطلبات الأداء، مما يمكّنهم من توسيع نطاق أعباء عمل الذكاء الاصطناعي اقتصاديًا مع ضمان تجارب المستخدم المثلى لتطبيقاتهم الأكثر أهمية.
لمزيد من المعلومات حول مناطق AWS التي تتوفر فيها مستويات خدمة Priority وFlex للاستدلال من Amazon Bedrock، اطلع على جدول مناطق AWS
تعرف على المزيد حول مستويات الخدمة في مدونة الأخبار والوثائق.