SageMaker JumpStart تقدم الآن عمليات نشر محسّنة لنماذج التأسيس
يوفر SageMaker JumpStart الآن عمليات نشر محسّنة، مما يمكّن العملاء من نشر نماذج التأسيس بإعدادات تم تكوينها مسبقًا ومصممة خصيصًا لحالات استخدام وقيود أداء محددة. تعمل عمليات النشر المحسّنة لـ SageMaker JumpStart على تبسيط نشر النموذج من خلال تقديم تكوينات تدرك طبيعة المهام تعمل على تحسين التكلفة أو معدل النقل أو وقت الاستجابة بناءً على متطلبات عبء العمل - سواء لإنشاء المحتوى أو التلخيص أو الأسئلة والأجوبة. يتضمن هذا الإطلاق دعمًا لأكثر من 30 طرازًا شائعًا من Meta وMicrosoft وMistral AI وQwen وGoogle وTII، مع رؤية مقاييس الأداء الرئيسية مثل وقت استجابة P50 ووقت ظهور أول رمز مميز (TTFT) ومعدل النقل قبل النشر.
من خلال عمليات النشر المحسّنة من SageMaker JumpStart، يمكن للعملاء الاختيار من بين تكوينات الخاصة بحالات الاستخدام (مثل الكتابة التوليدية أو التفاعلات بأسلوب الدردشة) واختيار أهداف التحسين بما في ذلك تحسيت التكلفة أو معدل النقل أو وقت الاستجابة أو الوصول إلى الأداء المتوازن. يتم نشر النماذج في نقاط نهاية الاستدلال المُدارة بالذكاء الاصطناعي من SageMaker أو مجموعات SageMaker HyperPod ذات التكوينات المحددة مسبقًا والتي تلغي الحاجة للتخمين، مع الاحتفاظ برؤية كاملة لتفاصيل النشر. تشمل النماذج المتاحة متغيرات Meta Llama 3.1 و3.2 ونموذج Microsoft Phi-3 ونماذج Mistral AI بما في ذلك نماذج Mistral-Small-24B-Instruct-2501 الجديدة، وسلسلة Qwen 2 و3 بما في ذلك Qwen2-VL متعدد الوسائط، وGoogle Gemma، وTII Falcon3. تستفيد جميع عمليات النشر من إمكانات نشر VPC الخاصة بـ SageMaker، مما يضمن التحكم في البيانات وتوفير بنية تحتية جاهزة للإنتاج مع أمان على مستوى المؤسسة. تتوفر الميزة في جميع مناطق AWS حيث يتم دعم SageMaker JumpStart حاليًا.
للبدء في عمليات النشر المحسّنة، انتقل إلى النماذج في SageMaker Studio، وحدد نمموذج التأسيس الذي تريده من تبويب JumpStart Models، واختر «نشر»، وحدد حالة الاستخدام وهدف تحسين الأداء. لمزيد من التفاصيل، قم بزيارة وثائق SageMaker JumpStart. تعمل AWS بنشاط على توسيع الدعم ليشمل نماذج إضافية.