تطرح Amazon SageMaker إمكانية التوسع التلقائي بشكل أسرع لنماذج الذكاء الاصطناعي المولّد

:تاريخ النشر 25 يوليو 2024

يسعدنا أن نعلن عن قدرة جديدة في واجهة Amazon SageMaker تساعد العملاء على تقليل الوقت الذي تستغرقه نماذج الذكاء الاصطناعي المولّد الخاصة بهم للتوسع تلقائيًا. يمكنهم الآن استخدام مقاييس دقيقة فرعية وتقليل وقت استجابة التوسع الكلي لنماذج الذكاء الاصطناعي بشكل كبير. باستخدام هذا التحسين، يمكن للعملاء تحسين استجابة تطبيقات الذكاء الاصطناعي المولّد الخاصة بهم مع تذبذب الطلب.

باستخدام هذه الإمكانية، يحصل العملاء على مقياسين جديدين ذوَي دقة عالية لـ CloudWatch - ConcurrentRequestPerModel وConcurrentRequestSperModelCopy - يتوفران بإمكانية القياس التلقائي بشكل أسرع. يتم إصدار هذه المقاييس بفاصل زمني قدره 10 ثوانٍ وتوفر تمثيلاً أكثر دقة للعبء على نقطة النهاية من خلال تتبع التزامن الفعلي، أو عدد طلبات الاستدلال أثناء التنقل التي تتم معالجتها بواسطة النموذج. يمكن للعملاء إنشاء سياسات التوسع التلقائي باستخدام هذه المقاييس عالية الدقة لتوسيع نطاق نماذجهم المنشورة على نقاط نهاية SageMaker. سيبدأ Amazon SageMaker في إضافة مثيلات جديدة، أو نسخ نموذجية في أقل من دقيقة عند الوصول إلى العتبات المحددة في سياسات التوسع التلقائي هذه. يوفر ذلك للعملاء تحسين الأداء وكفاءة التكلفة لأعباء عمل الاستدلال الخاصة بهم على SageMaker.

ويمكن الوصول إلى هذه الإمكانية الجديدة في مجموعات مثيلات المسرّع (g4dn وg5 وg6 وp2 وp3 وp4d وp4de وp5 وinf1 وinf2 وtrn1n وtrn1) في جميع مناطق AWS التي تتوفر فيها خدمة Amazon SageMaker Inference، باستثناء الصين ومناطق AWS GovCloud (الولايات المتحدة). لمعرفة المزيد، اطّلع على مدونة AWS ML وتفضل بزيارة الوثائق الخاصة بنا.