تطلق Amazon SageMaker AI توصيات استدلال الذكاء الاصطناعي المولّد المحسّنة
ويدعم Amazon SageMaker AI الآن توصيات الاستدلال، وهي إمكانية جديدة تلغي التحسين اليدوي والمقارنة المرجعية لتقديم أداء الاستدلال الأمثل. من خلال تقديم تكوينات نشر مثالية تم التحقق منها مع مقاييس الأداء، يعمل SageMaker AI على تسريع المسار المؤدي للإنتاج والحفاظ على تركيز مطوري النماذج لديك على إنشاء نماذج دقيقة، وليس إدارة البنية التحتية.
يجلب العملاء نماذج الذكاء الاصطناعي المولّد الخاصة بهم، ويحددون أنماط حركة البيانات المتوقعة، ويحددون هدف الأداء (التحسين للتكلفة أو تقليل زمن الاستجابة أو زيادة معدل النقل إلى أقصى حد). ويقوم SageMaker AI بعد ذلك بتحليل بنية النموذج وتطبيق التحسينات المتوافقة مع ذلك الهدف عبر أنواع مثيلات متعددة، والمقارنة المرجعية لكل تكوين على البنية التحتية الحقيقية لوحدة معالجة الرسومات باستخدام NVIDIA AIPerf. من خلال تقييم أنواع المثيلات المتعددة، يمكن للعملاء تحديد الخيار الأكثر أداءً من حيث السعر لعبء العمل الخاص بهم. والنتيجة هي تكوينات جاهزة للنشر مع مقاييس تم التحقق منها بما في ذلك الوقت حتى أول رمز، ووقت الاستجابة بين الرموز، والنسب المئوية لوقت استجابة الطلب، ومعدل النقل، وتوقعات التكلفة.
تتوفر الإمكانية اليوم في سبع مناطق AWS: شرق الولايات المتحدة (فرجينيا الشمالية) وغرب الولايات المتحدة (أوريجون) وشرق الولايات المتحدة (أوهايو) وآسيا والمحيط الهادئ (طوكيو) وأوروبا (أيرلندا) وآسيا والمحيط الهادئ (سنغافورة) وأوروبا (فرانكفورت). لمعرفة المزيد، راجع وثائق SageMaker AI.