تقدم منصة Amazon SageMaker إمكانية جديدة لتحسين استدلال الذكاء الاصطناعي المولّد

:تاريخ النشر 9 يوليو 2024

أعلنت منصة Amazon SageMaker اليوم عن التوافر العام لقدرة استدلال جديدة توفر معدل نقل أعلى بنسبة تصل إلى الضعف تقريبًا مع تقليل التكاليف بنسبة تصل إلى حوالي 50٪ لنماذج الذكاء الاصطناعي المولّد مثل نماذج Llama 3 وMistral وMixtral. على سبيل المثال، باستخدام طراز Llama 3-70B، يمكنك تحقيق ما يصل إلى 2400 رمزًا في الثانية تقريبًا على مثيل ml.p5.48xlarge مقابل 1200 رمزًا تقريبًا في الثانية سابقًا دون أي تحسين.

وبفضل هذه الإمكانية الجديدة، يستطيع العملاء الاختيار من قائمة تضم أحدث تقنيات تحسين النماذج، مثل تقديم تخمينات مدروسة، والتحديد الكمي، والتجميع، وتطبيقها على نماذج الذكاء الاصطناعي المولّد الخاصة بهم. ستتولى منصة SageMaker القيام بالأعمال الشاقة المتمثلة في توفير الأجهزة والمعدات المطلوبة لتشغيل وصفة التحسين، جنبًا إلى جنب مع أطر عمل التعليم العميق والمكتبات الخاصة بها. يحصل العملاء على دعم جاهز للاستخدام في حل تقديم التخمينات المدروسة من منصة SageMaker التي تم اختبارها والتأكد من قدرتها على الأداء على نطاق واسع في العديد من النماذج الشائعة مفتوحة المصدر، أو يمكنها تقديم حل تقديم التخمينات المدروسة الخاص بها. بالنسبة للقياس الكمي، تضمن منصة SageMaker التوافق والدعم لأنواع الدقة في بنية النماذج المختلفة. بالنسبة للتجميع، تضمن البنية التحتية لوقت التشغيل في منصة SageMaker التحميل الفعال للنماذج المحسّنة والتخزين المؤقت لها بطريقة تعمل على تقليل الوقت المطلوب للتكيف التلقائي.

يستطيع العملاء الاستفادة من هذه الإمكانية الجديدة من AWS SDK for Python (Boto3) أو SageMaker Python SDK أو واجهة سطر الأمر من AWS (AWS CLI). تتوفر هذه الإمكانية حاليًا بشكل عام في شرق الولايات المتحدة (فرجينيا الشمالية) وشرق الولايات المتحدة (أوهايو) وغرب الولايات المتحدة (أوريجون) وآسيا والمحيط الهادئ (مومباي) وآسيا والمحيط الهادئ (سنغافورة) وآسيا والمحيط الهادئ (سيدني) وآسيا والمحيط الهادئ (طوكيو) وكندا (الوسطى) وأوروبا (فرانكفورت) وأوروبا (أيرلندا) وأوروبا (لندن) وأوروبا (باريس) وأوروبا (ستوكهولم)، ومناطق أمريكا الجنوبية (ساو باولو).

تعرف على المزيد من المعلومات عن طريق زيارة صفحة الوثائق الخاصة بنا ومدونة AWS ML الخاصة بنا.