يُطلق Amazon SageMaker ميزة استدلال النماذج متعددة المحولات (Multi-Adapter Model Inference)

:تاريخ النشر 25 نوفمبر 2024

اليوم، تقدم Amazon SageMaker إمكانات استدلال جديدة متعددة المحولات تفتح إمكانيات مثيرة للعملاء الذين يستخدمون نماذج لغوية مدربة مسبقًا. تتيح لك هذه الميزة نشر المئات من محولات طراز LoRA (التكيف منخفض الرتبة) التي تم ضبطها بدقة خلف نقطة نهاية واحدة، وتحميل المحولات المناسبة ديناميكيًا في أجزاء من الثانية بناءً على الطلب. يمكّنك هذا من استضافة العديد من محولات LoRA المتخصصة بكفاءة والمبنية على نموذج أساسي مشترك، مما يوفر إنتاجية عالية ووفورات في التكاليف مقارنة بنشر نماذج منفصلة.

باستخدام الاستدلال متعدد المحولات، يمكنك تخصيص النماذج المدربة مسبقًا بسرعة لتلبية احتياجات الأعمال المتنوعة. على سبيل المثال، يمكن لشركات التسويق وشركات SaaS تخصيص تطبيقات AI/ML باستخدام الصور الفريدة لكل عميل وأسلوب الاتصال والمستندات لإنشاء محتوى مخصص في ثوانٍ. وبالمثل، يمكن للمؤسسات في قطاعات مثل الرعاية الصحية والخدمات المالية إعادة استخدام نموذج أساسي مشترك مدعوم من LoRA لمعالجة مجموعة متنوعة من المهام المتخصصة، بدءًا من التشخيص الطبي وصولاً إلى اكتشاف الاحتيال، ببساطة عن طريق تبديل المحول المناسب الذي تم ضبطه بدقة. تتيح هذه المرونة والكفاءة فرصًا جديدة لنشر الذكاء الاصطناعي القوي والقابل للتكيف عبر مؤسستك.

تتوفر ميزة الاستدلال متعدد المحولات بشكل عام في: آسيا والمحيط الهادئ (طوكيو، سيول، مومباي، سنغافورة، سيدني، جاكرتا) وكندا (الوسطى) وأوروبا (فرانكفورت، ستوكهولم، أيرلندا، لندن) والشرق الأوسط (الإمارات العربية المتحدة) وأمريكا الجنوبية (ساو باولو) وشرق الولايات المتحدة (شمال فيرجينيا، أوهايو)، وغرب الولايات المتحدة (أوريجون).

للبدء، راجع دليل مطور Amazon SageMaker للحصول على معلومات حول استخدام LoRA وإدارة محولات النماذج.