الميزات الجديدة لـ AWS Neuron 2.24 تشمل PyTorch 2.7 وتحسينات في الاستدلال

:تاريخ النشر 2 يوليو 2025

تعلن AWS اليوم عن التوافر العام لـ Neuron 2.24، مما يوفر ميزات جديدة وتحسينات في الأداء للعملاء الذين يقومون ببناء ونشر نماذج التعلم العميق على مثيلات AWS Inferentia وTrainium. تقدم Neuron 2.24 دعمًا لـ PyTorch 2.7 وقدرات الاستدلال المحسنة والتوافق الموسع مع أطر تعلّم الآلة الشائعة. تساعد هذه التحديثات المطورين وعلماء البيانات على تسريع تدريب النماذج والاستدلال وتحسين الكفاءة وتبسيط نشر نماذج اللغات الكبيرة وأعباء عمل الذكاء الاصطناعي الأخرى.

مع Neuron 2.24، يمكن للعملاء الاستفادة من ميزات الاستدلال المتقدمة مثل التخزين المؤقت للبادئة (prefix caching) لتحقيق وقت أسرع للوصول إلى الرمز الأول (TTFT)، والاستدلال المفصل disaggregated inference لتقليل تداخل التعبئة المسبقة-فك التشفير، وموازاة السياق context parallelism لتحسين الأداء على التسلسلات الطويلة. يوفر الإصدار أيضًا دعمًا لنماذج نصوص Qwen 2.5 وتكاملًا محسّنًا مع Hugging Face Optimum Neuron وواجهة NxD Core الخلفية المعتمدة على PyTorch.

يتوفر Neuron 2.24 في جميع مناطق AWS حيث يتم تقديم مثيلات Inferentia وTrainium.

لمعرفة المزيد وللحصول على قائمة كاملة بالميزات والتحسينات الجديدة، راجع:

الميزات الجديدة لـ AWS Neuron 2.24 تشمل PyTorch 2.7 وتحسينات في الاستدلال

التعلُّم

الموارد

المطورين

المساعدة