تعلن AWS Neuron عن دعمها لتخصيص الموارد الديناميكية باستخدام Amazon EKS
تعلن AWS عن برنامج تشغيل تخصيص الموارد الديناميكية (DRA) من Neuron لخدمة Amazon Elastic Kubernetes Service (EKS)، مما يوفر جدولة Kubernetes الأصلية الواعية بالمكونات المادية لـ Kubernetes إلى المثيلات المستندة إلى AWS Trainium. يقوم برنامج تشغيل Neuron DRA بنشر سمات الجهاز الغنية مباشرةً إلى برنامج جدولة Kubernetes، مما يتيح اتخاذ قرارات تحديد الموضع المستندة إلى الهيكل بدون ملحقات برنامج الجدولة المخصصة.
يتطلب نشر أعباء عمل الذكاء الاصطناعي على Kubernetes من مهندسي التعلم الآلي (ML) اتخاذ قرارات البنية التحتية التي لا ترتبط ارتباطًا مباشرًا بتطوير النموذج، مثل تحديد عدد الأجهزة وفهم هيكلية المكونات المادية والشبكات وكتابة البيانات الخاصة بالمُسرِّع. ويؤدي هذا الأمر إلى حدوث احتكاك وإبطاء التكرار وربط أعباء العمل بإحكام بالبنية التحتية الأساسية. ومع توسع حالات الاستخدام لتشمل التدريب الموزع والاستدلال طويل السياق والتصميمات المفككة، يصبح هذا التعقيد عقبة في توسيع النطاق.
يزيل برنامج تشغيل Neuron DRA هذا العبء عن طريق فصل مخاوف البنية التحتية عن عمليات سير عمل التعلم الآلي (ML). تقوم فرق البنية التحتية بتعريف ResourceClaimTemplates القابلة لإعادة الاستخدام التي تلتقط سياسات هيكل الجهاز والتخصيص وإنشاء الشبكات. يمكن لمهندسي التعلم الآلي (ML) ببساطة الرجوع إلى هذه القوالب في بياناتهم، دون الحاجة إلى التفكير في تفاصيل المكونات المادية. يتيح هذا الأمر النشر المتسق عبر أنواع أعباء العمل مع السماح بالتكوين لكل عبء عمل حتى تتمكن أعباء العمل المتعددة من مشاركة نفس العقد بكفاءة.
يدعم برنامج التشغيل Neuron DRA جميع أنواع مثيلات AWS Trainium وهو متاح في جميع مناطق AWS حيث يتوفر AWS Trainium.
للحصول على الوثائق ونماذج القوالب وأدلة التنفيذ، راجع وثائق Neuron DRA.
تعرّف على المزيد: