تدعم Amazon SageMaker HyperPod الآن التسميات وعمليات فحص العيوب المخصصة من Kubernetes
تدعم Amazon SageMaker HyperPod الآن التسميات وعمليات فحص العيوب المخصصة من Kubernetes، مما يمكّن العملاء من التحكم في جدولة وحدات pod والاندماج بسلاسة مع البنية التحتية الحالية لـ Kubernetes. يحتاج العملاء الذين ينشرون أعباء عمل الذكاء الاصطناعي على كتل HyperPod التي يتم تنسيقها مع EKS إلى تحكم دقيق في وضع عبء العمل لمنع استهلاك موارد GPU باهظة الثمن بواسطة وحدات pod الخاصة بالنظام وأعباء العمل غير المرتبطة بالذكاء الاصطناعي، مع ضمان التوافق مع المكونات الإضافية للأجهزة المخصصة مثل مشغلي EFA وNVIDIA GPU. في السابق، كان على العملاء تطبيق التسميات وعمليات فحص العيوب يدويًا باستخدام kubectl وإعادة تطبيقها بعد كل عملية استبدال للعقدة أو تغيير للحجم أو تصحيح، مما يؤدي إلى زيادة النفقات التشغيلية بشكل كبير.
تسمح لك هذه الإمكانية بتكوين التسميات وعمليات فحص العيوب على مستوى مجموعة المثيلات من خلال واجهات API CreateCluster وUpdateCluster، مما يوفر نهجًا مُدارًا لتحديد سياسات الجدولة والحفاظ عليها عبر دورة حياة العقدة بأكملها. باستخدام معلمة KubernetesConfig الجديدة، يمكنك تحديد ما يصل إلى 50 تسمية و50 عملية فحص للعيوب لكل مجموعة مثيلات. تمكّن التسميات تنظيم الموارد واستهداف وحدات pod من خلال محددات العقد، بينما تعمل عمليات فحص العيوب على صد وحدات pod دون مطابقة التفاوتات المسموح بها لحماية العقد المتخصصة. على سبيل المثال، يمكنك تطبيق عمليات فحص العيوب من NoSchedule على مجموعات مثيلات GPU للتأكد من أن مهام تدريب الذكاء الاصطناعي ذات التفاوتات الصريحة فقط هي التي تستهلك موارد الحوسبة عالية التكلفة، أو إضافة تسميات مخصصة تمكّن وحدات pod الخاصة بالمكونات الإضافية للجهاز من الجدولة بشكل صحيح. تقوم HyperPod تلقائيًا بتطبيق هذه التكوينات أثناء إنشاء العقدة وتحافظ عليها عبر عمليات الاستبدال والتحجيم والتصحيح، مما يلغي التدخل اليدوي ويقلل من النفقات التشغيلية.
تتوفر هذه الميزة في جميع مناطق AWS حيث تتوفر Amazon SageMaker HyperPod. لمعرفة المزيد حول التسميات وعمليات فحص العيوب المخصصة، اطلع على دليل المستخدم.