Amazon SageMaker HyperPod تدعم الآن إجراءات المجموعة من وحدة التحكم

:تاريخ النشر 10 فبراير 2026

يتيح لك Amazon SageMaker HyperPod الآن إدارة عقد المجموعات الفردية مباشرةً من وحدة تحكم AWS. غالبًا ما يحتاج مشغلو مجموعة HyperPod الذين يديرون أعباء عمل الذكاء الاصطناعي/تعلم الآلة (AI/ML) واسعة النطاق إلى الاتصال بالمجموعات لاستكشاف الأخطاء وإصلاحها أو إعادة تشغيل المثيلات غير المستجيبة أو استبدال العقد المتدهورة. كان الاتصال بمجموعة يتطلب سابقًا إنشاء سلاسل اتصال SSM يدويًا، بينما كانت إجراءات استرداد العقدة مثل إعادة التشغيل والاستبدال تتطلب أوامر CLI، توفر وحدة التحكم الآن واجهة واحدة لجميع إجراءات المجموعة.

باستخدام إجراءات المجموعة في وحدة التحكم، يمكنك الآن الاتصال بأي عقدة عبر AWS Systems Manager (SSM). توفر وحدة التحكم أوامر SSM CLI المعبأة مسبقًا مع دعم النسخ إلى الحافظة وبدء جلسة SSM مباشرة عبر وحدة التحكم. في حين أن مجموعات SageMaker HyperPod تدعم بالفعل الاستبدال وإعادة التشغيل التلقائي للمثيلات غير الصحية، إلا أن هناك سيناريوهات مثل تجاوز سعة الذاكرة أو تدهور الأجهزة الذي لا يمكن اكتشافه والذي قد يتطلب تدخلًا يدويًا. الآن، توفر إجراءات المجموعة في وحدة التحكم نهجًا متسقًا لإعادة تشغيل المجموعات يدويًا للتعافي من المشكلات العابرة وحذف العقد غير الصحية واستبدال العقد، مع دعم العمليات المجمعة لإجراءات المجموعة المتعددة في وقت واحد، مما يتيح لك حل مشكلات المجموعة في دقائق. تعتبر هذه الإمكانية ذات قيمة خاصة عند تشغيل أعباء عمل تدريب واستدلال الذكاء الاصطناعي الحساسة للوقت حيث يكون تقليل وقت التعطل أمرًا ضروريًا.

تتوفر هذه الميزة في جميع مناطق AWS حيث يتم دعم Amazon SageMaker HyperPod. يمكنك تنفيذ جميع إجراءات العقدة هذه في صفحة إدارة HyperPod Cluster على وحدة التحكم. انقر على الروابط ذات الصلة لمعرفة المزيد حول الاستبدال/إعادة التشغيل والاتصال بمجموعة.