يدعم Amazon SageMaker HyperPod الآن عمليات التحقق من الحالة الصحية العميقة عند الطلب

:تاريخ النشر 17 أبريل 2026

يدعم Amazon SageMaker HyperPod الآن عمليات التحقق من الحالة الصحية العميقة عند الطلب لكتل Amazon EKS والكتل المنسقة من Slurm، مما يتيح لك التحقق بشكل استباقي من صحة مسرّع وحدة معالجة الرسومات في المثيلات قيد التشغيل في أي وقت. كما تدعم الكتل المنسقة من Slurm لدى HyperPod الآن عمليات التحقق من الحالة الصحية العميقة أثناء توفير العقدة، في وقت إنشاء الكتلة. وتعالج هذه الإمكانية تحديًا مهمًا حيث يمكن حتى لعقدة واحدة غير سليمة أن تضيع ساعات من وقت الحوسبة وتؤخر أعباء العمل الحرجة.

من خلال عمليات التحقق من الحالة الصحية العميقة عند الطلب، يمكنك استهداف مجموعات مثيلات كاملة أو مثيلات محددة لتشغيل اختبارات الإجهاد الشاملة للمكونات المادية واختبارات الاتصال قبل تخصيص موارد الحوسبة لوظيفة ما. يمكن رؤية التقدم والنتائج على مجموعة المثيلات ومستوى المثيل على حدٍ سواء من خلال وحدة تحكم SageMaker وواجهات برمجة التطبيقات، مما يوفر رؤية كاملة لصحة وحدة معالجة الرسومات واتصال الشبكة وأداء الاتصالات متعددة العقد. يتم عزل المثيلات التي تخضع لعمليات التحقق تلقائيًا عن جدولة عبء العمل وإعادتها إلى الخدمة عند المرور. عند الاقتران بإمكانية استرداد العقدة تلقائيًا في HyperPod، يتم إعادة تشغيل المثيلات التي تفشل أو استبدالها تلقائيًا، مما يضمن سلامة الكتلة.

وتتوفر هذه الإمكانية في جميع المناطق حيث يتوفر Amazon SageMaker HyperPod. لمعرفة المزيد حول عمليات التحقق من الحالة الصحية عند الطلب، اطّلع على الوثائق.