تقدم Amazon SageMaker HyperPod الآن مهارات استكشاف الأخطاء وإصلاحها لمساعدي كتابة التعليمات البرمجية بالذكاء الاصطناعي

:تاريخ النشر 1 يونيو 2026

توفر Amazon SageMaker HyperPod الآن مهارات استكشاف الأخطاء وإصلاحها التي تجلب تشخيصات كتلة AI/ML على مستوى الخبراء مباشرةً إلى مساعدي كتابة التعليمات البرمجية بالذكاء الاصطناعي مثل Claude Code وCursor وKiro. SageMaker HyperPod عبارة عن بنية تحتية مصممة خصيصًا لتطوير النماذج الأساسية وتدريبها ونشرها على نطاق واسع. توفر بيئة مرنة وعالية الأداء مع تحمّل أعطال مدمج، واستعادة تلقائية للكتل، مما يقلل العبء التشغيلي غير المميز في إدارة بنية تحتية واسعة النطاق للذكاء الاصطناعي/تعلّم الآلة. تمكّنك مهارات HyperPod من تشخيص مشكلات الكتلة وحلها من خلال اللغة الطبيعية، مما يقلل الوقت والخبرة اللازمين لاستكشاف أخطاء التدريب الموزع والبنية التحتية للاستدلال وإصلاحها.

يظل تصحيح أخطاء أجهزة GPU وتشخيص أعطال اتصالات NCCL وتحديد اختناقات الأداء عبر الكتل الموزعة الكبيرة أمرًا معقدًا ويستغرق وقتًا طويلاً. غالبًا ما يحتاج المشغلون إلى SSM يدويًا في العقد، وتحليل السجلات عبر عشرات المثيلات، والوثائق المرجعية التبادلية. تساعد مهارات استكشاف الأخطاء وإصلاحها الجديدة في HyperPod على تسريع وقت الحل من خلال الإمكانات التي تشمل التحقق من صحة الكتلة وتشخيصات الأجهزة والاتصالات وانجرافات إصدارات البرامج وإعداد التقارير التشخيصية الآلية. تقوم كل مهارة بترميز أفضل ممارسات AWS في تدفقات عمل تشخيصية منظمة توجه وكلاء الذكاء الاصطناعي بشكل منهجي لجمع الأدلة من عقد الكتل الخاصة بك عبر AWS Systems Manager وتحليل الأنماط وتقديم توصيات قابلة للتنفيذ. تعمل المهارات مع البنية التحتية الحالية لـ HyperPod — لا يلزم إجراء أي تعديلات.

تعد مهارات استكشاف الأخطاء وإصلاحها في HyperPod مفتوحة المصدر ومتاحة اليوم لكل من كتل HyperPod المنسقة من Slurm وAmazon EKS عبر المكون الإضافي لمهارات الذكاء الاصطناعي في SageMaker. للبدء، تفضل بزيارة مستودع AWSLabs github لتثبيت المكون الإضافي sagemaker-ai في مساعد كتابة التعليمات البرمجية المفضل لديك.