Amazon SageMaker HyperPod تدعم الآن تكوين Slurm المعتمد على واجهة برمجة التطبيقات (API)
تدعم Amazon SageMaker HyperPod الآن تكوين Slurm المعتمد على واجهة برمجة التطبيقات (API)، ويتيح لك ذلك تعريف هيكلية Slurm وتكوينات نظام الملفات التي تتم مشاركتها مباشرةً في واجهات API الخاصة بإنشاء وتحديث الكتل أو من خلال وحدة تحكم AWS. يساعدك SageMaker HyperPod على توفير مجموعات مرنة لتشغيل أعباء عمل التعلم الآلي (ML) وتطوير أحدث النماذج مثل نماذج اللغة الكبير (LLMs) ونماذج الانتشار ونماذج التأسيس (FMs).
باستخدام هذا التكوين الجديد المعتمد على واجهة API، صار بإمكانك الآن تحديد أنواع عقد Slurm - بما في ذلك وحدة التحكم، وتسجيل الدخول، والحوسبة - لمجموعات مثيلات الكتل، وعمليات ربط مجموعة المثيلات بوحدات التقسيم، ومسارات تخزين نظام ملفات FSx for Lustre وFSx for OpenZFS لكل مجموعة مثيلات مباشرةً في تعريف واجهة API الخاصة بالكتلة أو من خلال قسم التكوين المتقدم في وحدة تحكم AWS. عندما تقوم بتعديل عمليات الربط بعقدة التقسيم مباشرة في ملفات التكوين المصممة خصيصًا لـ Slurm لضبط عمليات تعيين موارد الكتلة بدقة، يمكن أن تحيد تكوينات عقدة التقسيم في Slurm عن عرض HyperPod. تساعدك إستراتيجية SlurmConfigStrategy الجديدة على مستوى الكتلة على إدارة الحياد من خلال ثلاثة خيارات: الإدارة، والاستبدال، والدمج. إن الإستراتيجية المُدارة تسمح لك بإدارة مجموعة المثيلات في عمليات الربط بوحدات التقسيم بالكامل عبر واجهة API أو وحدة التحكم، وتكتشف تلقائيًا الحياد في عمليات الربط بين وحدة التقسيم والعقد أثناء عمليات توسيع النطاق أو تضييقه. عند اكتشاف الحياد، يتم إيقاف تحديثات الكتلة مؤقتًا حتى تحل هذه المشكلة عن طريق التبديل إلى إستراتيجية الاستبدال لفرض عمليات الربط المعرَّفة من خلال واجهة API، أو إستراتيجية الدمج للحفاظ على التخصيصات اليدوية، أو عن طريق التحديث المباشر لتكوينات Slurm للتوافق مع HyperPod.
يتوفر تكوين Slurm المعتمد على واجهة API في جميع مناطق AWS حيث يتوفر SageMaker HyperPod. للبدء، يمكنك استخدام وحدة إدارة تحكم AWS، أو واجهة سطر الأوامر (CLI) من AWS، أو AWS CloudFormation، أو مجموعات تطوير البرمجيات (SDK) من AWS. لمزيد من المعلومات، راجع وثائق Amazon SageMaker HyperPod لإنشاء كتل باستخدام وحدة التحكم، أو واجهة CLI، ومرجع واجهة API لـ CreateCluster وUpdateCluster.