انتقل إلى المحتوى الرئيسي

شرائح الذكاء الاصطناعي من AWS

AWS Neuron

مجموعة تطوير البرمجيات (SDK) لتحسين الذكاء الاصطناعي والتعلم العميق على AWS Trainium وAWS Inferentia

ما المقصود بـ AWS Neuron؟

AWS Neuron هي مجموعة المطورين لإدارة التعلم العميق وأعباء عمل الذكاء الاصطناعي التوليدية على AWS Trainium و AWS Inferentia. تُمكّن Neuron، المبنية على أساس مفتوح المصدر، المطورين من البناء والنشر والاستكشاف محليًا باستخدام أطر PyTorch و JAX ومع مكتبات ML مثل HuggingFace و vLLM و PyTorch Lightning وغيرها دون تعديل التعليمات البرمجية الخاصة بك.  يتضمن المترجم ووقت التشغيل ومكتبات التدريب والاستدلال وأدوات المطور للمراقبة والتنميط وتصحيح الأخطاء. تدعم Neuron دورة حياة تطوير التعلم الآلي من البداية إلى النهاية (ML) بدءًا من إنشاء نماذج التعلم العميق والذكاء الاصطناعي ونشرها، والتحسين لتحقيق أعلى أداء وأقل تكلفة، والحصول على رؤى أعمق لسلوك النموذج. 

تتيح Neuron التجريب السريع، والتدريب على نطاق الإنتاج للنماذج الحدودية، وتحسين الأداء منخفض المستوى من خلال واجهة Neuron Kernel (NKI) للنواة المخصصة، ونشر الاستدلال الأمثل من حيث التكلفة للذكاء الاصطناعي الفعال وأعباء عمل التعلم المعزز، والتنميط الشامل وتصحيح الأخطاء باستخدام Neuron Explorer. 

An abstract illustration of a human head silhouette filled with colorful geometric data patterns and lines, representing artificial intelligence and machine learning concepts.

صُمم للباحثين

تتيح Neuron البحث السريع في مجال الذكاء الاصطناعي عن طريق تشغيل كود PyTorch الأصلي دون تغيير على Trainium. يمكن للباحثين تجربة أفكار جديدة وتكرارها بسرعة مع دعم وضع PyTorch Eager. يعد التوسع أمرًا سهلاً باستخدام مكتبات PyTorch الموزعة مثل FSDP و DDP و dTensor لمشاركة النماذج عبر الرقائق أو التوسع إلى عقد متعددة. تدعم نيورون torch.compile، والمكتبات مثل TorchTitan و HuggingFace Transformers تعمل الآن مباشرة على تراينيوم دون تعديل. أيضًا، يمكن لمطوري JAX استخدام Neuron لتطوير نماذجهم وتحسينها ونشرها بسهولة في Inferentia و Trainium.   

Abstract digital illustration featuring concentric rings of pink brick-like segments on a dark blue background, representing AWS security, identity, and compliance concepts.

مصممة للإنتاجية

تعمل Neuron على تحسين اقتصاديات الاستدلال للذكاء الاصطناعي الفعال وأعباء عمل التعلم المعزز. تعمل واجهات برمجة تطبيقات vLLM V1 القياسية على Trainium و Inferentia بأداء عالٍ خارج الصندوق مع ميزات مثل التوازي مع الخبراء والاستدلال المفصل وفك التشفير التأملي والنواة المحسّنة من مكتبة Neuron Kernel لتعظيم اقتصاديات الرموز على نطاق واسع.  يمكن لمطوري التعلم الآلي التدريب باستخدام HuggingFace Optimum Neuron و PyTorch Lightning و TorchTitan، ثم نشر الاستدلال باستخدام واجهات برمجة تطبيقات VLLM القياسية. 

A vibrant abstract background featuring a pattern of colorful rectangular shapes arranged in horizontal rows, with various shades of blue, red, purple, pink, and yellow.

مصممة للابتكار

يتطلب بناء نماذج الذكاء الاصطناعي كلاً من الابتكار السريع وتحسين الأداء. في حين أن الأطر القياسية مثل PyTorch تجعل من السهل توسيع نطاق التجارب، فإن تجاوز حدود الأداء يتطلب تحسين المجموعة الكاملة (الشريحة والخادم وUltraServer). توفر Neuron لمهندسي أداء التعلم الآلي وصولاً لا مثيل له إلى رقائق AWS AI الخاصة بنا، من خلال واجهة Neuron Kernel (NKI)، والرؤى الأعمق من خلال Neuron Explorer، ومكتبة النواة المحسّنة الخاصة بنا والتي تسمى مكتبة Neuron Kernel (NKiLib). يوفر NKI واجهات برمجة التطبيقات لتخصيص الذاكرة وجدولة التنفيذ والوصول المباشر إلى Trainium ISA مما يتيح التحكم في البرمجة على مستوى التعليمات. NKI Compiler مفتوح المصدر ومبني على MLIR ويوفر رؤية للمطورين في خط أنابيب المترجم الكامل. توفر مكتبة Neuron Kernel مفتوحة المصدر تطبيقات محسّنة مع شفرة المصدر والوثائق والمعايير. يوفر Neuron Explorer مجموعة موحدة من الأدوات التي توجه المطورين خلال رحلة تحسين الأداء وتصحيح الأخطاء. يمكن لمهندسي الأداء تتبع التنفيذ بدءًا من شفرة المصدر وصولاً إلى عمليات الأجهزة، ووضع ملف تعريف أحادي العقدة والتطبيقات الموزعة، وتلقي رؤى مدعومة بالذكاء الاصطناعي وتوصيات قابلة للتنفيذ لتحسين kernel وتحسينات الأداء.

Abstract illustration featuring various geometric shapes, such as triangles, circles, rectangles, and grids, in gradient pastel yellow and purple tones on a lavender background. Arrows and dotted lines add motion and connectivity, suitable for themes of application integration and creative design.

مصممة للمصدر المفتوح

يزدهر ابتكار الذكاء الاصطناعي في المجتمعات المفتوحة حيث يمكن للمطورين الفحص والتعديل والمساهمة. تلتزم Neuron بمجتمع المصادر المفتوحة وتعزيز الابتكار. بينما نقوم بنقل المزيد من أجزاء مجموعتنا إلى المصدر المفتوح، فإن برنامج NKI Compiler و Neuron Kernel Driver ومكتبة Neuron Kernel و NxD Inference و Neuron Explorer و PyTorch و JAX و vLLM متاحة اليوم مفتوحة المصدر بالكامل. تتيح المكتبات والأدوات مفتوحة المصدر للمطورين فحص تطبيقات برنامج التحويل البرمجي والمساهمة في التحسينات وتكييف كود kernel دون أي حواجز. تعالَ وشاركنا في الإنشاء. 

An abstract background featuring flowing, multicolored waves beneath a variety of geometric shapes (such as circles, rectangles, hexagons, and triangles) on a dark backdrop. The image visually suggests data visualization, analytics, or machine learning concepts.

تعرف على نيورون

توفر Neuron التكامل الأصلي مع PyTorch، مما يمكّن الباحثين ومطوري ML من تشغيل الكود الحالي دون تغيير على Trainium. تعمل واجهات برمجة التطبيقات القياسية بما في ذلك FSDP و DDP و dTensor بسلاسة للتدريب الموزع عبر إعدادات متعددة العقد. تعمل مكتبات تعلم الآلة الشهيرة مثل TorchTitan و HuggingFace Optimum Neuron و PyTorch Lightning وغيرها بشكل مباشر مع الحد الأدنى من التعديلات. قم بتدريب النماذج ذات تدفقات العمل والأدوات المألوفة، من التدريب المسبق إلى ما بعد التدريب مع التعلم المعزز، مع الاستفادة من أداء Trainium ومزايا التكلفة لكل من التدريب التجريبي والتدريب على نطاق الإنتاج. 

يتيح Neuron نشر استدلال الإنتاج باستخدام الأطر القياسية وواجهات برمجة التطبيقات على Trainium و Inferentia. يوفر تكامل vLLM مع واجهات برمجة التطبيقات القياسية أداءً عاليًا مع النواة المحسّنة من مكتبة Neuron Kernel. تعمل الميزات المتقدمة بما في ذلك توازي الخبراء والاستدلال المصنف وفك التشفير التأملي على زيادة الرموز في الثانية مع تقليل التكلفة لكل رمز. انشر الذكاء الاصطناعي الفعال وأعباء عمل التعلم المعزز على نطاق واسع مع تحسينات الأداء خارج الصندوق.  

بالنسبة لمهندسي الأداء الذين يبحثون عن أقصى قدر من الكفاءة للأجهزة، توفر Neuron التحكم الكامل من خلال واجهة Neuron Kernel (NKI)، مع الوصول المباشر إلى مجموعة تعليمات NeuroNisa وتخصيص الذاكرة وجدولة التنفيذ. يمكن للمطورين إنشاء عمليات جديدة غير متوفرة في الأطر القياسية وتحسين التعليمات البرمجية الهامة للأداء باستخدام النواة المخصصة. يوفر برنامج NKI Compiler مفتوح المصدر، المبني على MLIR، الشفافية في عمليات التجميع. تقدم مكتبة Neuron Kernel نواة جاهزة للإنتاج ومحسّنة مع كود مصدر كامل ووثائق ومعايير.

يوفر Neuron Explorer مجموعة موحدة من الأدوات التي توجه المطورين خلال رحلة تحسين الأداء وتصحيح الأخطاء. من خلال دمج التنميط وتصحيح الأخطاء وتنفيذ التحسينات والتحقق من التحسينات في بيئة واحدة، يزيل Neuron Explorer الوقت الضائع عبر الأدوات المجزأة. يتتبع التنميط الهرمي مع ربط الكود لـ PyTorch و JAX و NKI التنفيذ من التعليمات البرمجية المصدر إلى عمليات الأجهزة. تعمل التوصيات المدعومة بالذكاء الاصطناعي على تحليل الملفات الشخصية لتحديد الاختناقات وتقديم رؤى قابلة للتنفيذ لاستراتيجيات المشاركة وتحسينات النواة. واجهة المستخدم مفتوحة المصدر على GitHub.

توفر Neuron إمكانات المراقبة والمراقبة الشاملة التي تمكن مطوري ML وفرق MLOPS من الحفاظ على التميز التشغيلي لعمليات نشر الإنتاج. يتيح تكامل Amazon CloudWatch الأصلي المراقبة المركزية عبر البنية التحتية للتعلم الآلي، مع دعم التطبيقات الحاوية على Kubernetes و Amazon EKS. تعمل عمليات تكامل منصة الشركاء مع أدوات مثل Datadog على توسيع إمكانية المراقبة من خلال المراقبة الموحدة والتسجيل والتنبيه. توفر Neuron الأدوات المساعدة بما في ذلك neuron-top للمراقبة في الوقت الفعلي، و Neuron Monitor لجمع المقاييس، و neuron-ls لقائمة الأجهزة، و Neuron Sysfs للحصول على معلومات مفصلة عن النظام.  

تعمل Neuron على تبسيط عملية النشر لمطوري ML وفرق MLops من خلال البيئات المهيأة مسبقًا وأدوات البنية التحتية. تأتي برامج Neuron Deep Learning AMIs (DLAMIs) وحاويات التعلم العميق (DLCs) جاهزة مع مجموعة برامج Neuron والأطر الشائعة والمكتبات الأساسية. بالنسبة لعمليات نشر Kubernetes، يدير المكون الإضافي لجهاز Neuron تخصيص الموارد، ويوفر ملحق Neuron Scheduler وضعًا ذكيًا لأحمال العمل، ويقوم برنامج تشغيل تخصيص الموارد الديناميكية (DRA) بتلخيص تعقيد هيكل الأجهزة مع اختيار الموارد القائم على الحجم البديهي. تعمل مخططات Helm على تبسيط التنسيق لعمليات النشر في الحاويات.

قم بالبناء باستخدام نيورون