ما سبب أهمية مثيلات Amazon EC2 P5؟
مثيلات P5 المستندة إلى Amazon Elastic Compute Cloud (Amazon EC2)، والمدعومة بوحدات NVIDIA H100 Tensor Core GPUs، ومثيلات P5e وP5en المدعومة من وحدات NVIDIA P5en Tensor Core GPUs توفر أعلى أداء في Amazon H200 لتطبيقات التعليم العميق (DL) وتطبيقات الحوسبة عالية الأداء (HPC). فهي تساعدك على تسريع وقت الوصول إلى الحل بنسبة تصل إلى 4 أضعاف مقارنة بمثيلات EC2 من الجيل السابق المستندة إلى وحدة معالجة الرسومات (GPU)، وتقليل تكلفة تدريب نماذج تعلّم الآلة (ML) بنسبة تصل إلى 40%. تساعدك هذه المثيلات على تكرار الحلول بوتيرة أسرع والوصول إلى السوق بسرعة أكبر. يمكنك استخدام مثيلات P5 وP5e وP5en للتدريب ونشر نماذج اللغة الكبيرة (LLMs) المعقدة بشكل متزايد ونماذج الانتشار التي تساعد على تشغيل تطبيقات الذكاء الاصطناعي (AI) المولّد الأكثر تطلبًا. وتشمل هذه التطبيقات الإجابة عن الأسئلة، وتوليد التعليمات البرمجية، وتوليد الفيديو والصور، والتعرف على الكلام. يمكنك أيضًا استخدام مثيلات P5 وP5e لنشر تطبيقات الحوسبة عالية الأداء (HPC) المطلوبة على نطاق واسع لاكتشاف المستحضرات الدوائية والتحليل الزلزالي والتنبؤ بالطقس والنمذجة المالية.
ولتحقيق هذه التحسينات في الأداء والتوفير في التكاليف، تُكمّل مثيلات P5 وP5e وحدات معالجة الرسومات من نوع NVIDIA P5e Tensor Core بأداء وحدة NVIDIA H100 and H200 Tensor Core GPUs الأعلى بمقدار الضعف مقارنة بوحدات المعالجة المركزية (CPU)، وذاكرة النظام الأعلى بمقدار الضعف، ومساحة التخزين المحلية الأعلى بمقدار أربعة أضعاف مقارنة بالمثيلات المستندة إلى وحدة معالجة الرسومات من الجيل السابق. تقوم مثيلات P5en بإقران وحدات معالجة الرسومات NVIDIA H200 Tensor Core GPUs مع وحدة المعالجة المركزية Intel Sapphire Rapids CPU عالية الأداء، مما يتيح Gen5 PCIe بين وحدة المعالجة المركزية (CPU) ووحدة معالجة الرسومات (GPU). توفر مثيلات P5en ما يصل إلى 4 أضعاف عرض النطاق الترددي بين وحدة المعالجة المركزية (CPU) ووحدة معالجة الرسومات (GPU) وزمن انتقال أقل للشبكة مقارنة بمثيلات P5e وP5 وبالتالي تحسين أداء التدريب الموزع. يوفر دعم مثيلات P5 وP5e ما يصل إلى 3200 جيجابت في الثانية من الشبكات باستخدام الجيل الثاني من Elastic Fabric Adapter (EFA). يُظهر P5en، مع الجيل الثالث من EFA باستخدام Nitro v5، تحسنًا يصل إلى 35% في وقت الاستجابة مقارنة بـ P5 الذي يستخدم الجيل السابق من EFA وNitro. يساعد ذلك على تحسين أداء الاتصالات الجماعية لأعباء العمل التدريبية الموزعة مثل التعليم العميق والذكاء الاصطناعي المولّد ومعالجة البيانات في الوقت الفعلي وتطبيقات الحوسبة عالية الأداء (HPC). لتوفير حوسبة واسعة النطاق في زمن انتقال منخفض، يتم نشر هذه المثيلات في Amazon EC2 UltraClusters التي تتيح توسيع نطاق ما يصل إلى 20000 وحدة معالجة رسومات H100 أو H200 متصلة بشبكة غير قابلة للحظر بحجم بيتابت. يمكن لمثيلات P5 وP5e وP5en في مجموعات P5en UltraClusters تقديم ما يصل إلى 20 إكسافلوب من قدرة الحوسبة الإجمالية - وهو أداء يعادل أداء الكمبيوتر العملاق.
مثيلات Amazon EC2 P5
الفوائد
المزايا
شهادات العملاء
في ما يلي بعض الأمثلة عن كيفية تحقيق العملاء والشركاء لأهداف أعمالهم باستخدام مثيلات Amazon EC2 P4.
-
Anthropic
تبني شركة Anthropic أنظمة ذكاء اصطناعي موثوقة وقابلة للتفسير والتوجيه وسيتاح لها عديد من الفرص لخلق قيمة تجارية ومنفعة عامة.
في Anthropic، نعمل على بناء أنظمة ذكاء اصطناعي موثوقة وقابلة للتفسير والتوجيه. على الرغم من تميز أنظمة الذكاء الاصطناعي العامة الكبيرة اليوم بفوائد كبيرة، فإنها يمكن أيضًا أن تكون غير متوقعة وغير موثوقة ومبهمة. هدفنا هو إحراز تقدم في هذه المشكلات ونشر الأنظمة التي يجدها الناس مفيدة. منظمتنا هي واحدة من المنظمات القليلة في العالم التي تبني نماذج تأسيسية في أبحاث التعليم العميق. هذه النماذج معقدة للغاية، ولتطوير هذه النماذج المتطورة والتدريب عليها، نحتاج إلى توزيعها بكفاءة عبر مجموعات كبيرة من وحدات معالجة الرسومات. نحن نستخدم مثيلات Amazon EC2 P4 على نطاق واسع اليوم، كما أننا متحمسون لإطلاق مثيلات P5. حيث نتوقع أنها ستقدم فوائد كبيرة فيما يخص السعر والأداء مقارنة بمثيلات P4d، وأنها ستكون متاحة على النطاق الضخم المطلوب لبناء الجيل التالي من نماذج اللغات الكبيرة والمنتجات ذات الصلة.
Tom Brown، المؤسس الشريك (Cofounder) لشركة Anthropic -
Cohere
تمكِّن Cohere، الشركة الرائدة في مجال الذكاء الاصطناعي اللغوي، كل مطور وشركة من بناء منتجات رائعة باستخدام تقنية معالجة اللغة الطبيعية (NLP) الرائدة عالميًا مع الحفاظ على خصوصية البيانات وأمانها
تتولى Cohere المسؤولية في مساعدة كل شركة على تسخير قوة الذكاء الاصطناعي اللغوي لاستكشاف المعلومات وتوليدها والبحث عنها والتعامل معها بطريقة طبيعية وبسيطة، ونشرها عبر منصات سحابية متعددة في بيئة البيانات التي تناسب كل عميل بشكل أفضل. ستطلق مثيلات Amazon EC2 P5 التي تعمل بوحدة NVIDIA H100 العنان لقدرة الشركات على الإنشاء والنمو والتوسع بشكل أسرع من خلال قوتها الحاسوبية إلى جانب إمكانات LLM الحديثة وقدرات الذكاء الاصطناعي المولّد من Cohere.
Aidan Gomez، المدير التنفيذي (CEO) لشركة Cohere -
Hugging Face
تتولى شركة Hugging Face مهمة إضفاء الطابع الديمقراطي على التعلّم الآلي الجيد.
بصفتنا مجتمع المصادر المفتوحة الأسرع نموًا للتعلّم الآلي، نقدم الآن أكثر من 150,000 نموذج مُدرَّب سابقًا و25000 مجموعة بيانات على منصتنا لمعالجة اللغة الطبيعية والرؤية الحاسوبية وعلم الأحياء والتعليم بواسطة التعزيز والمزيد. ومع التقدم الكبير في نماذج اللغة الكبيرة والذكاء الاصطناعي المولّد، فإننا نعمل مع AWS لبناء نماذج مستقبلية مفتوحة المصدر والإسهام بها. نحن نتطلع إلى استخدام مثيلات Amazon EC2 P5 عبر Amazon SageMaker على نطاق واسع في UltraClusters مع EFA لتسريع عملية توفير نماذج الذكاء الاصطناعي الأساسية الجديدة للجميع.
Julien Chaumond، مدير التكنولوجيا التنفيذي والمؤسس الشريك (CTO and Cofounder) في شركة Hugging Face
تفاصيل المنتج
حجم المثيل | وحدات المعالجة المركزية الافتراضية (vCPU) | ذاكرة المثيل (تيرابايت) | وحدة معالجة الرسوميات (GPU) | ذاكرة وحدة معالجة الرسومات (GPU) | النطاق الترددي للشبكة (جيجابت في الثانية) | GPUDirect RDMA | وحدة معالجة الرسوم (GPU) من نظير إلى نظير | سعة تخزين المثيل (تيرابايت) | عرض نطاق EBS (جيجابت في الثانية) |
---|---|---|---|---|---|---|---|---|---|
p5.48xlarge | 192 | 2 | 8 H100 | 640 جيجابايت HBM3 |
EFA بسرعة 3200 جيجابت في الثانية | نعم | NVSwitch بسرعة 900 جيجابايت في الثانية | 8 x 3.84 NVMe SSD | 80 |
p5e.48xlarge | 192 | 2 | 8 H200 | 1128 جيجابايت HBM3e |
EFA بسرعة 3200 جيجابت في الثانية | نعم | NVSwitch بسرعة 900 جيجابايت في الثانية | 8 x 3.84 NVMe SSD | 80 |
p5en.48xlarge | 192 | 2 | 8 H200 | 1128 GB HBM3e | EFA بسرعة 3200 جيجابت في الثانية | نعم | NVSwitch بسرعة 900 جيجابايت في الثانية | 8 x 3.84 NVMe SSD | 100 |
بدء حالات استخدام تعلم الآلة (ML)
بدء حالات استخدام الحوسبة عالية الأداء (HPC)
مثيلات P5 وP5e وP5en هي منصة مثالية لتشغيل عمليات المحاكاة الهندسية والمالية الحوسبية والتحليل الزلزالي ووضع النماذج الجزيئية والعلوم الوراثية والعرض وغيرها من أعباء عمل الحوسبة عالية الأداء المستندة إلى وحدات معالجة الرسومات. في أغلب الأحيان تتطلب تطبيقات الحوسبة عالية الأداء أداءً شبكيًا عاليًا وتخزينًا سريعًا وكميات كبيرة من الذاكرة وإمكانات حوسبة عالية أو تتطلبها كلها معًا. الأنواع الثلاثة تدعم شبكة EFA التي تمكّن تطبيقات الحوسبة عالية الأداء (HPC) باستخدام واجهة تمرير الرسائل (MPI) للتوسع إلى الآلاف من وحدات معالجة الرسومات (GPUs). تساعد AWS Batch وAWS ParallelCluster مطوري الحوسبة عالية الأداء على إنشاء تطبيقات الحوسبة عالية الأداء الموزعة وتوسيع نطاقها بسرعة.
تعرّف على المزيد