انتقل إلى المحتوى الرئيسي

Amazon EC2

مثيلات Amazon EC2 P4

أداء عالٍ لتدريب تعلم الآلة (ML) وتطبيقات الحوسبة عالية الأداء (HPC) في السحابة

ما سبب أهمية مثيلات Amazon EC2 P4؟

توفر مثيلات Amazon Elastic Compute Cloud (Amazon EC2) P4d أداءً عاليًا للتدريب على تعلم الآلة (ML) وتطبيقات الحوسبة عالية الأداء (HPC) في السحابة. يتم تشغيل مثيلات P4d بواسطة أحدث وحدات معالجة الرسومات NVIDIA A100 Tensor Core GPUs وتوفر شبكة رائدة في الصناعة ذات سرعة عالية وزمن انتقال منخفض. تدعم هذه المثيلات شبكات مثيلات بسرعة 400 جيجابت في الثانية. توفر مثيلات P4d تكلفة أقل بنسبة تصل إلى 60% لتدريب نماذج تعلم الآلة (ML)، بما في ذلك متوسط أداء أفضل بمقدار 2.5 مرة لنماذج التعلم العميق مقارنة بمثيلات P3 وP3dn من الجيل السابق.

يتم نشر مثيلات P4d في مجموعات تسمى Amazon EC2 UltraClusters التي تشتمل على الحوسبة عالية الأداء والشبكات والتخزين في السحابة. يعد كل جهاز EC2 UltraCluster واحدًا من أقوى أجهزة الكمبيوتر العملاقة في العالم، مما يساعدك على تشغيل أكثر تدريبات تعلم الآلة (ML) متعددة العقد تعقيدًا وأحمال عمل الحوسبة عالية الأداء (HPC) الموزعة. يمكنك بسهولة التوسع من بضعة إلى آلاف من وحدات معالجة الرسومات NVIDIA A100 GPUs في مجموعات EC2 UltraClusters بناءً على احتياجات مشروع تعلم الآلة (ML) أو الحوسبة عالية الأداء (HPC).

يمكن للباحثين وعلماء البيانات والمطورين استخدام مثيلات P4d لتدريب نماذج تعلم الآلة (ML) لحالات الاستخدام مثل معالجة اللغة الطبيعية واكتشاف الكائنات وتصنيفها ومحركات التوصية. يمكنهم أيضًا استخدامه لتشغيل تطبيقات الحوسبة عالية الأداء (HPC) مثل الاكتشاف الصيدلاني وتحليل الزلازل والنمذجة المالية. على عكس الأنظمة المحلية، يمكنك الوصول إلى سعة حوسبة وتخزين غير محدودة تقريبًا، وتوسيع نطاق البنية التحتية الخاصة بك استنادًا إلى احتياجات العمل، وإنجاز مهمة تدريب تعلم الآلة متعددة الوحدات أو تطبيق الحوسبة عالية الأداء (HPC) الموزع بإحكام في دقائق، دون أي تكاليف إعداد أو صيانة.

الإعلان عن مثيلات Amazon EC2 P4d الجديدة

الفوائد

    مع أحدث جيل من وحدات معالجة الرسومات NVIDIA A100 Tensor Core GPUs، يوفر كل مثيل P4d في المتوسط أداء تعلم عميق (DL) أفضل بمعدل 2.5 مرة مقارنة بمثيلات P3 من الجيل السابق. تساعد EC2 UltraClusters لمثيلات P4d المطورين العاديين وعلماء البيانات والباحثين على إدارة أعباء عمل تعلم الآلة (ML) والحوسبة عالية الأداء (HPC) الأكثر تعقيدًا من خلال إتاحة الوصول إلى أداء من فئة الحوسبة الفائقة دون أي تكاليف مسبقة أو التزامات طويلة الأجل. يعمل وقت التدريب المنخفض مع مثيلات P4d على تعزيز الإنتاجية، مما يساعد المطورين على التركيز على مهمتهم الأساسية المتمثلة في بناء ذكاء تعلم الآلة (ML) في تطبيقات الأعمال.

    يمكن للمطورين التوسع بسلاسة إلى ما يصل إلى آلاف وحدات معالجة الرسومات (GPUs) باستخدام EC2 UltraClusters لمثيلات P4d. تساعد الشبكات عالية السرعة وذات زمن الاستجابة المنخفض مع دعم شبكات المثيلات بسرعة 400 جيجابت في الثانية ومحول Elastic Fabric Adapter‏ (EFA) وتقنية GPUDirect RDMA في تدريب نماذج تعلم الآلة (ML) بسرعة باستخدام تقنيات التوسع/التوزيع. تستخدم EFA مكتبة NVIDIA للاتصالات الجماعية (NCCL) للتوسع إلى آلاف وحدات معالجة الرسومات (GPUs)، وتتيح تقنية GPUDirect RDMA الاتصال من وحدة GPU إلى GPU بزمن انتقال منخفض بين مثيلات P4d.

    توفر مثيلات P4d تكلفة أقل بنسبة تصل إلى 60% لتدريب نماذج تعلم الآلة (ML) مقارنة بمثيلات P3. بالإضافة إلى ذلك، تتوفر مثيلات P4d للشراء كمثيلات Spot. تستفيد مثيلات Spot من سعة مثيل EC2 غير المستخدمة ويمكنها خفض تكاليف EC2 بشكل كبير مع خصم يصل إلى 90% من الأسعار عند الطلب. مع انخفاض تكلفة تدريب تعلم الآلة (ML) مع مثيلات P4d، يمكن إعادة تخصيص الميزانيات لبناء المزيد من ذكاء تعلم الآلة (ML) في تطبيقات الأعمال.

    تعمل AWS Deep Learning AMIs (DLAMIs) وحاويات Amazon Deep Learning Containers على تسهيل نشر بيئات P4d DL في دقائق لأنها تحتوي على المكتبات والأدوات المطلوبة الخاصة بإطار التعلم العميق (DL). يمكنك أيضًا إضافة المكتبات والأدوات إلى هذه الصور بسهولة أكبر. تدعم مثيلات P4d أطر تعلم الآلة (ML) الشائعة، مثل TensorFlow وPyTorch وMXNet. بالإضافة إلى ذلك، يتم دعم مثيلات P4d بواسطة خدمات AWS الرئيسية لتعلم الآلة (ML) والإدارة والتنسيق، مثل Amazon SageMaker وخدمة Amazon Elastic Kubernetes‏ (Amazon EKS) وخدمة Amazon Elastic Container Service‏ (Amazon ECS) وخدمة AWS Batch وAWS ParallelCluster.

الميزات

    توفر وحدات معالجة الرسومات NVIDIA A100 Tensor Core GPUs تسريعًا غير مسبوق على نطاق واسع لتعلم الآلة (ML) والحوسبة عالية الأداء (HPC). الجيل الثالث من Tensor Cores التابع لـ NVIDIA A100 يعمل على تسريع كل عبء عمل دقيق، مما يؤدي إلى تسريع وقت الرؤية ووقت الوصول إلى السوق. توفر كل وحدة معالجة رسومات A100 GPU أكثر من 2.5 ضعف أداء الحوسبة مقارنة بالجيل السابق من وحدة معالجة الرسومات V100 GPU وتأتي مع 40 جيجابايت من HBM2 (في مثيلات P4d) أو 80 جيجابايت من HBM2e (في مثيلات P4de) من ذاكرة GPU عالية الأداء. ذاكرة GPU العالية تستفيد بشكل خاص من أعباء العمل التي تتدرب على مجموعات بيانات كبيرة من البيانات عالية الدقة. تستخدم وحدات معالجة الرسومات NVIDIA A100 GPUs سرعة التوصيل البيني لوحدة معالجة الرسومات NVSwitch GPU بحيث يمكن لكل وحدة معالجة رسومات (GPU) الاتصال مع كل وحدة معالجة رسومات أخرى في نفس الحالة بنفس سرعة ثنائي الاتجاه التي تبلغ 600 جيجابت/ثانية وبزمن انتقال أحادي الخطوة.

    مثيلات P4d توفر شبكات بسرعة 400 جيجابت في الثانية لمساعدة العملاء على توسيع نطاق أعباء العمل الموزعة بشكل أفضل مثل التدريب متعدد الوحدات بشكل أكثر كفاءة من خلال الشبكات عالية السرعة بين مثيلات P4d وبعضها وكذلك بين مثيل P4d وخدمات التخزين مثل Amazon Simple Storage Service‏ (Amazon S3) وFSx for Lustre. EFA هي واجهة شبكة مخصصة صممتها AWS للمساعدة في توسيع نطاق تطبيقات تعلم الآلة (ML) والحوسبة عالية الأداء (HPC) لآلاف وحدات معالجة الرسومات (GPUs). لتقليل زمن الاستجابة بشكل أكبر، يتم دمج EFA مع NVIDIA GPUDirect RDMA لتمكين اتصال من GPU إلى GPU بزمن انتقال منخفض بين الخوادم مع تجاوز نظام التشغيل.

    يمكنك الوصول إلى وحدات تخزين عالية الإنتاجية وزمن انتقال منخفض على نطاق بيتابايت باستخدام FSx for Lustre أو وحدات تخزين غير محدودة تقريبًا وفعالة من حيث التكلفة مع Amazon S3 بسرعات 400 جيجابت في الثانية. بالنسبة لأحمال العمل التي تحتاج إلى وصول سريع إلى مجموعات البيانات الكبيرة، يشتمل كل مثيل P4d أيضًا على وحدة تخزين SSD تستند إلى NVME بسعة 8 تيرابايت مع سرعة قراءة 16 جيجابايت/ثانية.

    صُممت مثيلات P4d على AWS Nitro System هو مجموعة غنية من كتل الإنشاء التي تفرغ عديدًا من الوظائف الافتراضية التقليدية في الأجهزة والبرامج المخصصة لتقديم أداءٍ عالٍ وتوفر بدرجة كبيرة وأمان عالٍ بينما تعمل كذلك على خفض النفقات الافتراضية.

شهادات العملاء

في ما يلي بعض الأمثلة عن كيفية تحقيق العملاء والشركاء لأهداف أعمالهم باستخدام مثيلات Amazon EC2 P4.

Toyota Research Institute (TRI)

 

يعمل معهد تويوتا للأبحاث (TRI)، الذي تأسس في عام 2015، على تطوير القيادة الآلية والروبوتات وغيرها من تقنيات التضخيم البشري لتويوتا. 
 
«في TRI، نعمل على بناء مستقبل يتمتع فيه الجميع بحرية التنقل. لقد ساعدتنا مثيلات P3 من الجيل السابق على تقليل الوقت اللازم لتدريب نماذج ML من أيام إلى ساعات، ونتطلع إلى استخدام مثيلات P4d، حيث ستسمح ذاكرة GPU الإضافية وتنسيقات الطفو الأكثر كفاءة لفريق التعلم الآلي لدينا بالتدريب على نماذج أكثر تعقيدًا بسرعة أكبر. «
Mike Garrison، القائد الفني، هندسة البنية التحتية (Technical Lead, Infrastructure Engineering)، TRI
Missing alt text value

إعلان ثلاثي

 

«في TRI-AD، نعمل على بناء مستقبل يتمتع فيه الجميع بحرية التحرك والاستكشاف مع التركيز على الحد من إصابات المركبات والوفيات باستخدام القيادة التكيفية والمدينة الذكية. من خلال استخدام مثيلات Amazon EC2 P4d، تمكنا من تقليل وقت التدريب للتعرف على الأشياء بنسبة 40٪ مقارنة بمثيلات GPU من الجيل السابق دون أي تعديل على الرموز الحالية. «
 
Junya Inada، مديرة القيادة الآلية (Director of Automated Driving (Recognition))، TRI-AD
Missing alt text value

إعلان ثلاثي

 

«من خلال استخدام مثيلات Amazon EC2 P4d، تمكنا من تقليل تكلفة التدريب على الفور مقارنة بمثيلات GPU من الجيل السابق، مما مكننا من زيادة عدد الفرق التي تعمل على التدريب النموذجي. سمحت لنا تحسينات الشبكات في P4d بالتوسع بكفاءة إلى عشرات المثيلات، مما أعطانا سرعة كبيرة لتحسين النماذج وإعادة تدريبها ونشرها بسرعة في سيارات الاختبار أو بيئات المحاكاة لمزيد من الاختبارات. «
 
Jack Yan، المدير الأول لهندسة البنية التحتية (Senior Director of Infrastructure Engineering)، TRI-AD
Missing alt text value

GE Healthcare

 

GE Healthcare هي شركة عالمية رائدة في مجال التكنولوجيا الطبية والحلول الرقمية المبتكرة. تمكّن GE Healthcare الأطباء من اتخاذ قرارات أسرع وأكثر استنارة من خلال الأجهزة الذكية وتحليلات البيانات والتطبيقات والخدمات، بدعم من منصة Edison للذكاء. 
 
«في GE Healthcare، نوفر للأطباء الأدوات التي تساعدهم على تجميع البيانات وتطبيق الذكاء الاصطناعي والتحليلات على تلك البيانات والكشف عن الأفكار التي تعمل على تحسين نتائج المرضى وزيادة الكفاءة والقضاء على الأخطاء. تنتج أجهزة التصوير الطبي لدينا كميات هائلة من البيانات التي تحتاج إلى معالجتها من قبل علماء البيانات لدينا. مع مجموعات GPU السابقة، سيستغرق الأمر أيامًا لتدريب نماذج الذكاء الاصطناعي المعقدة (AI)، مثل شبكات GAN التقدمية، لعمليات المحاكاة وعرض النتائج. أدى استخدام مثيلات P4d الجديدة إلى تقليل وقت المعالجة من أيام إلى ساعات. لقد رأينا سرعة أكبر بمرتين إلى ثلاث مرات في نماذج التدريب ذات أحجام الصور المختلفة، مع تحقيق أداء أفضل مع زيادة حجم الدفعة وإنتاجية أعلى مع دورة تطوير نموذج أسرع. «
 
Karley Yoder، نائب الرئيس والمدير العام للذكاء الاصطناعي (VP & GM, Artificial Intelligence)، GM Healthcare
Missing alt text value

HEAVY.AI

 

HEAVY.AI هي شركة رائدة في التحليلات المتسارعة. تُستخدم منصة HEAVY.AI في الأعمال التجارية والحكومة للعثور على رؤى في البيانات تتجاوز حدود أداة التحليلات السائدة.
 
«في HEAVY.AI، نعمل على بناء مستقبل تتقارب فيه علوم البيانات والتحليلات لتفكيك صوامع البيانات ودمجها. يستفيد العملاء من كميات هائلة من البيانات التي قد تشمل الموقع والوقت لبناء صورة كاملة ليس فقط لما يحدث، ولكن متى وأين من خلال التصور الدقيق للبيانات الزمنية المكانية. تتيح تقنيتنا رؤية كل من الغابة والأشجار. من خلال استخدام مثيلات Amazon EC2 P4d، تمكنا من تقليل تكلفة نشر منصتنا بشكل كبير مقارنة بمثيلات GPU من الجيل السابق، مما مكننا من توسيع نطاق مجموعات البيانات الضخمة بشكل فعال من حيث التكلفة. أدت تحسينات الشبكات على A100 إلى زيادة كفاءتنا في كيفية التوسع إلى مليارات صفوف البيانات وتمكين عملائنا من الحصول على رؤى بشكل أسرع. «
 
Ray Falcione، نائب رئيس القطاع العام الأمريكي (VP of US Public Sector)، HEAVY.AI
Missing alt text value

زينوتيك المحدودة

 

تعيد Zenotech Ltd. تعريف الهندسة عبر الإنترنت من خلال استخدام سحابات HPC Clouds التي تقدم نماذج الترخيص عند الطلب ومزايا الأداء الفائق من خلال الاستفادة من وحدات معالجة الرسومات (GPUs). 
 
«في Zenotech، نقوم بتطوير الأدوات لتمكين المصممين من إنشاء منتجات أكثر كفاءة وصديقة للبيئة. نحن نعمل عبر الصناعات، وتوفر أدواتنا رؤية أفضل لأداء المنتج من خلال استخدام المحاكاة واسعة النطاق. يتيح لنا استخدام مثيلات AWS P4d تشغيل عمليات المحاكاة الخاصة بنا بمعدل 3.5 مرة بشكل أسرع مقارنة بالجيل السابق من وحدات معالجة الرسومات (GPUs). هذا التسريع يقلل من وقتنا لحل المشكلة بشكل كبير، مما يسمح لعملائنا بالحصول على تصميمات في السوق بشكل أسرع أو إجراء عمليات محاكاة بدقة أعلى مما كان ممكنًا في السابق. «
 
Jamil Appa، المدير والمؤسس المشارك (Director and Cofounder) لشركة Zenotech
Missing alt text value

آون

 

Aon هي شركة خدمات مهنية عالمية رائدة تقدم مجموعة واسعة من حلول المخاطر والتقاعد والصحة. Aon PathWise هو حل لإدارة مخاطر الحوسبة عالية الأداء (HPC) وهو قائم على وحدة معالجة الرسومات (GPU) وقابل للتطوير يمكن لشركات التأمين وشركات إعادة التأمين والبنوك وصناديق التقاعد استخدامه لمواجهة التحديات الرئيسية اليوم مثل اختبار استراتيجية التحوط والتنبؤ التنظيمي والاقتصادي والميزانية. 
 
«في PathWise Solutions Group LLC، يسمح منتجنا لشركات التأمين وشركات إعادة التأمين وصناديق التقاعد بالوصول إلى تكنولوجيا الجيل التالي لحل تحديات التأمين الرئيسية اليوم بسرعة، مثل التعلم الآلي، واختبار استراتيجية التحوط، وإعداد التقارير التنظيمية والمالية، وتخطيط الأعمال والتنبؤ الاقتصادي، وتطوير المنتجات الجديدة والتسعير. من خلال استخدام مثيلات Amazon EC2 P4d، يمكننا تقديم تحسينات مذهلة في السرعة للحسابات أحادية الدقة ومزدوجة الدقة مقارنة بمثيلات GPU من الجيل السابق لإجراء العمليات الحسابية الأكثر تطلبًا، مما يسمح للعملاء بإجراء مجموعة جديدة من العمليات الحسابية والتنبؤ لأول مرة. السرعة مهمة، ونحن نواصل تقديم قيمة ذات مغزى وأحدث التقنيات لعملائنا بفضل المثيلات الجديدة من AWS. «
 
Van Beach، الرئيس العالمي لحلول الحياة (Global Head of Life Solutions) في مجموعة Aon Pathwise Strategy and Technology Group
Missing alt text value

اقرأ الذكاء الاصطناعي

 

تقوم شركة Rad AI، التي تضم خبراء الأشعة والذكاء الاصطناعي، ببناء منتجات تزيد من إنتاجية أخصائي الأشعة، مما يجعل الرعاية الصحية في نهاية المطاف متاحة على نطاق أوسع ويحسن نتائج المرضى.  اقرأ دراسة الحالة لمعرفة المزيد
 
«في Rad AI، تتمثل مهمتنا في زيادة الوصول إلى الرعاية الصحية وجودتها للجميع. مع التركيز على سير عمل التصوير الطبي، يوفر Rad AI وقت أخصائيي الأشعة ويقلل من الإرهاق ويعزز الدقة. نحن نستخدم الذكاء الاصطناعي لأتمتة سير عمل الأشعة والمساعدة في تبسيط تقارير الأشعة. مع مثيلات EC2 P4d الجديدة، رأينا استدلالًا أسرع وقدرة على تدريب النماذج بسرعة 2.4 مرة، مع دقة أعلى من مثيلات P3 من الجيل السابق. يتيح ذلك تشخيصًا أسرع وأكثر دقة ووصول أكبر إلى خدمات الأشعة عالية الجودة التي يقدمها عملاؤنا في جميع أنحاء الولايات المتحدة. «
 
Doktor Gurson، المؤسس المشارك (Cofounder) لشركة Rad AI
Missing alt text value

تفاصيل المنتج

حجم المثيل
وحدات المعالجة المركزية الافتراضية (vCPU)
الذاكرة الفورية (جيبيبايت)
وحدة معالجة الرسومات — A100
ذاكرة GPU
النطاق الترددي للشبكة (جيجابت في الثانية)
GPUDirect RDMA
وحدة معالجة الرسوم من نظير إلى نظير
سعة تخزين المثيل (جيجابايت)
عرض نطاق EBS (جيجابت في الثانية)
p4d.24xlarge
96
1152
8
320 جيجابايت
HBM2
400 ENA وEFA
نعم
600 جيجابايت في الثانية NVSwitch
8 × 1000 NVMe SSD
19
p4de.24xlarge
96
1152
8
640 جيجابايت
HBM2e
400 ENA وEFA
نعم
600 جيجابايت في الثانية NVSwitch
8 × 1000 NVMe SSD
19

ابدأ استخدام مثيلات P4d لتعلم الآلة (ML)

    Amazon SageMaker هي خدمة مُدارة بالكامل لبناء نماذج ML وتدريبها ونشرها. عند استخدامها مع مثيلات P4d، يستطيع العملاء التكيف بسهولة مع العشرات أو المئات أو الآلاف من وحدات معالجة الرسوم لتدريب نموذج بسرعة على أي نطاق دون القلق من إعداد قطاعات ومسارات للبيانات.

    توفر DLAMI لممارسي ML والباحثين البنية التحتية والأدوات لتسريع DL في السحابة، على أي نطاق. حاويات التعلم العميق هي صور Docker مثبتة مسبقًا مع أطر DL لتسهيل نشر بيئات ML المخصصة بسرعة من خلال السماح لك بتخطي العملية المعقدة لبناء بيئاتك وتحسينها من البداية.

بدء استخدام مثيلات P4d للحوسبة عالية الأداء (HPC)

تعد مثيلات P4d مثالية لتشغيل عمليات المحاكاة الهندسية، والتمويل الحسابي، وتحليل الزلازل، والنمذجة الجزيئية، وعلم الجينوم، والعرض، وأعباء عمل الحوسبة عالية الأداء (HPC) الأخرى القائمة على وحدة معالجة الرسومات (GPU). في أغلب الأحيان تتطلب تطبيقات الحوسبة عالية الأداء أداءً شبكيًا عاليًا وتخزينًا سريعًا وكميات كبيرة من الذاكرة وإمكانات حوسبة عالية أو تتطلبها كلها معًا. تدعم مثيلات P4d شبكة EFA التي تمكّن تطبيقات الحوسبة عالية الأداء (HPC) باستخدام واجهة تمرير الرسائل (MPI) للتوسع إلى الآلاف من وحدات معالجة الرسومات (GPUs). تساعد AWS Batch وAWS ParallelCluster مطوري الحوسبة عالية الأداء على إنشاء تطبيقات الحوسبة عالية الأداء الموزعة وتوسيع نطاقها بسرعة.

تعرّف على المزيد