- Amazon EC2›
- أنواع المثيلات›
- مثيلات P4
مثيلات Amazon EC2 P4
أداء عالٍ لتدريب تعلم الآلة (ML) وتطبيقات الحوسبة عالية الأداء (HPC) في السحابة
ما سبب أهمية مثيلات Amazon EC2 P4؟
توفر مثيلات Amazon Elastic Compute Cloud (Amazon EC2) P4d أداءً عاليًا للتدريب على تعلم الآلة (ML) وتطبيقات الحوسبة عالية الأداء (HPC) في السحابة. يتم تشغيل مثيلات P4d بواسطة أحدث وحدات معالجة الرسومات NVIDIA A100 Tensor Core GPUs وتوفر شبكة رائدة في الصناعة ذات سرعة عالية وزمن انتقال منخفض. تدعم هذه المثيلات شبكات مثيلات بسرعة 400 جيجابت في الثانية. توفر مثيلات P4d تكلفة أقل بنسبة تصل إلى 60% لتدريب نماذج تعلم الآلة (ML)، بما في ذلك متوسط أداء أفضل بمقدار 2.5 مرة لنماذج التعلم العميق مقارنة بمثيلات P3 وP3dn من الجيل السابق.
يتم نشر مثيلات P4d في مجموعات تسمى Amazon EC2 UltraClusters التي تشتمل على الحوسبة عالية الأداء والشبكات والتخزين في السحابة. يعد كل جهاز EC2 UltraCluster واحدًا من أقوى أجهزة الكمبيوتر العملاقة في العالم، مما يساعدك على تشغيل أكثر تدريبات تعلم الآلة (ML) متعددة العقد تعقيدًا وأحمال عمل الحوسبة عالية الأداء (HPC) الموزعة. يمكنك بسهولة التوسع من بضعة إلى آلاف من وحدات معالجة الرسومات NVIDIA A100 GPUs في مجموعات EC2 UltraClusters بناءً على احتياجات مشروع تعلم الآلة (ML) أو الحوسبة عالية الأداء (HPC).
يمكن للباحثين وعلماء البيانات والمطورين استخدام مثيلات P4d لتدريب نماذج تعلم الآلة (ML) لحالات الاستخدام مثل معالجة اللغة الطبيعية واكتشاف الكائنات وتصنيفها ومحركات التوصية. يمكنهم أيضًا استخدامه لتشغيل تطبيقات الحوسبة عالية الأداء (HPC) مثل الاكتشاف الصيدلاني وتحليل الزلازل والنمذجة المالية. على عكس الأنظمة المحلية، يمكنك الوصول إلى سعة حوسبة وتخزين غير محدودة تقريبًا، وتوسيع نطاق البنية التحتية الخاصة بك استنادًا إلى احتياجات العمل، وإنجاز مهمة تدريب تعلم الآلة متعددة الوحدات أو تطبيق الحوسبة عالية الأداء (HPC) الموزع بإحكام في دقائق، دون أي تكاليف إعداد أو صيانة.
الإعلان عن مثيلات Amazon EC2 P4d الجديدة
الفوائد
مع أحدث جيل من وحدات معالجة الرسومات NVIDIA A100 Tensor Core GPUs، يوفر كل مثيل P4d في المتوسط أداء تعلم عميق (DL) أفضل بمعدل 2.5 مرة مقارنة بمثيلات P3 من الجيل السابق. تساعد EC2 UltraClusters لمثيلات P4d المطورين العاديين وعلماء البيانات والباحثين على إدارة أعباء عمل تعلم الآلة (ML) والحوسبة عالية الأداء (HPC) الأكثر تعقيدًا من خلال إتاحة الوصول إلى أداء من فئة الحوسبة الفائقة دون أي تكاليف مسبقة أو التزامات طويلة الأجل. يعمل وقت التدريب المنخفض مع مثيلات P4d على تعزيز الإنتاجية، مما يساعد المطورين على التركيز على مهمتهم الأساسية المتمثلة في بناء ذكاء تعلم الآلة (ML) في تطبيقات الأعمال.
يمكن للمطورين التوسع بسلاسة إلى ما يصل إلى آلاف وحدات معالجة الرسومات (GPUs) باستخدام EC2 UltraClusters لمثيلات P4d. تساعد الشبكات عالية السرعة وذات زمن الاستجابة المنخفض مع دعم شبكات المثيلات بسرعة 400 جيجابت في الثانية ومحول Elastic Fabric Adapter (EFA) وتقنية GPUDirect RDMA في تدريب نماذج تعلم الآلة (ML) بسرعة باستخدام تقنيات التوسع/التوزيع. تستخدم EFA مكتبة NVIDIA للاتصالات الجماعية (NCCL) للتوسع إلى آلاف وحدات معالجة الرسومات (GPUs)، وتتيح تقنية GPUDirect RDMA الاتصال من وحدة GPU إلى GPU بزمن انتقال منخفض بين مثيلات P4d.
توفر مثيلات P4d تكلفة أقل بنسبة تصل إلى 60% لتدريب نماذج تعلم الآلة (ML) مقارنة بمثيلات P3. بالإضافة إلى ذلك، تتوفر مثيلات P4d للشراء كمثيلات Spot. تستفيد مثيلات Spot من سعة مثيل EC2 غير المستخدمة ويمكنها خفض تكاليف EC2 بشكل كبير مع خصم يصل إلى 90% من الأسعار عند الطلب. مع انخفاض تكلفة تدريب تعلم الآلة (ML) مع مثيلات P4d، يمكن إعادة تخصيص الميزانيات لبناء المزيد من ذكاء تعلم الآلة (ML) في تطبيقات الأعمال.
تعمل AWS Deep Learning AMIs (DLAMIs) وحاويات Amazon Deep Learning Containers على تسهيل نشر بيئات P4d DL في دقائق لأنها تحتوي على المكتبات والأدوات المطلوبة الخاصة بإطار التعلم العميق (DL). يمكنك أيضًا إضافة المكتبات والأدوات إلى هذه الصور بسهولة أكبر. تدعم مثيلات P4d أطر تعلم الآلة (ML) الشائعة، مثل TensorFlow وPyTorch وMXNet. بالإضافة إلى ذلك، يتم دعم مثيلات P4d بواسطة خدمات AWS الرئيسية لتعلم الآلة (ML) والإدارة والتنسيق، مثل Amazon SageMaker وخدمة Amazon Elastic Kubernetes (Amazon EKS) وخدمة Amazon Elastic Container Service (Amazon ECS) وخدمة AWS Batch وAWS ParallelCluster.
الميزات
توفر وحدات معالجة الرسومات NVIDIA A100 Tensor Core GPUs تسريعًا غير مسبوق على نطاق واسع لتعلم الآلة (ML) والحوسبة عالية الأداء (HPC). الجيل الثالث من Tensor Cores التابع لـ NVIDIA A100 يعمل على تسريع كل عبء عمل دقيق، مما يؤدي إلى تسريع وقت الرؤية ووقت الوصول إلى السوق. توفر كل وحدة معالجة رسومات A100 GPU أكثر من 2.5 ضعف أداء الحوسبة مقارنة بالجيل السابق من وحدة معالجة الرسومات V100 GPU وتأتي مع 40 جيجابايت من HBM2 (في مثيلات P4d) أو 80 جيجابايت من HBM2e (في مثيلات P4de) من ذاكرة GPU عالية الأداء. ذاكرة GPU العالية تستفيد بشكل خاص من أعباء العمل التي تتدرب على مجموعات بيانات كبيرة من البيانات عالية الدقة. تستخدم وحدات معالجة الرسومات NVIDIA A100 GPUs سرعة التوصيل البيني لوحدة معالجة الرسومات NVSwitch GPU بحيث يمكن لكل وحدة معالجة رسومات (GPU) الاتصال مع كل وحدة معالجة رسومات أخرى في نفس الحالة بنفس سرعة ثنائي الاتجاه التي تبلغ 600 جيجابت/ثانية وبزمن انتقال أحادي الخطوة.
مثيلات P4d توفر شبكات بسرعة 400 جيجابت في الثانية لمساعدة العملاء على توسيع نطاق أعباء العمل الموزعة بشكل أفضل مثل التدريب متعدد الوحدات بشكل أكثر كفاءة من خلال الشبكات عالية السرعة بين مثيلات P4d وبعضها وكذلك بين مثيل P4d وخدمات التخزين مثل Amazon Simple Storage Service (Amazon S3) وFSx for Lustre. EFA هي واجهة شبكة مخصصة صممتها AWS للمساعدة في توسيع نطاق تطبيقات تعلم الآلة (ML) والحوسبة عالية الأداء (HPC) لآلاف وحدات معالجة الرسومات (GPUs). لتقليل زمن الاستجابة بشكل أكبر، يتم دمج EFA مع NVIDIA GPUDirect RDMA لتمكين اتصال من GPU إلى GPU بزمن انتقال منخفض بين الخوادم مع تجاوز نظام التشغيل.
يمكنك الوصول إلى وحدات تخزين عالية الإنتاجية وزمن انتقال منخفض على نطاق بيتابايت باستخدام FSx for Lustre أو وحدات تخزين غير محدودة تقريبًا وفعالة من حيث التكلفة مع Amazon S3 بسرعات 400 جيجابت في الثانية. بالنسبة لأحمال العمل التي تحتاج إلى وصول سريع إلى مجموعات البيانات الكبيرة، يشتمل كل مثيل P4d أيضًا على وحدة تخزين SSD تستند إلى NVME بسعة 8 تيرابايت مع سرعة قراءة 16 جيجابايت/ثانية.
صُممت مثيلات P4d على AWS Nitro System هو مجموعة غنية من كتل الإنشاء التي تفرغ عديدًا من الوظائف الافتراضية التقليدية في الأجهزة والبرامج المخصصة لتقديم أداءٍ عالٍ وتوفر بدرجة كبيرة وأمان عالٍ بينما تعمل كذلك على خفض النفقات الافتراضية.
شهادات العملاء
في ما يلي بعض الأمثلة عن كيفية تحقيق العملاء والشركاء لأهداف أعمالهم باستخدام مثيلات Amazon EC2 P4.
Toyota Research Institute (TRI)
إعلان ثلاثي
إعلان ثلاثي
GE Healthcare
HEAVY.AI
زينوتيك المحدودة
آون
اقرأ الذكاء الاصطناعي
تفاصيل المنتج
|
حجم المثيل
|
وحدات المعالجة المركزية الافتراضية (vCPU)
|
الذاكرة الفورية (جيبيبايت)
|
وحدة معالجة الرسومات — A100
|
ذاكرة GPU
|
النطاق الترددي للشبكة (جيجابت في الثانية)
|
GPUDirect RDMA
|
وحدة معالجة الرسوم من نظير إلى نظير
|
سعة تخزين المثيل (جيجابايت)
|
عرض نطاق EBS (جيجابت في الثانية)
|
|---|---|---|---|---|---|---|---|---|---|
|
p4d.24xlarge
|
96
|
1152
|
8
|
320 جيجابايت
HBM2 |
400 ENA وEFA
|
نعم
|
600 جيجابايت في الثانية NVSwitch
|
8 × 1000 NVMe SSD
|
19
|
|
p4de.24xlarge
|
96
|
1152
|
8
|
640 جيجابايت
HBM2e |
400 ENA وEFA
|
نعم
|
600 جيجابايت في الثانية NVSwitch
|
8 × 1000 NVMe SSD
|
19
|
ابدأ استخدام مثيلات P4d لتعلم الآلة (ML)
Amazon SageMaker هي خدمة مُدارة بالكامل لبناء نماذج ML وتدريبها ونشرها. عند استخدامها مع مثيلات P4d، يستطيع العملاء التكيف بسهولة مع العشرات أو المئات أو الآلاف من وحدات معالجة الرسوم لتدريب نموذج بسرعة على أي نطاق دون القلق من إعداد قطاعات ومسارات للبيانات.
توفر DLAMI لممارسي ML والباحثين البنية التحتية والأدوات لتسريع DL في السحابة، على أي نطاق. حاويات التعلم العميق هي صور Docker مثبتة مسبقًا مع أطر DL لتسهيل نشر بيئات ML المخصصة بسرعة من خلال السماح لك بتخطي العملية المعقدة لبناء بيئاتك وتحسينها من البداية.
بدء استخدام مثيلات P4d للحوسبة عالية الأداء (HPC)
تعد مثيلات P4d مثالية لتشغيل عمليات المحاكاة الهندسية، والتمويل الحسابي، وتحليل الزلازل، والنمذجة الجزيئية، وعلم الجينوم، والعرض، وأعباء عمل الحوسبة عالية الأداء (HPC) الأخرى القائمة على وحدة معالجة الرسومات (GPU). في أغلب الأحيان تتطلب تطبيقات الحوسبة عالية الأداء أداءً شبكيًا عاليًا وتخزينًا سريعًا وكميات كبيرة من الذاكرة وإمكانات حوسبة عالية أو تتطلبها كلها معًا. تدعم مثيلات P4d شبكة EFA التي تمكّن تطبيقات الحوسبة عالية الأداء (HPC) باستخدام واجهة تمرير الرسائل (MPI) للتوسع إلى الآلاف من وحدات معالجة الرسومات (GPUs). تساعد AWS Batch وAWS ParallelCluster مطوري الحوسبة عالية الأداء على إنشاء تطبيقات الحوسبة عالية الأداء الموزعة وتوسيع نطاقها بسرعة.