ทำไมต้องใช้อินสแตนซ์ Amazon EC2 P3
อินสแตนซ์ Amazon EC2 P3 ให้บริการการประมวลผลแบบขนานในระบบคลาวด์ด้วย NVIDIA® V100 Tensor Core GPU ถึง 8 ตัวและอัตราความเร็วในการรับส่งข้อมูลผ่านเครือข่ายสำหรับแมชชีนเลิร์นนิ่งและแอปพลิเคชัน HPC สูงถึง 100 Gbps อินสแตนซ์เหล่านี้จะมอบประสิทธิภาพที่มีความแม่นยำแบบผสมสูงสุด 1 เพตะฟล็อบต่ออินสแตนซ์เพื่อเร่งความเร็วให้กับแมชชีนเลิร์นนิ่งและแอปพลิเคชันการประมวลผลประสิทธิภาพสูงให้เร็วยิ่งขึ้น อินสแตนซ์ Amazon EC2 P3 ถูกพิสูจน์มาแล้วว่าช่วยลดเวลาในการฝึกฝนของแมชชีนเลิร์นนิ่งจากหลายวันเหลือเพียงไม่กี่นาที รวมทั้งเพิ่มจำนวนการจำลองสำหรับการประมวลผลประสิทธิภาพสูงที่เสร็จสมบูรณ์ได้มากถึง 3-4 เท่า
ด้วยแบนด์วิดท์เครือข่ายที่มากกว่าถึง 4 เท่าของอินสแตนซ์ P3.16xlarge อินสแตนซ์ Amazon EC2 P3dn.24xlarge ถือเป็นสมาชิกใหม่ในครอบครัว P3 ที่เหมาะสำหรับแมชชีนเลิร์นนิงและแอปพลิเคชัน HPC แบบกระจาย อินสแตนซ์แหล่านี้มีอัตราความเร็วในการรับส่งข้อมูลผ่านเครือข่ายสูงถึง 100 Gbps มาพร้อมกับ Intel® Xeon® Scalable (Skylake) vCPU แบบกำหนดเอง 96 ตัว, NVIDIA® V100 Tensor Core GPU ถึง 8 ตัว ที่มีหน่วยความจำ 32 GiB ต่อตัว และพื้นที่จัดเก็บข้อมูล SSD บน NVMe ขนาด 1.8 TB อินสแตนซ์ P3dn.24xlarge ยังรองรับ Elastic Fabric Adapter (EFA) ซึ่งช่วยเร่งการใช้งานแมชชีนเลิร์นนิงแบบกระจายที่ใช้ NVIDIA Collective Communications Library (NCCL) อีกด้วย EFA สามารถปรับขนาดเป็นหลายพัน GPU ได้ ซึ่งจะช่วยปรับปรุงอัตราการส่งข้อมูลและการปรับขนาดของโมเดลการฝึกอบรมการเรียนรู้เชิงลึกได้อย่างมาก และนำไปสู่ผลลัพธ์ที่รวดเร็วขึ้น
ภาพรวมของอินสแตนซ์ Amazon EC2 P3
ประโยชน์
คำชมเชยจากลูกค้า
นี่คือตัวอย่างบางส่วนของวิธีที่ลูกค้าและพันธมิตรบรรลุเป้าหมายทางธุรกิจด้วยอินสแตนซ์ Amazon EC2 P3
-
Airbnb
Airbnb ใช้แมชชีนเลิร์นนิ่งเพื่อปรับประสิทธิภาพการแนะนำการค้นหา และปรับปรุงแนวทางราคาแบบไดนามิกสำหรับโฮสต์ ซึ่งทั้งสองอย่างได้นำไปสู่การแปลงเป็นจำนวนการจองที่เพิ่มมากขึ้น เมื่อใช้อินสแตนซ์ Amazon EC2 P3 แล้ว Airbnb สามารถเรียกใช้ปริมาณงานการฝึกอบรมที่รวดเร็วขึ้น ทำซ้ำได้มากขึ้น สร้างโมเดลแมชชีนเลิร์นนิ่งที่ดีขึ้น และรวมทั้งลดค่าใช้จ่ายได้
-
Celgene
Celgene คือบริษัทเทคโนโลยีชีวภาพซึ่งพัฒนาการบำบัดแบบกำหนดเป้าหมายที่ตรงตามการรักษาผู้ป่วย บริษัทนี้ใช้ปริมาณงาน HPC สำหรับการตรวจหาลำดับทางพันธุกรรมที่ล้ำสมัยและการจำลองทางเคมีด้วยอินสแตนซ์ Amazon EC2 P3 ด้วยความสามารถในการประมวลผลนี้ Celgene สามารถฝึกอบรมโมเดลการเรียนรู้เชิงลึกให้จำแนกความต่างระหว่างเซลล์ร้ายกับเซลล์ไม่ร้ายได้ สมัยที่ยังไม่มีการใช้งานอินสแตนซ์ P3 จะต้องใช้เวลาร่วมสองเดือนในการดำเนินงานประมวลผลขนาดใหญ่ แต่ในปัจจุบันใช้เวลาเพียงสี่ชั่วโมง เทคโนโลยีของ AWS ช่วยให้ Celgene เพิ่มความเร็วในการพัฒนายารักษามะเร็งและโรคที่เกิดจากการอักเสบต่างๆ
-
Hyperconnect
Hyperconnect มีความเชี่ยวชาญในด้านการประยุกต์ใช้เทคโนโลยีใหม่ๆ ที่ใช้แมชชีนเลิร์นนิ่งในการประมวลผลรูปภาพและวิดีโอ และเป็นบริษัทแห่งแรกที่พัฒนา webRTC สำหรับแพลตฟอร์มมือถือ
-
NerdWallet
NerdWallet คือสตาร์ทอัพด้านการเงินส่วนบุคคลที่ให้เครื่องมือและคำแนะนำที่ช่วยให้ลูกค้าชำระหนี้ได้สะดวก เลือกผลิตภัณฑ์และบริการทางการเงินที่ดีที่สุด และจัดการกับเป้าหมายหลักในชีวิต อย่างเช่น การซื้อบ้านหรือการออมเงินเพื่อการเกษียณ บริษัทพึ่งพาวิทยาศาสตร์ข้อมูลและแมชชีนเลิร์นนิ่ง (ML) อย่างมากเพื่อเชื่อมโยงลูกค้ากับผลิตภัณฑ์ด้านการเงินที่เหมาะกับแต่ละบุคคล
-
PathWise Solutions Group
ผู้นำด้านโซลูชันระบบคุณภาพ PathWise ของ Aon คือชุดแอปพลิเคชัน SaaS บนระบบคลาวด์ที่ได้รับการปรับปรุงมาเพื่อการสร้างโมเดลการบริการจัดการความเสี่ยงขององค์กรที่ส่งมอบบริการตามความต้องการที่รวดเร็ว เชื่อถือได้ และปลอดภัยให้แก่กลุ่มลูกค้า
-
Pinterest
Pinterest ใช้การฝึกอบรมอย่างแม่นยำแบบผสมในอินสแตนซ์ P3 บน AWS เพื่อเร่งความเร็วในการฝึกอบรมโมเดลการเรียนรู้เชิงลึก และยังใช้อินสแตนซ์เหล่านี้เพื่อการอนุมานที่เร็วขึ้นสำหรับโมเดลเหล่านี้ เพื่อให้ผู้ใช้ได้สัมผัสประสบการณ์ค้นหาที่รวดเร็วและแปลกใหม่ Pinterest ใช้ PinSage ซึ่งสร้างขึ้นโดยใช้ PyTorch บน AWS โมเดล AI นี้จัดกลุ่มรูปภาพเอาไว้ด้วยกันตามธีมเฉพาะ ด้วยรูปภาพกว่า 3,000 ล้านรูปบนแพลตฟอร์ม มีความเชื่อมโยงกันกว่า 18,000 ล้านรายการซึ่งเชื่อมโยงรูปภาพไว้ด้วยกัน การเชื่อมโยงเหล่านี้ช่วยให้ Pinterest ปรับธีม สไตล์ตามบริบท และสร้างประสบการณ์การใช้งานของผู้ใช้ให้เหมาะกับแต่ละคนได้ยิ่งขึ้น
-
Salesforce
Salesforce ใช้แมชชีนเลิร์นนิ่งเพื่อเพิ่มประสิทธิภาพให้กับ Einstein Vision ซึ่งทำให้นักพัฒนาใช้พลังของระบบจดจำภาพสำหรับกรณีการใช้งานได้ เช่น การค้นหาภาพ การตรวจจับแบรนด์ และการระบุตัวตนผลิตภัณฑ์ อินสแตนซ์ Amazon EC2 P3 ช่วยให้นักพัฒนาฝึกอบรมโมเดลดีปเลิร์นนิ่งได้รวดเร็วขึ้นมาก ทำให้พวกเขาบรรลุเป้าหมายด้านแมชชีนเลิร์นนิ่งได้อย่างรวดเร็ว
-
Schrodinger
Schrodinger ใช้การประมวลผลประสิทธิภาพสูง (HPC) เพื่อพัฒนาโมเดลการคาดคะเนเพื่อขยายขนาดของการสำรวจและการปรับให้เหมาะสม รวมทั้งยังมอบความสามารถให้ลูกค้านำยาที่จะช่วยชีวิตผู้คนเข้าสู่ตลาดได้เร็วขึ้นด้วย อินสแตนซ์ Amazon EC2 P3 ช่วยให้ Schrodinger ดำเนินการจำลองได้มากขึ้นสี่เท่าต่อวัน เมื่อเทียบกับอินสแตนซ์ P2
-
Subtle Medical
Subtle Medical คือบริษัทเทคโนโลยีด้านการดูแลรักษาสุขภาพที่ทุ่มเทให้กับการปรับปรุงประสิทธิภาพในการถ่ายภาพทางการแพทย์ ตลอดจนประสบการณ์ของผู้ป่วยด้วยโซลูชันการเรียนรู้เชิงลึกที่ทันสมัย ทีมงานของบริษัทประกอบไปด้วยนักวิทยาศาสตร์ด้านการถ่ายภาพที่มีชื่อเสียง รังสีแพทย์ และผู้เชี่ยวชาญด้าน AI จาก Stanford, MIT, MD Anderson และมหาวิทยาลัยอื่นๆ อีกมากมาย
-
Western Digital
Western Digital ใช้ HPC เพื่อเรียกใช้การจำลองหลายหมื่นรายการสำหรับวิทยาศาสตร์วัสดุ การไหลของความร้อน แม่เหล็ก และการโอนย้ายข้อมูลเพื่อปรับปรุงดิสก์ไดรฟ์ รวมทั้งประสิทธิภาพและคุณภาพของโซลูชันพื้นที่จัดเก็บ จากการทดสอบก่อนหน้านี้ อินสแตนซ์ P3 ช่วยให้ทีมวิศวกรรมเรียกใช้การจำลองได้รวดเร็วกว่าโซลูชันที่ปรับใช้ก่อนหน้านี้มากขึ้นอย่างน้อยสามเท่า
อินสแตนซ์ Amazon EC2 P3 และ Amazon SageMaker
อินสแตนซ์ Amazon EC2 P3 และ AWS Deep Learning AMI
การกำหนดค่าสภาพแวดล้อมการพัฒนาล่วงหน้าเพื่อเริ่มต้นการสร้างแอปพลิเคชันดีปเลิร์นนิงอย่างรวดเร็ว
AWS Deep Learning AMI คือทางเลือกเพื่อใช้แทน Amazon SageMaker สำหรับผู้พัฒนา ที่ต้องการใช้การปรับแต่งเองมากกว่า โดยจะมอบโครงสร้างพื้นฐานและเครื่องมือต่างๆ ให้แก่ผู้ปฏิบัติงานและนักวิจัยด้านแมชชีนเลิร์นนิงเพื่อเร่งดีปเลิร์นนิงในระบบคลาวด์ทุกขนาด คุณสามารถเปิดใช้อินสแตนซ์ Amazon EC2 P3 ที่ติดตั้งไว้ล่วงหน้าได้อย่างรวดเร็วโดยใช้เฟรมเวิร์กดีปเลิร์นนิงลึกยอดนิยม เช่น TensorFlow, PyTorch, Apache MXNet, Microsoft Cognitive Toolkit, Caffe, Caffe2, Theano, Torch, Chainer, Gluon และ Keras ในการฝึกอบรมโมเดล AI แบบกำหนดเองที่ซับซ้อน ทดสอบด้วยอัลกอริทึมใหม่ หรือเรียนรู้ทักษะและเทคนิคใหม่ เรียนรู้เพิ่มเติม
อินสแตนซ์ Amazon EC2 P3 และการประมวลผลประสิทธิภาพสูง
แก้ไขปัญหาการประมวลผลขนาดใหญ่และรับข้อมูลเชิงลึกโดยใช้พลังของ HPC บน AWS
อินสแตนซ์ Amazon EC2 P3 คือแพลต์ฟอร์มที่สมบูรณ์แบบสำหรับการเรียกใช้การจำลองทางวิศวกรรม การเงินเชิงคำนวณ การวิเคราะห์คลื่นไหวสะเทือน การแสดงรูปแบบโมเลกุล จีโนมิกส์ การสร้างภาพ และปริมาณงานการประมวลผล GPU อื่นๆ การประมวลผลประสิทธิภาพสูง (HPC) ช่วยให้นักวิทยาศาสตร์และวิศวกรสามารถแก้ปัญหาที่ซับซ้อนและเน้นการประมวลผลเหล่านี้ได้ การใช้งาน HPC มักต้องการเครือข่ายที่มีประสิทธิภาพสูง การจัดเก็บที่รวดเร็ว หน่วยความจำปริมาณมาก ความสามารถในการประมวลผลสูง หรือทั้งหมดที่กล่าวมา AWS ช่วยให้คุณสามารถเพิ่มความเร็วในการค้นคว้าและลดเวลาในการได้ผลลัพธ์ลงโดยการเรียกใช้ HPC ในระบบคลาวด์ และโดยการปรับขนาดให้มีงานที่ทำพร้อมกันมีจำนวนมากกว่าที่ทำได้ในสภาพแวดล้อมภายในองค์กรส่วนใหญ่ ตัวอย่างเช่น อินสแตนซ์ P3dn.24xlarge จะรองรับ Elastic Fabric Adapter (EFA) ที่ช่วยให้การใช้งาน HPC ที่ใช้ Message Passing Interface (MPI) ปรับขนาดเป็นหลายพัน GPU AWS ช่วยลดค่าใช้จ่ายโดยการจัดเตรียมโซลูชันซึ่งมีการเพิ่มประสิทธิภาพสำหรับการใช้งานเฉพาะ และไม่จำเป็นต้องมีการลงทุนมาก เรียนรู้เพิ่มเติม
รองรับ NVIDIA RTX Virtual Workstation
AMI ของ NVIDIA RTX Virtual Workstation มีประสิทธิภาพทางกราฟิกระดับสูงโดยใช้อินสแตนซ์ P3 ที่แสนทรงพลังร่วมกับ NVIDIA Volta V100 GPU ซึ่งทำงานใน AWS Cloud โดย AMI เหล่านี้มีซอฟต์แวร์กราฟิก NVIDIA GPU รุ่นล่าสุดที่ติดตั้งไว้ล่วงหน้าพร้อมกับไดรเวอร์ RTX และการรับรอง NVIDIA ISV รุ่นล่าสุดซึ่งรองรับความละเอียดแบบเดสก์ท็อประดับ 4K ได้สูงสุดถึง 4 จอด้วยกัน อินสแตนซ์ P3 ที่มาพร้อมกับ NVIDIA V100 GPU ซึ่งประสานรวมเข้ากับ RTX vWS จะทำให้เกิดเวิร์กสเตชันประสิทธิภาพสูงในระบบคลาวด์ ด้วยหน่วยความจำ GPU สูงสุดถึง 32 GiB พร้อมทั้ง Ray Tracing ที่รวดเร็วและการเรนเดอร์ที่ขับเคลื่อนด้วย AI
โดย AMI ใหม่นี้พร้อมให้ใช้งานแล้วใน AWS Marketplace โดยรองรับ Windows Server 2016 และ Windows Server 2019
อินสแตนซ์ Amazon EC2 P3dn.24xlarge
รายละเอียดผลิตภัณฑ์อินสแตนซ์ Amazon EC2 P3
ขนาดของอินสแตนซ์ | GPU – Tesla V100 | GPU แบบ Peer to Peer | หน่วยความจำ GPU (GB) | vCPU | หน่วยความจำ (GB) | แบนด์วิธเครือข่าย | แบนด์วิธ EBS | ราคาตามต้องการ/ชม.* | การใช้งานอินสแตนซ์แบบเหมาจ่ายรายชั่วโมงแบบคุ้มค่าเป็นระยะเวลา 1 ปี* | การใช้งานอินสแตนซ์แบบเหมาจ่ายรายชั่วโมงแบบคุ้มค่าเป็นระยะเวลา 3 ปี* |
---|---|---|---|---|---|---|---|---|---|---|
p3.2xlarge | 1 | ไม่ระบุ | 16 | 8 | 61 | สูงสุด 10 Gbps | 1.5 Gbps | 3.06 USD | 1.99 USD | 1.05 USD |
p3.8xlarge | 4 |
NVLink | 64 | 32 | 244 | 10 Gbps | 7 Gbps | 12.24 USD | 7.96 USD | 4.19 USD |
p3.16xlarge | 8 | NVLink | 128 | 64 | 488 | 25 Gbps | 14 Gbps | 24.48 USD | 15.91 USD | 8.39 USD |
p3dn.24xlarge | 8 | NVLink | 256 | 96 | 768 | 100 Gbps | 19 Gbps | 31.218 USD | 18.30 USD | 9.64 USD |
* - ราคาที่แสดงนี้เป็นราคาสำหรับ Linux/Unix ในภูมิภาคของ AWS สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียตอนเหนือ) และปัดเศษเป็นเซนต์ สำหรับรายละเอียดราคาทั้งหมด โปรดดูหน้าราคา Amazon EC2
ลูกค้าสามารถซื้ออินสแตนซ์ P3 ในรูปแบบอินสแตนซ์ตามความต้องการ อินสแตนซ์แบบเหมาจ่าย อินสแตนซ์ Spot และโฮสต์เฉพาะได้
การเก็บค่าบริการตามวินาที
หนึ่งในข้อดีหลายประการของการประมวลผลในระบบคลาวด์คือความยืดหยุ่นในการจัดเตรียมและยกเลิกการจัดเตรียมทรัพยากรตามความต้องการ เมื่อเรียกเก็บค่าบริการเป็นวินาที เราก็ช่วยให้ลูกค้ามีความยืดหยุ่นเพิ่มขึ้น ประหยัดได้มากขึ้น และช่วยให้ลูกค้าปรับการจัดสรรทรัพยากรให้เหมาะสม เพื่อบรรลุเป้าหมายด้านแมชชีนเลิร์นนิ่งได้
ราคาอินสแตนซ์แบบเหมาจ่าย
อินสแตนซ์แบบเหมาจ่ายให้ส่วนลดคุณจำนวนมาก (สูงสุด 75%) เมื่อเทียบกับราคาอินสแตนซ์แบบตามความต้องการ นอกจากนี้ เมื่อมีการจัดอินสแตนซ์แบบเหมาจ่ายให้ Availability Zone ก็จะมีการจัดเตรียมการสำรองความจุให้ ซึ่งเป็นการเพิ่มความมั่นใจว่าคุณสามารถเปิดใช้งานอินสแตนซ์ได้เมื่อคุณต้องการ
การกำหนดราคาแบบ SPOT
เมื่อใช้อินสแตนซ์ Spot คุณจะจ่ายเงินตามราคา Spot ที่มีผลในช่วงเวลาที่อินสแตนซ์ของคุณกำลังทำงานอยู่ อินสแตนซ์ Spot จะกำหนดโดย Amazon EC2 และค่อยๆ ปรับตามแนวโน้มระยะยาวของอุปสงค์และอุปทานของความจุอินสแตนซ์ Spot อินสแตนซ์ Spot มีให้บริการที่ส่วนลดสูงสุดถึง 90% เมื่อเทียบกับราคาตามความต้องการ
ความพร้อมใช้งานระดับสากลในวงกว้างที่สุด
อินสแตนซ์ Amazon EC2 P3.2xlarge, P3.8xlarge และ P3.16xlarge พร้อมให้บริการในเขต AWS 14 เขต เพื่อให้ลูกค้ามีความยืดหยุ่นในการฝึกอบรมและปรับใช้โมเดลแมชชีนเลิร์นนิ่งได้ในทุกที่ที่จัดเก็บข้อมูล ภูมิภาค AWS ที่ P3 พร้อมให้บริการ คือ สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียเหนือ), สหรัฐอเมริกาฝั่งตะวันออก (โอไฮโอ), สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน), แคนาดา (ภาคกลาง), สหภาพยุโรป (ไอร์แลนด์), สหภาพยุโรป (แฟรงเฟิร์ต), สหภาพยุโรป (ลอนดอน), เอเชียแปซิฟิก (โตเกียว), เอเชียแปซิฟิก (โซล), เอเชียแปซิฟิก (ซิดนีย์), เอเชียแปซิฟิก (สิงคโปร์), จีน (ปักกิ่ง), จีน (หนิงเซี่ย) และ GovCloud (สหรัฐอเมริกาฝั่งตะวันตก)
AWS Region ที่อินสแตนซ์ P3dn.24xlarge ใช้งานได้ คือ เอเชียแปซิฟิก (โตเกียว), สหภาพยุโรป (ไอร์แลนด์), สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ), สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน), GovCloud (สหรัฐอเมริกาฝั่งตะวันตก) และ GovCloud (สหรัฐอเมริกาฝั่งตะวันออก)
เริ่มต้นใช้งานอินสแตนซ์ Amazon EC2 P3 สำหรับแมชชีนเลิร์นนิ่ง
หากต้องการเริ่มต้นใช้งานได้ในไม่กี่นาที ให้เรียนรู้เพิ่มเติมเกี่ยวกับ Amazon SageMaker หรือใช้ AWS Deep Learning AMI ซึ่งติดตั้งไว้ล่วงหน้าในเฟรมเวิร์กการเรียนรู้เชิงลึกยอดนิยม เช่น Caffe2 และ Mxnet หรือคุณยังสามารถใช้ NVIDIA AMI ซึ่งมาพร้อมกับไดรเวอร์ GPU และชุดเครื่องมือ CUDA ที่ติดตั้งไว้ล่วงหน้า