อินสแตนซ์ Amazon EC2 P5en ซึ่งได้รับการปรับให้เหมาะสมสำหรับ AI ช่วยสร้างและ HPC พร้อมใช้งานโดยทั่วไปแล้ว
วันนี้ AWS ประกาศความพร้อมใช้งานทั่วไปของอินสแตนซ์ Amazon Elastic Compute Cloud (Amazon EC2) P5en ซึ่งขับเคลื่อนโดย Tensor Core GPU รุ่นล่าสุด NVIDIA H200 อินสแตนซ์เหล่านี้มอบประสิทธิภาพสูงสุดใน Amazon EC2 สำหรับการประยุกต์ใช้งานดีปเลิร์นนิงและการประมวลผลประสิทธิภาพสูง (HPC)
คุณสามารถใช้อินสแตนซ์ Amazon EC2 P5en สำหรับการฝึกและปรับใช้โมเดลภาษาขนาดใหญ่ (LLM) ที่ซับซ้อนเพิ่มมากขึ้น และโมเดลการแพร่กระจายที่ขับเคลื่อนแอปพลิเคชัน AI ช่วยสร้างที่มีความต้องการมากที่สุด นอกจากนี้ คุณยังสามารถใช้อินสแตนซ์ P5en เพื่อนำแอปพลิเคชัน HPC ที่มีความต้องการสูงไปใช้จริงในวงกว้างในการค้นพบทางเภสัชกรรม การวิเคราะห์แผ่นดินไหว การพยากรณ์อากาศ และการสร้างโมเดลทางการเงิน
อินสแตนซ์ P5en มี GPU H200 จำนวนสูงสุด 8 ตัว ซึ่งมีขนาดหน่วยความจำ GPU 1.7 เท่า และมีแบนวิดท์หน่วยความจำ GPU 1.5 เท่า มากกว่า GPU H100 ที่มีอยู่ในอินสแตนซ์ P5 อินสแตนซ์ P5en จับคู่ GPU H200 กับโปรเซสเซอร์ Intel Xeon แบบปรับขนาดได้รุ่นที่ 4 ที่กำหนดเองและมีประสิทธิภาพสูง ทำให้สามารถใช้ Gen5 PCIe ระหว่าง CPU และ GPU ซึ่งให้แบนวิดท์ระหว่าง CPU และ GPU มากถึง 4 เท่า และเพิ่มประสิทธิภาพการฝึกและการอนุมานของ AI อินสแตนซ์ P5en ที่มาพร้อมกับ 3,200 Gbps ของ EFA รุ่นที่สามที่ใช้ Nitro v5 แสดงให้เห็นถึงการปรับปรุงเวลาแฝงสูงสุดถึง 35% เมื่อเทียบกับ P5 ซึ่งใช้ EFA และ Nitro รุ่นก่อนหน้า สิ่งนี้จะช่วยปรับปรุงประสิทธิภาพการสื่อสารแบบรวมสำหรับเวิร์กโหลดการฝึกแบบกระจาย เช่น ดีปเลิร์นนิง AI ช่วยสร้าง การประมวลผลข้อมูลแบบเรียลไทม์ และแอปพลิเคชันการประมวลผลสมรรถนะสูง (HPC) เพื่อตอบสนองความต้องการของลูกค้าในวงกว้างที่เวลาแฝงต่ำ อินสแตนซ์ P5en จึงถูกนำไปใช้ใน Amazon EC2 UltraClusters และมอบความสามารถในการเพิ่มจำนวนอินสแตนซ์ระดับชั้นนำของตลาดสำหรับการฝึกแบบกระจายและเวิร์กโหลด HPC ที่เชื่อมโยงแบบ Tight Coupling
ตอนนี้ อินสแตนซ์ P5en พร้อมให้ใช้งานแล้วใน AWS Region สหรัฐอเมริกาฝั่งตะวันออก (โอไฮโอ), สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) และเอเชียแปซิฟิก (โตเกียว) และใน Local Zone สหรัฐอเมริกาฝั่งตะวันออก (แอตแลนตา) us-east-1-atl-2a ในขนาด p5en.48xlarge
หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับอินสแตนซ์ P5en โปรดดูอินสแตนซ์ Amazon EC2 P5en