อินสแตนซ์ Amazon EC2 P5en พร้อมให้ใช้งานแล้วในรีเจี้ยน AWS สหรัฐอเมริกาฝั่งตะวันตก (แคลิฟอร์เนียเหนือ)

โพสต์บน: 6 พ.ค. 2025

ตั้งแต่วันนี้เป็นต้นไป อินสแตนซ์ Amazon Elastic Compute Cloud (Amazon EC2) P5en ที่ขับเคลื่อนโดย NVIDIA H200 GPU จะพร้อมให้ให้ใช้งานในรีเจี้ยน AWS สหรัฐอเมริกาฝั่งตะวันตก (แคลิฟอร์เนียเหนือ) อินสแตนซ์เหล่านี้ได้รับการปรับให้เหมาะสมสำหรับแอปพลิเคชัน AI ช่วยสร้างและการประมวลผลประสิทธิภาพสูง (HPC)

อินสแตนซ์ P5en มี GPU H200 จำนวน 8 ตัวซึ่งมีขนาดหน่วยความจำ GPU 1.7 เท่า และมีแบนวิดท์หน่วยความจำ GPU 1.4 เท่า มากกว่า GPU H100 ที่มีอยู่ในอินสแตนซ์ P5 อินสแตนซ์ P5en จับคู่ GPU H200 กับโปรเซสเซอร์ Intel Xeon แบบปรับขนาดได้รุ่นที่ 4 ที่กำหนดเองและมีประสิทธิภาพสูง ทำให้สามารถใช้ Gen5 PCIe ระหว่าง CPU และ GPU ซึ่งให้แบนวิดท์ระหว่าง CPU และ GPU มากถึง 4 เท่า และเพิ่มประสิทธิภาพการฝึกและการอนุมานของ AI อินสแตนซ์ P5en ที่มาพร้อมกับ 3,200 Gbps ของ EFA รุ่นที่สามที่ใช้ Nitro v5 แสดงให้เห็นถึงการปรับปรุงเวลาแฝงสูงสุดถึง 35% เมื่อเทียบกับ P5 ซึ่งใช้ EFA และ Nitro รุ่นก่อนหน้า สิ่งนี้จะช่วยปรับปรุงประสิทธิภาพการสื่อสารแบบรวมสำหรับเวิร์กโหลดการฝึกแบบกระจาย เช่น ดีปเลิร์นนิง AI ช่วยสร้าง การประมวลผลข้อมูลแบบเรียลไทม์ และแอปพลิเคชันการประมวลผลสมรรถนะสูง (HPC) เพื่อตอบสนองความต้องการของลูกค้าในวงกว้างที่เวลาแฝงต่ำ อินสแตนซ์ P5en จึงถูกนำไปใช้ใน Amazon EC2 UltraClusters และมอบความสามารถในการเพิ่มจำนวนอินสแตนซ์ระดับชั้นนำของตลาดสำหรับการฝึกแบบกระจายและเวิร์กโหลด HPC ที่เชื่อมโยงแบบ Tight Coupling

หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับอินสแตนซ์ P5en โปรดดูอินสแตนซ์ Amazon EC2 P5en