อินสแตนซ์ Amazon EC2 P5en พร้อมให้ใช้งานแล้วในรีเจี้ยน AWS สหรัฐอเมริกาฝั่งตะวันตก (แคลิฟอร์เนียเหนือ)

โพสต์บน: 6 พ.ค. 2025

ตั้งแต่วันนี้เป็นต้นไป อินสแตนซ์ Amazon Elastic Compute Cloud (Amazon EC2) P5en ที่ขับเคลื่อนโดย NVIDIA H200 GPU จะพร้อมให้ให้ใช้งานในรีเจี้ยน AWS สหรัฐอเมริกาฝั่งตะวันตก (แคลิฟอร์เนียเหนือ) อินสแตนซ์เหล่านี้ได้รับการปรับให้เหมาะสมสำหรับแอปพลิเคชัน AI ช่วยสร้างและการประมวลผลประสิทธิภาพสูง (HPC)

อินสแตนซ์ P5en มี GPU H200 จำนวน 8 ตัวซึ่งมีขนาดหน่วยความจำ GPU 1.7 เท่า และมีแบนวิดท์หน่วยความจำ GPU 1.4 เท่า มากกว่า GPU H100 ที่มีอยู่ในอินสแตนซ์ P5 อินสแตนซ์ P5en จับคู่ GPU H200 กับโปรเซสเซอร์ Intel Xeon แบบปรับขนาดได้รุ่นที่ 4ที่กำหนดเองและมีประสิทธิภาพสูง ทำให้สามารถใช้ Gen5 PCIe ระหว่าง CPU และ GPU ซึ่งให้แบนวิดท์ระหว่าง CPU และ GPU มากถึง 4 เท่า และเพิ่มประสิทธิภาพการฝึกและการอนุมานของ AI อินสแตนซ์ P5en ที่มาพร้อมกับ 3,200 Gbps ของ EFA รุ่นที่สามที่ใช้ Nitro v5 แสดงให้เห็นถึงการปรับปรุงเวลาแฝงสูงสุดถึง 35% เมื่อเทียบกับ P5 ซึ่งใช้ EFA และ Nitro รุ่นก่อนหน้า สิ่งนี้จะช่วยปรับปรุงประสิทธิภาพการสื่อสารแบบรวมสำหรับเวิร์กโหลดการฝึกแบบกระจาย เช่น ดีปเลิร์นนิง AI ช่วยสร้าง การประมวลผลข้อมูลแบบเรียลไทม์ และแอปพลิเคชันการประมวลผลสมรรถนะสูง (HPC) เพื่อตอบสนองความต้องการของลูกค้าในวงกว้างที่เวลาแฝงต่ำ อินสแตนซ์ P5en จึงถูกนำไปใช้ใน Amazon EC2 UltraClusters และมอบความสามารถในการเพิ่มจำนวนอินสแตนซ์ระดับชั้นนำของตลาดสำหรับการฝึกแบบกระจายและเวิร์กโหลด HPC ที่เชื่อมโยงแบบ Tight Coupling

หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับอินสแตนซ์ P5en โปรดดูอินสแตนซ์ Amazon EC2 P5en

อินสแตนซ์ Amazon EC2 P5en พร้อมให้ใช้งานแล้วในรีเจี้ยน AWS สหรัฐอเมริกาฝั่งตะวันตก (แคลิฟอร์เนียเหนือ)

เรียนรู้

ทรัพยากร

นักพัฒนา

ความช่วยเหลือ