อินสแตนซ์ Amazon EC2 P5en พร้อมใช้งานแล้วในสหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ) และเอเชียแปซิฟิก (จาการ์ตา)

โพสต์บน: 27 มี.ค. 2025

ตั้งแต่วันนี้เป็นต้นไป อินสแตนซ์ Amazon Elastic Compute Cloud (Amazon EC2) P5en ที่ขับเคลื่อนโดย NVIDIA GPU H200 พร้อมให้บริการแล้วในรีเจี้ยนสหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ) และเอเชียแปซิฟิก (จาการ์ตา) อินสแตนซ์เหล่านี้ได้รับการปรับให้เหมาะสมสำหรับแอปพลิเคชัน AI ช่วยสร้างและการประมวลผลประสิทธิภาพสูง (HPC)

อินสแตนซ์ P5en มี GPU H200 จำนวน 8 ตัวซึ่งมีขนาดหน่วยความจำ GPU 1.7 เท่า และมีแบนวิดท์หน่วยความจำ GPU 1.4 เท่า มากกว่า GPU H100 ที่มีอยู่ในอินสแตนซ์ P5 อินสแตนซ์ P5en จับคู่ GPU H200 กับโปรเซสเซอร์ Intel Xeon แบบปรับขนาดได้รุ่นที่ 4ที่กำหนดเองและมีประสิทธิภาพสูง ทำให้สามารถใช้ Gen5 PCIe ระหว่าง CPU และ GPU ซึ่งให้แบนวิดท์ระหว่าง CPU และ GPU มากถึง 4 เท่า และเพิ่มประสิทธิภาพการฝึกและการอนุมานของ AI อินสแตนซ์ P5en ที่มาพร้อมกับ 3,200 Gbps ของ EFA รุ่นที่สามที่ใช้ Nitro v5 แสดงให้เห็นถึงการปรับปรุงเวลาแฝงสูงสุดถึง 35% เมื่อเทียบกับ P5 ซึ่งใช้ EFA และ Nitro รุ่นก่อนหน้า สิ่งนี้จะช่วยปรับปรุงประสิทธิภาพการสื่อสารแบบรวมสำหรับเวิร์กโหลดการฝึกแบบกระจาย เช่น ดีปเลิร์นนิง AI ช่วยสร้าง การประมวลผลข้อมูลแบบเรียลไทม์ และแอปพลิเคชันการประมวลผลสมรรถนะสูง (HPC) เพื่อตอบสนองความต้องการของลูกค้าในวงกว้างที่เวลาแฝงต่ำ อินสแตนซ์ P5en จึงถูกนำไปใช้ใน Amazon EC2 UltraClusters และมอบความสามารถในการเพิ่มจำนวนอินสแตนซ์ระดับชั้นนำของตลาดสำหรับการฝึกแบบกระจายและเวิร์กโหลด HPC ที่เชื่อมโยงแบบ Tight Coupling

อินสแตนซ์ P5en เพิ่มรีเจี้ยนที่ให้บริการแล้ว ขณะนี้จึงพร้อมให้บริการใน AWS Region สหรัฐอเมริกาฝั่งตะวันออก (โอไฮโอ), สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน), ยุโรป (สเปน) และเอเชียแปซิฟิก (จาการ์ตา มุมไบ โซล และโตเกียว) และใน Local Zone สหรัฐอเมริกาฝั่งตะวันออก (แอตแลนตา) us-east-1-atl-2a ในขนาด p5en.48xlarge

หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับอินสแตนซ์ P5en โปรดดูอินสแตนซ์ Amazon EC2 P5en

เรียนรู้

ทรัพยากร

นักพัฒนา

ความช่วยเหลือ