อินสแตนซ์ Amazon EC2 P5en พร้อมใช้งานแล้วในสหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ) และเอเชียแปซิฟิก (จาการ์ตา)
ตั้งแต่วันนี้เป็นต้นไป อินสแตนซ์ Amazon Elastic Compute Cloud (Amazon EC2) P5en ที่ขับเคลื่อนโดย NVIDIA GPU H200 พร้อมให้บริการแล้วในรีเจี้ยนสหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ) และเอเชียแปซิฟิก (จาการ์ตา) อินสแตนซ์เหล่านี้ได้รับการปรับให้เหมาะสมสำหรับแอปพลิเคชัน AI ช่วยสร้างและการประมวลผลประสิทธิภาพสูง (HPC)
อินสแตนซ์ P5en มี GPU H200 จำนวน 8 ตัวซึ่งมีขนาดหน่วยความจำ GPU 1.7 เท่า และมีแบนวิดท์หน่วยความจำ GPU 1.4 เท่า มากกว่า GPU H100 ที่มีอยู่ในอินสแตนซ์ P5 อินสแตนซ์ P5en จับคู่ GPU H200 กับโปรเซสเซอร์ Intel Xeon แบบปรับขนาดได้รุ่นที่ 4 ที่กำหนดเองและมีประสิทธิภาพสูง ทำให้สามารถใช้ Gen5 PCIe ระหว่าง CPU และ GPU ซึ่งให้แบนวิดท์ระหว่าง CPU และ GPU มากถึง 4 เท่า และเพิ่มประสิทธิภาพการฝึกและการอนุมานของ AI อินสแตนซ์ P5en ที่มาพร้อมกับ 3,200 Gbps ของ EFA รุ่นที่สามที่ใช้ Nitro v5 แสดงให้เห็นถึงการปรับปรุงเวลาแฝงสูงสุดถึง 35% เมื่อเทียบกับ P5 ซึ่งใช้ EFA และ Nitro รุ่นก่อนหน้า สิ่งนี้จะช่วยปรับปรุงประสิทธิภาพการสื่อสารแบบรวมสำหรับเวิร์กโหลดการฝึกแบบกระจาย เช่น ดีปเลิร์นนิง AI ช่วยสร้าง การประมวลผลข้อมูลแบบเรียลไทม์ และแอปพลิเคชันการประมวลผลสมรรถนะสูง (HPC) เพื่อตอบสนองความต้องการของลูกค้าในวงกว้างที่เวลาแฝงต่ำ อินสแตนซ์ P5en จึงถูกนำไปใช้ใน Amazon EC2 UltraClusters และมอบความสามารถในการเพิ่มจำนวนอินสแตนซ์ระดับชั้นนำของตลาดสำหรับการฝึกแบบกระจายและเวิร์กโหลด HPC ที่เชื่อมโยงแบบ Tight Coupling
อินสแตนซ์ P5en เพิ่มรีเจี้ยนที่ให้บริการแล้ว ขณะนี้จึงพร้อมให้บริการใน AWS Region สหรัฐอเมริกาฝั่งตะวันออก (โอไฮโอ), สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน), ยุโรป (สเปน) และเอเชียแปซิฟิก (จาการ์ตา มุมไบ โซล และโตเกียว) และใน Local Zone สหรัฐอเมริกาฝั่งตะวันออก (แอตแลนตา) us-east-1-atl-2a ในขนาด p5en.48xlarge
หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับอินสแตนซ์ P5en โปรดดูอินสแตนซ์ Amazon EC2 P5en