อินสแตนซ์ Amazon EC2 G7e พร้อมให้บริการโดยทั่วไปแล้ว
วันนี้ Amazon ประกาศเปิดตัวความพร้อมใช้งานทั่วไปของอินสแตนซ์ Amazon Elastic Compute Cloud (Amazon EC2) G7e ที่เร่งความเร็วด้วย GPU NVIDIA RTX PRO 6000 Blackwell Server Edition อินสแตนซ์ G7e ให้ประสิทธิภาพการอนุมานสูงสุด 2.3 เท่าเมื่อเทียบกับ G6e
ลูกค้าสามารถใช้อินสแตนซ์ G7e เพื่อติดตั้งใช้งานโมเดลภาษาขนาดใหญ่ (LLM) โมเดล Agentic AI โมเดล AI ช่วยสร้างหลายรูปแบบ และโมเดล AI ทางกายภาพ อินสแตนซ์ G7e ให้ประสิทธิภาพสูงสุดสำหรับเวิร์กโหลดการประมวลผลเชิงพื้นที่รวมถึงเวิร์กโหลดที่ต้องการทั้งความสามารถในการประมวลผลกราฟิกและการประมวลผล AI อินสแตนซ์ G7e มี GPU NVIDIA RTX PRO 6000 Blackwell Server Edition สูงสุด 8 ตัว พร้อมหน่วยความจำ 96 GB ต่อ GPU และโปรเซสเซอร์ 5th Generation Intel Xeon รองรับซีพียูเสมือน (vCPU) สูงสุด 192 ตัวและแบนวิดท์เครือข่ายอะแดปเตอร์ Elastic Fabric Adapter สูงสุด 1600 Gbps อินสแตนซ์ G7e รองรับ NVIDIA GPUDirect Peer to Peer (P2P) ที่เพิ่มประสิทธิภาพสำหรับเวิร์กโหลดหลาย GPU อินสแตนซ์ G7e แบบหลาย GPU ยังรองรับ NVIDIA GPUDirect Remote Direct Memory Access (RDMA) ที่มี EFAv4 ใน EC2 UltraClusters ซึ่งช่วยลดเวลาแฝงสำหรับเวิร์กโหลดหลายโหนดขนาดเล็ก
คุณสามารถใช้อินสแตนซ์ G7e สำหรับ Amazon EC2 ใน AWS Region ต่อไปนี้: สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ) และสหรัฐอเมริกาฝั่งตะวันออก (โอไฮโอ) คุณสามารถซื้ออินสแตนซ์ G7e ในรูปแบบ On-Demand Instance, Spot Instance หรือเป็นส่วนหนึ่งของ Savings Plans ก็ได้
ในการเริ่มต้นใช้งาน โปรดไปที่คอนโซลการจัดการของ AWS, อินเทอร์เฟซบรรทัดคำสั่ง (CLI) ของ AWS และ AWS SDK หากต้องการเรียนรู้เพิ่มเติม โปรดไปที่อินสแตนซ์ G7e