เลือกค่ากำหนดคุกกี้ของคุณ

เราใช้คุกกี้ที่จำเป็นและเครื่องมือที่คล้ายคลึงกันซึ่งจำเป็นในการให้บริการเว็บไซต์และบริการต่างๆ ของเรา เราใช้คุกกี้ประสิทธิภาพเพื่อรวบรวมสถิติที่ไม่ระบุชื่อ เพื่อให้เราเข้าใจว่าลูกค้าใช้เว็บไซต์ของเราอย่างไร และทำการปรับปรุง คุณไม่สามารถปิดใช้งานคุกกี้ที่จำเป็นได้ แต่คุณสามารถคลิก “ปรับแต่ง” หรือ “ปฏิเสธ” เพื่อปฏิเสธคุกกี้ประสิทธิภาพ

หากคุณยอมรับ AWS และบุคคลที่สามที่ได้รับการอนุมัติจะใช้คุกกี้เพื่อมอบคุณสมบัติของเว็บไซต์ที่มีประโยชน์ จดจำการตั้งค่าของคุณ และแสดงเนื้อหาที่เกี่ยวข้อง รวมถึงการโฆษณาที่เกี่ยวข้อง หากต้องการยอมรับหรือปฏิเสธคุ้กกี้ที่ไมจำเป็นทั้งหมด คลิก “ยอมรับ” หรือ “ปฏิเสธ” หากต้องการตัดสินใจโดยละเอียด โปรดคลิก “ปรับแต่ง”

Amazon SageMaker AI ประกาศเปิดตัวความพร้อมใช้งานของอินสแตนซ์ P5e และ G6e สำหรับการอนุมาน

โพสต์บน: 11 ธ.ค. 2024

เรายินดีที่จะประกาศความพร้อมใช้งานโดยทั่วไปของอินสแตนซ์ G6e แบบเพิ่มประสิทธิภาพการอนุมาน (ขับเคลื่อนโดย NVIDIA L40S Tensor Core GPU) และ P5e (ขับเคลื่อนโดย NVIDIA H200 Tensor Core GPU) บน Amazon SageMaker

หน่วยความจำ GPU แบนด์วิดท์สูง 1,128 GB ใน NVIDIA H200 GPU จำนวน 8 ตัว, ที่เก็บข้อมูล NVMe SSD ในเครื่องขนาด 30 TB, vCPU จำนวน 192 ตัว และหน่วยความจำระบบขนาด 2 TiB ทำให้อินสแตนซ์ ml.p5e.48xlarge สามารถมอบประสิทธิภาพที่ยอดเยี่ยมสำหรับเวิร์กโหลดการอนุมานของ AI ที่ต้องใช้การประมวลผลสูง เช่น โมเดลภาษาขนาดใหญ่ที่มีพารามิเตอร์มากกว่า 100B, โมเดลพื้นฐานหลายรูปแบบ, การสร้างข้อมูลสังเคราะห์ และแอปพลิเคชัน AI ช่วยสร้างที่ซับซ้อน รวมถึงการตอบคำถาม การสร้างโค้ด การสร้างวิดีโอ และการสร้างภาพ

การขับเคลื่อนโดย NVIDIA L40s Tensor Core GPU จำนวน 8 ตัว พร้อมหน่วยความจำ 48 GB ต่อ GPU และโปรเซสเซอร์ AMD EPYC รุ่นที่ 3 ทำให้อินสแตนซ์ ml.g6e สามารถมอบประสิทธิภาพได้ดีขึ้นถึง 2.5 เท่าเมื่อเทียบกับอินสแตนซ์ ml.g5 ลูกค้าสามารถใช้อินสแตนซ์ g6e เพื่อเรียกใช้การอนุมาน AI สำหรับโมเดลภาษาขนาดใหญ่ (LLM) ที่มีพารามิเตอร์สูงสุด 13B และโมเดลการแพร่กระจายต่าง ๆ เพื่อสร้างภาพ วิดีโอ และเสียงได้

อินสแตนซ์ ml.p5e และ ml.g6e พร้อมให้ใช้งานแล้วบน SageMaker ในสหรัฐอเมริกาฝั่งตะวันออก (โอไฮโอ) และสหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) หากต้องการเริ่มต้นใช้งาน เพียงขอเพิ่มขีดจำกัดผ่านทาง AWS Service Quotas สำหรับข้อมูลค่าบริการเกี่ยวกับอินสแตนซ์เหล่านี้ โปรดไปที่หน้าค่าบริการของเรา สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการปรับใช้โมเดลด้วย SageMaker โปรดดูภาพรวมที่นี่ และเอกสารประกอบที่นี่ หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับอินสแตนซ์เหล่านี้โดยทั่วไป โปรดไปที่หน้าผลิตภัณฑ์ P5e และ G6e

เลือกค่ากำหนดคุกกี้ของคุณ

Amazon SageMaker AI ประกาศเปิดตัวความพร้อมใช้งานของอินสแตนซ์ P5e และ G6e สำหรับการอนุมาน

สิ้นสุดการรองรับ Internet Explorer