การประกาศเปิดตัว AWS Neuron SDK 2.26.0

โพสต์บน: 19 ก.ย. 2025

วันนี้ AWS ประกาศความพร้อมใช้งานทั่วไปของ Neuron SDK 2.26.0 ซึ่งนำเสนอการปรับปรุงสำหรับเวิร์กโหลดดีปเลิร์นนิงบนอินสแตนซ์ที่ใช้ AWS Inferentia และ Trainium การเปิดตัวนี้เพิ่มการรองรับ PyTorch 2.8 และ JAX 0.6.2 พร้อมทั้งปรับปรุงความสามารถในการอนุมานที่เพิ่มขึ้นในอินสแตนซ์ Trainium2 (Trn2) การอัปเดตเหล่านี้ช่วยให้นักพัฒนาสามารถใช้ประโยชน์จากเฟรมเวิร์กล่าสุด ในขณะเดียวกันก็ได้รับประโยชน์จากความยืดหยุ่นในการนำไปใช้จริงสำหรับแบบจำลองได้ดีขึ้นและการเพิ่มประสิทธิภาพการทำงาน

ด้วย Neuron SDK 2.26.0 ลูกค้าสามารถปรับใช้แบบจำลองสร้างภาพ FLUX.1-dev รวมถึง Llama 4 Scout และ Maverick (เบต้า) บนอินสแตนซ์ Trn2 ได้ รุ่นนี้แนะนำการสนับสนุน Expert Parallelism (เบต้า) สำหรับการกระจายแบบจำลอง Mixture-of-Experts (MoE) อย่างมีประสิทธิภาพใน NeuronCore หลายตัว และเพิ่มความสามารถใหม่ผ่าน API ของ Neuron Kernel Interface (NKI) ใหม่ Neuron Profiler ที่อัปเดตให้ความสามารถที่ดีขึ้น รวมถึงการจัดกลุ่มโปรไฟล์ระบบสำหรับเวิร์กโหลดแบบกระจาย

SDK เวอร์ชันใหม่มีให้บริการใน AWS Region ทั้งหมดที่รองรับอินสแตนซ์ Inferentia และ Trainium ซึ่งนำเสนอประสิทธิภาพที่เพิ่มขึ้นและความสามารถในการตรวจสอบสำหรับเวิร์กโหลดแมชชีนเลิร์นนิง

ดูรายละเอียดเพิ่มเติมและรายการฟีเจอร์ใหม่กับการปรับปรุงทั้งหมดได้ที่: