AWS Neuron 2.30.0 พร้อมใช้งานแล้ว โดยมาพร้อม NKI 0.4.0 และเคอร์เนล NKI Library ใหม่ 22 รายการ

โพสต์บน: 26 พ.ค. 2026

วันนี้ AWS ประกาศการพร้อมใช้งานทั่วไปของ AWS Neuron 2.30.0 ซึ่งมาพร้อม NKI 0.4.0 ที่รองรับความสามารถฮาร์ดแวร์ใหม่เฉพาะของ AWS Trainium3, เคอร์เนล NKI Library ใหม่ 22 รายการ และทักษะการพัฒนาแบบ Agent ของ Neuron ที่ได้รับการขยายเพิ่มเติมสำหรับการพอร์ตและการตรวจสอบความถูกต้องของโมเดล รุ่นนี้เหมาะสำหรับนักพัฒนา ML ที่สร้างเคอร์เนลแบบกำหนดเอง ปรับแต่งเวิร์กโหลดการฝึกและการอนุมาน หรือพอร์ตโมเดลไปยัง AWS Trainium และ Inferentia

NKI 0.4.0 เพิ่มคำสั่ง activate2 Scalar Engine สำหรับ Trn3 การรองรับอินพุต OCP FP8 สำหรับการคูณเมทริกซ์ และค่าคงที่ขนาดไทล์ที่รับรู้จำนวนไบต์ ซึ่งช่วยให้การพัฒนาเคอร์เนลทำได้ง่ายขึ้น NKI Library เพิ่มเคอร์เนลหลักใหม่ 3 รายการสำหรับ Segmented Attention, KV-Parallel Prefill และการควอนไทซ์แบบ FP8 รวมถึงเคอร์เนลทดลองอีก 19 รายการที่ครอบคลุมการประมวลผลแบบขนานตามบริบท, การฝึกแบบ MXFP8, โมเดล State-Space และตัวเพิ่มประสิทธิภาพแบบรวม ขณะนี้มีการจัดเตรียมการติดตั้งใช้งานอ้างอิงของ PyTorch สำหรับเคอร์เนลจำนวน 29 รายการแล้ว

Neuron Agentic Development ซึ่งเปิดตัวในสถานะเบต้าเมื่อเดือนเมษายน 2026 ได้เพิ่มทักษะใหม่สองรายการ ได้แก่ Neuron-Framework-Autoport สำหรับการพอร์ตโมเดล HuggingFace ไปยัง NxD Inference แบบครบวงจร และ Neuron-Framework-Equivalence สำหรับตรวจสอบความเทียบเท่าทางตัวเลขของโมเดลที่ผ่านการพอร์ตแล้ว โดยค่าเริ่มต้น ทั้งสองรายการจะถูกรวมอยู่ใน Neuron DLAMI และคอนเทนเนอร์ดีปเลิร์นนิงทั้งหมดแล้ว รุ่นนี้ยังเปิดตัว Neuron DRA Driver สำหรับ Kubernetes Dynamic Resource Allocation ซึ่งช่วยให้สามารถกำหนดเวลาที่คำนึงถึงโทโพโลยีของตัวเร่งความเร็ว Trainium และอินเทอร์เฟซ Elastic Fabric Adapter (EFA) ได้ ขณะนี้ Neuron Graph Compiler มอบการปรับปรุงเวลาในการคอมไพล์อย่างมีนัยสำคัญ และ Neuron Runtime เปิดใช้งานการถ่ายโอนข้อมูลระหว่างโฮสต์และอุปกรณ์แบบไม่ต้องคัดลอกข้อมูล (Zero-Copy) เป็นค่าเริ่มต้นแล้ว

AWS Neuron พร้อมใช้งานใน AWS Region ทุกแห่งที่มีอินสแตนซ์ Amazon EC2 Trn1, Trn2, Inf2 และ Inf1 ให้บริการแล้ว ดูข้อมูลเพิ่มเติมเกี่ยวกับความพร้อมใช้งานในระดับรีเจี้ยนได้ที่ตาราง AWS Region

หากต้องการเริ่มต้นใช้งาน ให้ดูทรัพยากรต่อไปนี้