AWS Neuron 2.30.0 kini tersedia dengan NKI 0.4.0 dan 22 kernel NKI Library baru
Hari ini, AWS mengumumkan ketersediaan umum AWS Neuron 2.30.0, yang menghadirkan NKI 0.4.0 dengan kemampuan perangkat keras khusus AWS Trainium3 yang baru, 22 kernel Pustaka NKI baru, dan keterampilan Pengembangan Agen Neuron yang diperluas untuk porting dan validasi model. Rilis ini ditujukan untuk pengembang ML yang membangun kernel kustom, mengoptimalkan beban kerja pelatihan dan inferensi, atau memindahkan model ke AWS Trainium dan Inferentia.
NKI 0.4.0 memperkenalkan instruksi Activate2 Scalar Engine untuk Trn3, dukungan input OCP FP8 untuk perkalian matriks, dan konstanta ukuran tile yang peka terhadap byte yang menyederhanakan pengembangan kernel. Pustaka NKI menambahkan 3 kernel inti baru untuk perhatian tersegmentasi, pra-pengisian paralel KV, dan kuantisasi FP8, serta 19 kernel eksperimental yang mencakup paralelisme kontekstual, pelatihan MXFP8, model ruang keadaan, dan pengoptimal gabungan. Implementasi referensi PyTorch kini tersedia untuk 29 kernel.
Neuron Agentic Development, yang diluncurkan sebagai versi beta pada April 2026, menambahkan dua kemampuan baru: neuron-framework-autoport untuk memindahkan model HuggingFace ke NxD Inference secara menyeluruh, dan neuron-framework-equivalence untuk memvalidasi kesetaraan numerik dari model yang telah dipindahkan. Secara default, keduanya kini termasuk dalam semua Neuron DLAMI dan Kontainer Deep Learning. Rilis ini juga memperkenalkan Neuron DRA Driver untuk Alokasi Sumber Daya Dinamis Kubernetes, yang memungkinkan penjadwalan sadar topologi akselerator Trainium dan antarmuka Elastic Fabric Adapter (EFA). Neuron Graph Compiler kini menghadirkan peningkatan signifikan pada waktu kompilasi, dan Neuron Runtime memungkinkan transfer host-perangkat tanpa penyalinan data secara default.
AWS Neuron tersedia di semua AWS Region tempat instans Amazon EC2 Trn1, Trn2, Inf2, dan Inf1 tersedia. Untuk informasi selengkapnya tentang ketersediaan Regional, lihat tabel AWS Region.
Untuk memulai, lihat sumber daya berikut: