Mengumumkan AWS Neuron SDK 2.26.0
Hari ini, AWS mengumumkan ketersediaan umum Neuron SDK 2.26.0, yang menghadirkan peningkatan untuk beban kerja deep learning pada instans berbasis AWS Inferentia dan Trainium. Rilis ini memperkenalkan dukungan untuk PyTorch 2.8 dan JAX 0.6.2, bersama dengan kemampuan inferensi yang ditingkatkan pada instans Trainium2 (Trn2). Pembaruan ini memungkinkan pengembang untuk memanfaatkan kerangka kerja terbaru sekaligus mendapatkan keuntungan dari peningkatan fleksibilitas deployment model dan pengoptimalan kinerja.
Dengan Neuron SDK 2.26.0, pelanggan kini dapat menerapkan model pembuatan gambar FLUX.1-dev, bersama dengan varian Llama 4 Scout dan Maverick (beta) pada instans Trn2. Rilis ini memperkenalkan dukungan paralelisme pakar (beta) untuk distribusi model Mixture-of-Experts (MoE) yang efisien di beberapa NeuronCore, dan menambahkan kemampuan baru melalui API Antarmuka Kernel Neuron (NKI) baru. Neuron Profiler yang diperbarui menyediakan kemampuan yang ditingkatkan, termasuk pengelompokan profil sistem untuk beban kerja terdistribusi.
Versi SDK baru tersedia di semua AWS Region yang mendukung instans Inferentia dan Trainium, menawarkan peningkatan kinerja dan kemampuan pemantauan untuk beban kerja machine learning.
Untuk mempelajari lebih lanjut dan melihat daftar lengkap fitur dan peningkatan baru, lihat: