Mengumumkan AWS Neuron SDK 2.25.0
Hari ini, AWS mengumumkan ketersediaan umum Neuron SDK 2.25.0, yang menghadirkan peningkatan untuk beban kerja inferensi dan pemantauan kinerja pada instans AWS Inferentia dan Trainium. Rilisan terbaru ini menambahkan dukungan konteks dan paralelisme data serta perhatian terpotong untuk pemrosesan sekuens panjang dalam inferensi, dan memperbarui API neuron-ls dan neuron-monitor dengan informasi lebih lanjut tentang afinitas simpul dan pemanfaatan perangkat, masing-masing.
Rilis ini juga memperkenalkan aliasing otomatis (Beta) untuk operasi tensor cepat, dan menambahkan penyempurnaan untuk penyajian terdisagregasi (Beta). Terakhir, ia menyediakan AMI dan Kontainer Deep Learning yang ditingkatkan untuk beban kerja inferensi dan pelatihan pada Neuron.
Neuron 2.25.0 tersedia di semua AWS Region tempat instans Inferentia dan Trainium ditawarkan.
Untuk mempelajari lebih lanjut dan melihat daftar lengkap fitur dan peningkatan baru, lihat: