AWS 正式宣佈 AWS Neuron SDK 2.25.0

張貼日期: 2025年8月21日

AWS 今日宣佈正式推出 Neuron SDK 2.25.0,可提供針對 AWS Inferentia 和 Trainium 執行個體之推論工作負載和效能監控的相關改進。此最新版本新增上下文和資料平行化支援,以及適用於推論中長序列處理作業的區塊注意力,並更新了 neuron-ls 和 neuron-monitor API,分別提供關於節點親和性和裝置使用率的更多資訊。

此版本還導入用於快速張量作業的自動別名 (Beta 版) 功能,並為解耦式服務 (Beta 版) 新增改進項目。最後,此版本還提供升級後的 AMI 和深度學習容器,可用於在 Neuron 上進行推論和訓練工作負載。

Neuron 2.25.0 適用於所有提供 Inferentia 和 Trainium 執行個體的 AWS 區域。

若要進一步了解並瀏覽全新功能和增強功能完整清單,請參閱: