AWS 正式宣佈 AWS Neuron SDK 2.26.0
張貼日期:
2025年9月19日
AWS 今日宣佈正式推出 Neuron SDK 2.26.0,改進了 AWS Inferentia 和 Trainium 型執行個體上的深度學習工作負載。此版本導入對 PyTorch 2.8 和 JAX 0.6.2 的支援,以及 Trainium2 (Trn2) 執行個體上的增強推論功能。這些更新使開發人員能夠利用最新的架構,同時受益於改進的模型部署靈活性和效能最佳化。
有了 Neuron SDK 2.26.0,客戶現在能夠在 Trn2 執行個體上部署 FLUX.1-dev 影像產生模型,以及 Llama 4 Scout 和 Maverick 衍生版本 (測試版)。該版本推出專家平行處理支援 (測試版),可將混合專家模型 (MoE) 模型有效地分散在多個 NeuronCore 之間,並透過新的 Neuron Kernel Interface (NKI) API 新增新功能。更新的 Neuron Profiler 提供改進的功能,包括分散式工作負載的系統設定檔分組。
全新的 SDK 版本適用於支援 Inferentia 和 Trainium 執行個體的所有 AWS 區域,能夠為機器學習工作負載提供增強的效能和監控功能。
若要進一步了解並瀏覽全新功能和增強功能完整清單,請參閱: