AWS Neuron 2.30.0 現已提供 NKI 0.4.0 和 22 個新的 NKI 程式庫核心

張貼日期: 2026年5月26日

AWS 今日宣佈正式推出 AWS Neuron 2.30.0,提供 NKI 0.4.0 並搭配新的 AWS Trainium3 特定硬體功能、22 個新的 NKI 程式庫核心,以及擴充的 Neuron 代理式開發技能,可用於模型移植和驗證。此版本適用於建置自訂核心、最佳化訓練和推論工作負載,或將模型移轉到 AWS Trainium 和 Inferentia 的 ML 開發人員。

NKI 0.4.0 導入適用於 Trn3 的 activate2 Scalar Engine 指令、適用於矩陣乘法的 OCP FP8 輸入支援,以及可簡化核心開發的位元組感知圖塊大小常數。NKI 程式庫新增 3 個用於分段注意、KV 平行預填和 FP8 量化的新核心,以及 19 個實驗核心,涵蓋內容平行性、MXFP8 訓練、狀態空間模型和融合最佳化器。PyTorch 參考實作現已適用於 29 個核心。

Neuron 代理式開發於 2026 年 4 月以測試版形式推出,並新增兩項新技能:用於將 HuggingFace 模型端對端移植到 NxD 推論的神經架構自動移植技能,以及用於驗證所移植模型之數值等效性的神經架構等效性技能。預設情況下,所有 Neuron DLAMI 和深度學習容器中都已包含這兩項技能。此版本還導入用於 Kubernetes 動態資源分配的 Neuron DRA 驅動程式,可以對 Trainium 加速器和 Elastic Fabric Adapter (EFA) 介面進行拓樸感知排程。Neuron Graph Compiler 現在可大幅改善編譯時間,而 Neuron Runtime 預設情況下會啟用零複本主機裝置傳輸。

AWS Neuron 適用於提供 Amazon EC2 Trn1、Trn2、Inf2 和 Inf1 執行個體的所有 AWS 區域。如需區域可用性的詳細資訊,請參閱 AWS 區域表

請參閱以下資源開始使用: