AWS Neuron 2.30.0 が NKI 0.4.0 および 22 個の新しい NKI ライブラリカーネルとともに利用可能に

投稿日: 2026年5月26日

本日、AWS は AWS Neuron 2.30.0 の一般提供を発表しました。これにより、新しい AWS Trainium3 固有のハードウェア機能、22 個の新しい NKI ライブラリカーネル、モデルの移植および検証向けに拡張された Neuron Agentic Development スキルを含む NKI 0.4.0 が提供されます。このリリースは、カスタムカーネルの構築、トレーニングおよび推論ワークロードの最適化、AWS Trainium および Inferentia へのモデルの移植を行う機械学習デベロッパーを対象としています。

NKI 0.4.0 では、Trn3 向けの activate2 Scalar Engine 命令、行列乗算向けの OCP FP8 入力サポート、カーネル開発を簡素化するバイト対応のタイルサイズ定数が導入されました。NKI ライブラリには、セグメントアテンション、KV 並列プレフィル、FP8 量子化のための 3 個の新しい主要なカーネルに加えて、コンテキスト並列処理、MXFP8 トレーニング、状態空間モデル、融合オプティマイザーを含む 19 個の実験的カーネルが追加されています。29 個のカーネルで PyTorch のリファレンス実装が利用できるようになりました。

2026 年 4 月にベータ版としてリリースされた Neuron Agentic Development には、2 つの新しいスキルが追加されています。HuggingFace モデルを NxD Inference にエンドツーエンドで移植する neuron-framework-autoport と、移植されたモデルの数値的等価性を検証する neuron-framework-equivalence です。デフォルトで、両方ともすべての Neuron DLAMI と深層学習コンテナに含まれるようになりました。このリリースでは、Kubernetes の動的リソース割り当て向けの Neuron DRA ドライバーも導入され、Trainium アクセラレーターおよび Elastic Fabric Adapter (EFA) インターフェイスのトポロジー認識スケジューリングが可能になりました。Neuron Graph Compiler によってコンパイル時間に大幅に改善され、Neuron Runtime によってデフォルトでのゼロコピーのホストデバイス転送が可能になりました。

AWS Neuron は、Amazon EC2 Trn1、Trn2、Inf2、Inf1 インスタンスが提供されているすべての AWS リージョンで利用できます。利用できるリージョンの詳細については、AWS リージョン表をご覧ください。

使用を開始するには、以下のリソースを参照してください。