AWS Neuron SDK 2.26.0 の発表

投稿日: 2025年9月19日

本日、AWS は Neuron SDK 2.26.0 の一般提供を発表しました。これにより、AWS Inferentia および Trainium ベースのインスタンスでの深層学習ワークロードが改善されます。このリリースでは、PyTorch 2.8 と JAX 0.6.2 がサポートされ、Trainium2 (Trn2) インスタンスでの推論機能が強化されています。これらのアップデートにより、デベロッパーは最新のフレームワークを活用しながら、モデルデプロイの柔軟性の向上とパフォーマンスの最適化というメリットが得られます。

Neuron SDK 2.26.0 では、お客様は FLUX.1-dev 画像生成モデルや、Llama 4 Scout および Maverick バリアント (ベータ) を Trn2 インスタンスにデプロイできます。このリリースでは、複数の NeuronCore に混合エキスパート (MoE) モデルを効率的に分散させるためのエキスパート並列処理のサポート (ベータ) を導入し、新しい Neuron Kernel Interface (NKI) API による新機能を追加しています。新しくなった Neuron Profiler には、分散ワークロードのシステムプロファイルのグループ化など、強化された機能が用意されています。

SDK の新しいバージョンは、Inferentia インスタンスと Trainium インスタンスをサポートしているすべての AWS リージョンで利用でき、パフォーマンスを向上させたり、機械学習ワークロード向けのモニタリング機能を使用したりすることができます。

詳細および新機能と機能拡張の一覧については、以下を参照してください。