AWS Neuron SDK 2.25.0 の発表
投稿日:
2025年8月21日
本日、AWS は Neuron SDK 2.25.0 の一般提供を発表しました。これにより、AWS Inferentia および Trainium インスタンスの推論ワークロードとパフォーマンスモニタリングが改善されます。この最新リリースでは、コンテキストとデータ並列処理のサポート、推論における長いシーケンス処理のためのチャンクアテンションが追加され、neuron-ls API と neuron-monitor API が更新され、それぞれノードアフィニティとデバイス使用率に関する詳細情報が追加されました。
このリリースでは、高速テンソル演算のための自動エイリアシング (ベータ版) が導入され、分散サービング (ベータ版) が改善されています。さらに、Neuron での推論とトレーニングワークロード用にアップグレードされた AMI と深層学習コンテナも提供します。
Neuron 2.25.0 は、Inferentia インスタンスと Trainium インスタンスが提供されているすべての AWS リージョンでご利用いただけます。
詳細および新機能と機能拡張の一覧については、以下を参照してください。