AWS Neuron が Amazon EKS による動的リソース割り当てのサポートを発表

投稿日: 2026年3月20日

AWS は、Amazon Elastic Kubernetes Service (EKS) の Neuron Dynamic Resource Allocation (DRA) ドライバーを発表しました。これにより、Kubernetes ネイティブのハードウェア対応スケジューリングが AWS Trainium ベースのインスタンスに提供されます。Neuron DRA ドライバーは、豊富なデバイス属性を Kubernetes スケジューラに直接公開するため、カスタムスケジューラを拡張しなくても、トポロジーを意識した配置決定が可能になります。

Kubernetes に AI ワークロードをデプロイするには、ML エンジニアが、デバイス数の決定、ハードウェアとネットワークのトポロジの理解、アクセラレータ固有のマニフェストの作成など、モデル開発とは直接関係のないインフラストラクチャに関する意思決定を行う必要があります。これにより、摩擦が生じ、イテレーションが遅くなり、ワークロードが基盤となるインフラストラクチャに緊密に結びつきます。ユースケースが分散型トレーニング、ロングコンテキスト推論、細分化されたアーキテクチャへと拡大するにつれて、この複雑さがスケーリングのボトルネックになります。

Neuron DRA ドライバーは、インフラストラクチャの課題を ML ワークフローから切り離すことで、この負担を解消します。インフラストラクチャチームは、デバイスのトポロジ、割り当て、ネットワークポリシーをキャプチャする再利用可能な ResourceClaimTemplate を定義します。ML エンジニアは、ハードウェアの詳細を気にすることなく、マニフェストでこれらのテンプレートを簡単に参照できます。これにより、ワークロードごとの構成が可能になり、複数のワークロードで同じノードを効率的に共有できるだけでなく、ワークロードのタイプを問わず一貫したデプロイが可能になります。

Neuron DRA ドライバーは、すべての AWS Trainium インスタンスタイプをサポートしており、AWS Trainium が利用可能なすべての AWS リージョンで利用できます。

ドキュメント、サンプルテンプレート、および実装ガイドについては、 Neuron DRA のドキュメントを参照してください。

詳細はこちら: