AWS ParallelCluster 3.15 が P6-B300 と Slurm 25.11 をサポート
このたび、AWS ParallelCluster 3.15 の一般提供を開始しました。今回のリリースでは、P6-B300 インスタンスタイプのサポートが追加され、Slurm がバージョン 25.11 にアップグレードされてジョブの再キューイングが迅速化されました。
P6-B300 のサポートにより、最新の NVIDIA Blackwell GPU インフラストラクチャ上で、要求の厳しい AI/機械学習のワークロードやハイパフォーマンスコンピューティングのワークロードを実行できます。このリリースでは、EFA ネットワーク設定のデフォルトが改善され、ネットワークインターフェイスのカスタマイズがサポートされます。ネットワークインターフェイスをカスタマイズする方法については、「起動テンプレートの上書きを使用してコンピューティングノードのネットワークインターフェイスをカスタマイズする」をご覧ください。その他の改善点として、クラスター更新の信頼性の向上、大規模クラスター内の密結合ワークロードのパフォーマンス向上、中断のないクラスタータグの更新のサポートなどがあります。詳細については、AWS ParallelCluster 3.15.0 のリリースノートをご覧ください。
AWS ParallelCluster は、研究開発分野のユーザーや IT 管理者が AWS でハイパフォーマンスコンピューティング (HPC) クラスターを運用できるようにするオープンソースのクラスター管理ツールです。ParallelCluster は、科学ワークロードやエンジニアリングワークロードを AWS で大規模に実行できる能力があり伸縮自在にスケールする HPC クラスターに、クラウドリソースを自動的かつ安全にプロビジョニングするように設計されています。ParallelCluster は、こちらに記載されている AWS リージョンで、追加料金なしでご利用いただけます。お支払いいただくのは、お客様のアプリケーションを実行するために必要な AWS リソースの料金のみです。
AWS で HPC クラスターを起動する方法の詳細については、ParallelCluster ユーザーガイドをご覧ください。ParallelCluster の使用を開始する方法の詳細については、ParallelCluster の UI と CLI のインストール手順をご覧ください。