投稿日: May 22, 2023
このたび、AWS ParallelCluster 3.6 の一般提供を開始いたしました。この主な新機能として、GPU インスタンスの自動ヘルスチェック、Red Hat Enterprise Linux (RHEL8) のサポートなどがあります。今回のリリースには、他にも以下のような重要な特長があります。
- ParallelCluster で管理されていない Slurm 設定をカスタマイズする機能
- AWS CloudFormation を使用して ParallelCluster を管理するためのプログラムインターフェイス
- 1 クラスターあたり最大 50 個のキューと合計 50 個のコンピューティングリソースをサポート
- ParallelCluster UI でのタグに基づくコストモニタリング
- キュー、ヘッドノード、ParallelCluster が管理するストレージのカスタムリソースタグのサポート
- ディスク使用量、アイドル状態のインスタンス、エラーに関する Amazon CloudWatch メトリクスの拡張
- 設定可能なログローテーションによるヘッドノードの耐障害性の向上
このリリースの詳細については、AWS ParallelCluster 3.6 のリリースノートを参照してください。
AWS ParallelCluster は全面的なサポートとメンテナンスが提供されているオープンソースのクラスター管理ツールです。このツールにより、研究開発分野のお客様や IT 管理者は、AWS でハイパフォーマンスコンピューティング (HPC) クラスターを運用できます。ParallelCluster は、科学ワークロード、エンジニアリングワークロード、機械学習 (ML/AI) ワークロードを AWS で大規模に実行でき、伸縮自在にスケールする HPC クラスターにクラウドリソースを自動的かつ安全にプロビジョニングするように設計されています。