投稿日: Nov 14, 2023

AWS は、機械学習とハイパフォーマンスコンピューティングのワークロード向けの Amazon Elastic Compute Cloud (EC2) Instance Topology API の一般提供を発表しました。Instance Topology API は、インスタンス間の相対的な近接度を示す、アカウントごとの独自の階層ビューを提供します。これにより、インスタンストポロジーを記述して、緊密に結合されたグループに属するインスタンスを識別できます。また、これを使用して通信時間をさらに改善し、ジョブの完了時間を短縮できます。

大規模な言語モデルのトレーニングや計算流体力学のトレーニングなどの分散並列ワークロードを実行するお客様は、ワークロードを数千の EC2 インスタンスにスケーリングしています。EEC2 Instance Topology API を使用すると、トポロジーをネットワークノードセットとして記述し、アベイラビリティーゾーン、グループ名、インスタンスタイプ、インスタンスタイプ、インスタンス ID でフィルタリングできます。ネットワークノードセットは、リージョン内のインスタンスどうしのトップダウン関係を表します。このトポロジーを任意のスケジューラに取り込み、それを使用して最適な条件でジョブにインスタンスを割り当てることができます。

EC2 Instance Topology API は、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)、アジアパシフィック (ソウル)、アジアパシフィック (東京)、カナダ (中部)、欧州 (フランクフルト)、欧州 (アイルランド)、欧州 (ストックホルム) の AWS リージョンで利用できるようになりました。次のインスタンスプラットフォームで使用できます: HPC6id、HPC6a、HPC7a、HPC7g、P3dn、P4d、P4de、P5、TRN1、TRN1n。

詳細については、こちらにある最新の EC2 ユーザーガイドにアクセスしてください。