投稿日: May 17, 2024
本日、AWS は、コンテナ専用に構築された Linux ベースのオペレーティングシステムである Bottlerocket が NVIDIA Fabric Manager をサポートするようになったことを発表しました。これにより、ユーザーはマルチ GPU 構成の力を AI と機械学習のワークロードに活用できるようになります。この統合により、Bottlerocket のユーザーは、接続された GPU を高性能コンピューティングファブリックとしてシームレスに活用できるようになり、各 P4/P5 インスタンスのすべての GPU 間で効率的かつ低遅延の通信が可能になります。
深層学習モデルがますます高度化するにつれて、妥当な時間枠内でそれらをトレーニングするために必要な計算リソースが指数関数的に増加しています。このような計算需要の増加に対処するために、AI や機械学習のワークロードを実行しているお客様は、マルチ GPU 実装に目を向け、NVIDIA の NVSwitch と NVLink のテクノロジーを活用して、接続された GPU 間で統合されたメモリファブリックを構築しています。Bottlerocket NVIDIA バリアントでの Fabric Manager のサポートにより、ユーザーはこのファブリックを構成できるようになり、すべての GPU を個別のユニットではなく単一の高性能プールとして使用できるようになります。これにより、Bottlerocket のユーザーは P4/P5 インスタンスでマルチ GPU セットアップを実行できるようになり、複雑なニューラルネットワークのトレーニングを大幅に加速できます。
Bottlerocket NVIDIA バリアントでの Fabric Manager のサポートの詳細については、Bottlerocket GitHub 公式リポジトリをご覧ください。