Amazon CloudWatch Container Insights が Amazon EKS の分単位未満の GPU メトリクスを追加
Amazon CloudWatch Container Insights が、Amazon EKS で実行されている AI ワークロードおよび機械学習ワークロードの GPU メトリクスの収集を、分単位以下の頻度でサポートするようになりました。お客様はメトリクスのサンプルレートを秒単位で設定できるため、GPU リソースの使用率をより詳細に監視できます。
この機能強化により、お客様は、GPU リソースを短時間消費する機械学習推論ジョブなど、実行時間が 60 秒未満の GPU を大量に使用するワークロードを効果的に監視できます。サンプリング頻度を増やすことで、お客様は実行時間の短い GPU ワークロードを詳細に可視化できます。分単位未満の GPU メトリクスは、1 分に 1 回 CloudWatch に送信されます。このきめ細かな監視は、お客様が GPU リソースの使用率を最適化し、パフォーマンスの問題をトラブルシューティングし、コンテナ化された GPU アプリケーションを効率的に運用するのに役立ちます。
Container Insights の分単位未満の GPU メトリクスは、すべての AWS 商用リージョンと AWS GovCloud (米国) リージョンでご利用いただけます。
Container Insights の分単位未満の GPU メトリクスの詳細については、Amazon CloudWatch ユーザーガイドの NVIDIA GPU メトリクスのページをご覧ください。Container Insights の分単位未満の GPU メトリクスは追加費用なしでご利用いただけます。Container Insights の料金については、Amazon CloudWatch 料金表ページをご覧ください。