Amazon Web Services ブログ

AWS Graviton2 プロセッサと NVIDIA T4G Tensor Core GPU を搭載した Amazon EC2 G5g インスタンス

AWS Graviton2 プロセッサは、Amazon EC2 で最高の料金パフォーマンスを実現するために AWS によってカスタム設計されています。数千ものお客様が、Graviton2 ベースのインスタンスを利用して、さまざまなワークロードで大幅な料金パフォーマンスの改善を実現しています。

2021 年 11 月 29 日(米国時間)、Graviton2 の料金パフォーマンス上のメリットを、グラフィックスアプリケーションや機械学習推論などの GPU ベースのワークロードにまで拡張する Amazon EC2 G5g インスタンスの一般提供の開始を発表しました。G5g インスタンスは、Graviton2 プロセッサに加えて NVIDIA T4G Tensor Core GPU を備えており、最大 25 Gbps のネットワーク帯域幅と 19 Gbps の EBS 帯域幅で、Android ゲームストリーミング向けに最高の料金パフォーマンスを提供します。

これらのインスタンスでは、x86 ベースの GPU インスタンスと比較して、Android ゲームストリーミングのストリームごとの 1 時間あたりのコストを最大 30% 低く抑えることができます。費用対効果の高い推論を求めていて、CPU パフォーマンスの影響を大きく受ける機械学習モデルを持ち、NVIDIA の AI ライブラリを活用する機械学習デベロッパーにも G5g インスタンスは最適です。

G5g インスタンスは、以下に示すように 6 つのサイズで利用可能です。

インスタンス名 vCPU メモリ (GB) NVIDIA T4G Tensor Core GPU GPU メモリ (GB) EBS 帯域幅 (Gbps) ネットワーク帯域幅 (Gbps)
g5g.xlarge 4 8 1 16 最大 3.5 最大 10
g5g.2xlarge 8 16 1 16 最大 3.5 最大 10
g5g.4xlarge 16 32 1 16 最大 3.5 最大 10
g5g.8xlarge 32 64 1 16 9 12
g5g.16xlarge 64 128 2 32 19 25
g5g.metal 64 128 2 32 19 25

これらのインスタンスは多くの興味深いタイプのワークロードに最適です。例をいくつかご紹介します。

  • Android ゲーミングのストリーミング – G5g インスタンスを使用すると、Android ゲームデベロッパーは、x86 ベースのインスタンスでクロスコンパイルやエミュレーションを行うことなく、Arm ベースの GPU インスタンスでネイティブに構築できます。レンダリングされたグラフィックスをエンコードし、ネットワーク経由でモバイルデバイスにゲームをストリーミングできます。これは、開発にかかる労力と時間を簡素化するのに役立つとともに、ストリームごとの 1 時間あたりのコストを最大 30% 削減します。
  • 機械学習推論 – 費用対効果の高い推論を求めていて、CPU パフォーマンスの影響を大きく受ける機械学習モデルを持ち、NVIDIA の AI を活用する機械学習デベロッパーにも G5g インスタンスは最適です。NVIDIA ソフトウェアで依存関係を有していない場合は、G4dn インスタンスと比較して最大 70% 低い推論単価を提供する Inf1 インスタンスを利用できます。
  • グラフィックスレンダリング – G5g インスタンスは、レンダリングのワークロードと NVIDIA ライブラリで依存関係を有しているお客様にとって、最も費用対効果の高いオプションです。これらのインスタンスは、OpenGL や Vulkan などの業界標準 API を活用するレンダリングアプリケーションやユースケースもサポートしています。
  • 自動運転車のシミュレーション – 当社のお客様の中には、複数のリアルタイムセンサーを備えた自動運転車の設計とシミュレーションを行っている企業様もいらっしゃいます。レイトレーシングを使用して、センサー入力をリアルタイムでシミュレートできます。

インスタンスは、NVENC、NVDEC、nvJPEG、OpenGL、Vulkan、CUDA、CuDNN、CuBLAS、TensorRT など、非常に多くの Linux 上のグラフィカルおよび機械学習ライブラリと互換性があります。

今すぐご利用いただけます
新しい G5g インスタンスは、米国東部 (バージニア北部)、米国西部 (オレゴン)、アジアパシフィック (ソウル、シンガポール、東京) の各リージョンで、オンデマンド、スポット、Savings Plan、およびリザーブドインスタンスで今すぐご利用を開始していただけます。詳細については、EC2 の料金のページをご覧ください。

G5g インスタンスは、NVIDIA ドライバーと一般的な機械学習フレームワーク、Amazon Elastic Container Service (Amazon ECS)、またはコンテナ化された機械学習アプリケーション向けの Amazon Elastic Kubernetes Service (Amazon EKS) クラスターを使用する AWS 深層学習 AMI でご利用いただけるようになりました。

Amazon EC2 の AWS フォーラム、または通常の AWS Support の担当者を通じて、ぜひフィードバックをお寄せください。

Channy

原文はこちらです。