投稿日: Oct 25, 2022

Amazon SageMaker は、8 つの新しい Graviton2 および Graviton3 ベースの機械学習 (ML) インスタンスファミリーへとアクセスを拡大し、これによりお客様は ML モデルを SageMaker にデプロイする際にコストとパフォーマンスを最適化するためのより多くのオプションを利用できます。現在お客様は、リアルタイムおよび非同期推論モデルのデプロイオプションに ml.c7g、ml.m6g、ml.m6gd、ml.c6g、ml.c6gd、ml.c6gn、ml.r6g、ml.r6gd を使用できます。

Amazon SageMaker は現在、AWS Graviton2 プロセッサを搭載した ml.m6g、ml.m6gd、ml.c6g、ml.c6gd、ml.c6gn、ml.r6g、ml.r6gd の 7 つのインスタンスファミリーをサポートしています。これは、第 5 世代 x86 ベースの同程度のインスタンスと比較して、幅広いワークロードで最大 40% 優れたパフォーマンスを、同じ価格で提供しています。Graviton2 ベースの ML インスタンスは、すべての商用リージョンで利用できます。選択したリージョンで、どのインスタンスファミリーが利用可能かを確認するには、料金ページをご覧ください。

Graviton2 の改善に基づいて構築された Graviton3 ベースのインスタンスは、Graviton2 プロセッサと比較して、最大 25% 高いパフォーマンス、最大 2 倍の浮動小数点パフォーマンス、最先端の DDR5 メモリテクノロジーに基づく 50% 高速なメモリアクセスを実現します。具体的には、機械学習ワークロードに対して AWS Graviton3 プロセッサは、bfloat16 のサポートを含め、 AWS Graviton2 プロセッサと比較して最大 3 倍のパフォーマンスを提供します。Amazon SageMaker が ml.c7g インスタンスファミリーをサポートするようになりました。 ml.c7g インスタンスは、米国東部 (オハイオ)、米国東部 (バージニア北部)、米国西部 (オレゴン)、欧州 (アイルランド) で利用できます。

開始するには、SageMaker エンドポイント設定を作成するときに Graviton ベースのインスタンスを選択します。これらのインスタンスの料金情報については、料金ページをご覧ください。