投稿日: Oct 17, 2023

Amazon SageMaker で機械学習 (ML) モデルの非同期推論およびリアルタイム推論を実現するための、ml.p4d、ml.trn1、ml.g5 の各インスタンスのプレビュー版が新しいリージョンで利用できるようになったことをお知らせします。これらのインスタンスは、他のリージョンでも推論用に一般提供されます。

  • ml.p4d.24xlarge インスタンスは、現在 GovCloud (米国西部)、欧州 (アイルランド)、アジアパシフィック (東京)、アジアパシフィック (シンガポール) の各 AWS リージョンでプレビュー版として提供されており、深層学習モデル向けに高いパフォーマンスを発揮します。1 つの Nvidia A100 GPU ごとに 40 GB のメモリを備えた P4d インスタンスは、大規模モデルや生成 AI のユースケースにおいて高性能な機械学習推論を実現します。
  • ml.trn1 インスタンスは、現在米国西部 (オレゴン) でプレビュー版として提供されており、テキストの要約、コード生成、質問応答などの幅広いアプリケーションで、パラメータ数 1000 億以上の深層学習モデルおよび生成 AI モデルを使用した高性能な推論ワークロードをサポートしています。
  • ml.g5 インスタンスは、現在アジアパシフィック (ソウル) と南米 (サンパウロ) でプレビュー版として提供されており、レコメンデーション、チャットボット、スマートアシスタント、画像認識などのユースケースに最適です。

これらのプレビュー版にアクセスするには、AWS Service Quotas を通じて制限の引き上げをリクエストしてください。これらのインスタンスの料金情報については、料金ページをご覧ください。SageMaker によるモデルのデプロイの詳細については、こちらの概要とこちらのドキュメントを参照してください。プレビュー版の各インスタンスの詳細については、G5 の製品ページTrn1 の製品ページP4 の製品ページを参照してください。