投稿日: Oct 17, 2023

アジアパシフィック (東京) と欧州 (フランクフルト) で ml.p4d インスタンスの一般提供が開始されたことをお知らせします。これにより、リアルタイム推論および非同期推論用の機械学習 (ML) モデルを Amazon SageMaker にデプロイできるようになります。

ml.p4d.24xlarge インスタンスは深層学習モデル向けに高いパフォーマンスを発揮します。1 つの Nvidia A100 GPU ごとに 40 GB のメモリを備えた P4d インスタンスを使用すれば、大規模モデルでの高性能な機械学習推論や、自然言語処理、オブジェクト検出、レコメンデーションエンジンなどのアプリケーションにおける生成系 AI を実現できます。

ユーザーは、アジアパシフィック (東京) と欧州 (フランクフルト) で、SageMaker 上の ml.p4d インスタンスに推論用モデルをすぐにデプロイできます。このインスタンスの料金情報については、料金ページを参照してください。SageMaker によるモデルのデプロイの詳細については、こちらの概要とこちらのドキュメントを参照してください。P4d インスタンスの詳細については、P4 の製品ページを参照してください。