Amazon Web Services ブログ

Amazon SageMaker で EC2 P3dn GPU インスタンスをご利用いただけるようになりました

ここ数年、深層学習の急速な台頭によって、皮膚がんの発見 (SkinVision) および自動運転車 (TuSimple) などの素晴らしいアプリケーションが実現されました。ニューラルネットワークのおかげで、深層学習にはまさに、大量の非構造データ (画像、動画、自由形式テキストなど) から複雑なパターンを抽出し、モデル化する並外れた能力があります。

しかし、これらのニューラルネットワークのトレーニングには、同じく大量のコンピューティングパワーも必要です。グラフィック処理ユニット (GPU) にその能力があることは長年実証済みで、AWS のお客様は、Amazon Elastic Compute Cloud (EC2)P2 および P3 インスタンスを使用し、特に AWS の完全マネージド型でモジュラー設計の機械学習サービスである Amazon SageMaker においてそのモデルをトレーニングすることができる方法を素早く理解しました。

本日は、p3dn.24xlarge と名付けられた最大規模の P3 インスタンスが Amazon SageMaker でのモデルトレーニングに利用できるようになったことをお知らせしたいと思います。去年ローンチされたこのインスタンスは、大規模で複雑な分散型トレーニングジョブを迅速化するために設計されており、他の P3 インスタンスと比べて 2 倍の GPU メモリ、50% 増の vCPU、超高速のローカル NVMe ストレージ、および 100 Gbit のネットワーキングを備えています。

では、これをAmazon SageMaker で試してみませんか?

Amazon SageMaker での EC2 P3dn インスタンスの導入
Caltech-256 データセットでモデルをトレーニングするために、組み込みイメージ分類アルゴリズムを使用するこのノートブックから作業を開始しましょう。Amazon SageMakerp3dn.24xlarge インスタンスを使用するためにやらなければならないのは、train_instance_type'ml.p3dn.24xlarge' に設定して訓練するだけです!

ic = sagemaker.estimator.Estimator(training_image,
                                         role,
                                         train_instance_count=1,
                                         train_instance_type='ml.p3dn.24xlarge',
                                         input_mode='File',
                                         output_path=s3_output_location,
                                         sagemaker_session=sess)
...
ic.fit(...)

このノートブックで簡単なテストを実行してみると、何も設定を変更することなく 20% のトレーニング速度向上という素晴らしい結果を得ました (皆さんの結果は異なる場合があります)。ここでは 'File' モードを使っています。これは完全なデータセットがトレーニングインスタンスにコピーされるという意味で、より高速なネットワーク (100 Gbit、25 Gbit から向上) とストレージ (Amazon EBS ではなくローカル NVMe) が役に立つのは間違いありません!

大規模なデータセットで作業するときは、Pipe モードAmazon Simple Storage Service (S3) からデータをストリーミングする、または Amazon Elastic File SystemAmazon FSx for Lustre保存することによって、100 Gbit のネットワーキングを有効に利用することができます。また、インスタンスがパラメータ更新をより迅速に交換できるようになるため、分散型トレーニング (おそらく Horovod を使用) にも役立ちます。

要するに、Amazon SageMaker と P3dn のタッグチームはかなりのパンチ力を持っており、大規模な深層学習ワークロードに大幅なパフォーマンス向上を実現させるはずです。

今すぐご利用いただけます!
P3dn インスタンスは、米国東部 (バージニア北部)、および米国西部 (オレゴン) の各リージョンにある Amazon SageMaker でご利用いただけます。使用の開始をお考えの客様は、担当の AWS アカウントチームにご連絡いただくか、お問い合わせ ページからリクエストしてください。

いつものように、AWS では皆さんのフィードバックをお待ちしています。Amazon SageMakerAWS フォーラム、または通常の AWS 連絡先を通じてご意見をお寄せください。