投稿日: Feb 1, 2023
Amazon SageMaker Training では、インフラストラクチャを管理する必要なく、大規模な機械学習 (ML) モデルのトレーニングとチューニングにかかる時間とコストを削減できます。SageMaker は組み込みのライブラリやツールを提供するだけでなく、GPT、BERT、DALL·E などの一般的なオープンソースの基盤モデルや、PyTorch や TensorFlow などの ML フレームワークにも対応しています。SageMaker Training で、事前にインストールされたフレームワークまたはプライベート Docker レジストリに格納されたアルゴリズムを含むイメージを使用して ML モデルを構築できるようになったことを発表します。
通常、企業で働く機械学習プラクティショナーは、コンテナイメージにレジストリを使用したいと考えています。これは、イメージとアーティファクトを一元的に管理することが組織全体で行われているためです。Amazon ECR はエンタープライズチームが使用するこのような一元化されたレジストリの標準的な例です。チームによっては、AWS の外部で構築および管理しているさまざまなサードパーティのレジストリを使用してトレーニングジョブを実行する必要があります。今回の新機能により、データサイエンティストは任意のプライベート Docker レジストリを使用して、カスタマイズされた機械学習/深層学習 (ML/DL) モデルを柔軟にトレーニングできます。SageMaker モデルトレーニングでは、プライベート Docker レジストリで認証できるようになったため、セキュリティが一層強化され、コンテナイメージへのリクエストは許可されたエンティティに対してのみ提供されるという安心感を得られます。詳細な手順については、AWS のドキュメントをお読みください。