Amazon Web Services ブログ

新しい AWS コースで機械学習モデルをより迅速に構築、トレーニング、反復する方法を学びましょう

このブログは Kumar Kumaraguruparan による “Learn to build, train, and iterate machine learning models faster with new AWS course” を翻訳+加筆修正したものです。

機械学習(Machine Learning: ML)が、潜在的な COVID ワクチン候補の数を数万から 26 に減らす上で重要な役割を果たしたことをご存知ですか (PMC)? ML によって生産性が向上することで、COVID ワクチンの開発においては多くの人々の命を救いました。

AWS クラウドでMLモデル構築のパフォーマンスを向上

パブリッククラウドにおける非構造化データ分析およびデータ管理市場は、2021年から2025年の間に41.9%の CAGR(年平均成長率)で成長すると予想されています (IDC)。データは ML モデルを構築・チューニングするために必要です。ML モデル構築作業をクラウドに移行してデータの移動を減らすことで、モデル開発のスピードアップが期待できます。データや分析のワークロードがすでに AWS にある場合や、AWS クラウドサービスを検討している場合は、ML ワークロードを AWS クラウドに統合することでモデル構築のパフォーマンスを向上させることができます。

Amazon SageMaker Studio について

Amazon SageMaker Studio は ML 専用の統合開発環境 (IDE) です。SageMaker Studio は、データの準備から、ML モデルのデプロイと監視まで、ML 開発のすべてのステップを実行でき、Web ベースのビジュアルインターフェイスで包括的なツールセットにアクセスできます。

2020 年の Anaconda 社によるデータサイエンスに関する調査 (Anaconda Survey) によると、回答者は仕事の時間の 66% がデータの読み込み、クレンジング、可視化に費やされていると答えています。データが指数関数的に増加し続ける中、データをより迅速に変換、分析、可視化するツールがさらに重要になっています。

SageMaker Studio と統合された SageMaker Data Wrangler では、300 種類以上の組み込み関数が利用でき、データ変換時間の短縮と、データに関するインサイトの生成を支援します。SageMaker Studio は、Amazon EMR クラスター上で実行されている Apache Spark と Studio ノートブックの統合による、大規模なデータ処理もサポートしています。また、AWS Glue Interactive Sessions が管理するサーバーレスの Apache Spark ランタイム環境を使用して、Studio ノートブックから、大規模データをインタラクティブに処理することもできます。

SageMaker Studio は、SageMaker Debugger によるモデルのデバッグとプロファイリングに役立つだけでなく、実験やトライアルに関連する詳細を自動的に追跡してグラフ化することで、データサイエンティストの生産性を向上させます。SageMaker Clarify を使用すると、データサイエンティストはデータやモデルのバイアスを特定し、特定の予測の理由(説明可能性)についてのインサイトを得ることができます。

これらの機能を活用するために必要なスキルを身に付けることは、オンプレミスの機械学習から AWS クラウドに移行する企業や、SageMaker を使用してクラウドネイティブソリューションを構築する企業にとって重要です。

3 日間の新クラスルームコースについて

「Amazon SageMaker Studio for Data Scientist」 は上級レベルの 3 日間のコースで、専門の AWS インストラクターと一緒にSageMaker Studio を使用して ML モデルをより迅速に構築、トレーニング、反復する方法を学習します。

トレーニングでは、ML タスクの時間を節約する 5 つの主要スキルを学ぶことができます。

  • SageMaker Data Wrangler の組み込み変換を使用して特徴量エンジニアリングを行い、SageMaker Feature Store を使用してそれらの特徴量を共有する方法
  • 組み込みアルゴリズム、SageMaker AutoPilot、SageMaker Debugger、自動モデルチューニングを使用してモデルをより速く構築する方法
  • SageMaker Experiments を使用してモデルトレーニングに関連するさまざまなトライアルのパフォーマンスを比較し、SageMaker モデルレジストリでトラックする方法
  • SageMaker Clarify を使用してデータとモデル内のバイアスを特定する方法
  • SageMaker Pipelines を使用してモデル構築ワークフローを自動化する方法

このコースは、特徴量エンジニアリングからモデル構築、トレーニング、チューニング、そしてデプロイ、推論、モニタリングへと続く ML ライフサイクルをたどります。10 個のラボを通して、Amazon SageMaker Studio の 8 つの主要な機能について学びます。

さらに、AWS インストラクターのインタラクティブなセッションでは、SageMaker Studio ユーザーインターフェイス、SageMaker AutoPilot、および SageMaker Model Monitor などについても説明します。最後に、SageMaker Python SDK と SageMaker Studio についての理解度をテストするための 7 つのチャレンジを含んだハンズオンラボが用意されています。各課題の難易度を、ヒントなし、ヒントのみ、または詳細なガイド付きから選択できます。

このコースを最大限に活用するには、学習者に 1 年以上の ML の経験と Amazon SageMaker に関する基礎知識と、AWS の基礎知識があることをお勧めします。AWS Technical Essentials コースを修了することで、AWS の基礎知識の要件を満たすことができます。

ML の経験や Amazon SageMaker に関する基礎知識がない方は、事前に中級レベルの機械学習関連のコースを修了することもお勧めです。

中級レベルの機械学習関連コース

  • The Machine Learning Pipeline on AWS
    このコースでは、機械学習 (ML) パイプラインを使用して、ビジネス上の問題を解決する方法を学びます。4日間のトレーニングは、機械学習の種類や、モデル・特徴量・アルゴリズムといった機械学習の基本の解説から始まり、問題の定式化、データの前処理、モデルトレーニングなどの機械学習パイプラインの各フェーズで発生するタスクと、タスクを実行するための Amazon SageMaker の機能を学ぶことができます。機械学習入門者や、Amazon SageMaker について詳しく学びたい方にお勧めのトレーニングです。本コースを受講することで、新コースの受講前提である ML の経験や Amazon SageMaker に関する基礎知識の習得が可能です。
  • Practical Data Science with Amazon SageMaker
    このコースは、顧客の解約を予測するというユースケースを題材に、Amazon SageMaker を使用したモデル構築、トレーニング、チューニング、およびデプロイの実践方法をハンズオン形式で学習します。コースの期間は1日で、既に機械学習の知識があり、Amazon SageMaker の機能を体験したい方や、機械学習モデルの開発を短時間で体験してみたい方にお勧めです。新コース受講の前提知識である SageMaker の基礎知識の習得にもお勧めです。
  • MLOps Engineering on AWS
    このコースは DevOps のプラクティスを機械学習に適用し、モデルの構築、トレーニング、およびデプロイを迅速化・効率化する方法を学習します。コースの期間は3日間です。新コースと比較すると、このコースの目標は MLOps に特化しており、MLOps が必要になる背景やメリットといった観点から、MLOps の組織・プラクティス・ツールに関するベストプラクティスをについて詳しく学ぶことができます。このコースには、オープンソースを含めた、複数の MLOps 自動化ソリューションについての比較も含まれています。

コース開催予定

本ブログの中で紹介している新コース「Amazon SageMaker Studio for Data Scientists」は、2024年2月から日本語クラスも提供開始予定です。Amazon SageMaker Studio を活用して、データサイエンスタスクの生産性を向上させる方法に興味がある方は、ぜひご受講を検討いただければと思います。AWS Training & Certification で開催日の検索とお申し込みが可能です (今後のコースの開催予定の検索)。コースの期間は3日間、直近の開催は2024年2月、5 月で下記リンクからお申込みいただけます。お待ちしております。

この記事の執筆および翻訳は Technical Instructor の佐中晋が担当しました。