Amazon Web Services ブログ

Amazon SageMaker JumpStart で事前構築済みモデルと機械学習ソリューションへのアクセスを簡素化する

本日、Amazon SageMaker の新機能である Amazon SageMaker JumpStart の提供を開始したことを発表します。人気の高いモデルのコレクション (別名「モデルズー」) および一般的なユースケースを解決するエンドツーエンドのソリューションに、ワンクリックでアクセスして機械学習ワークフローを高速化することができます。

近年、機械学習はビジネスプロセスの改善と自動化に役立つ技術であることが証明されています。実際、過去データでトレーニングされたモデルは、金融サービス、小売、製造、通信、ライフサイエンスといった幅広い業界において結果を高精度に予測できます。しかし、これらのモデルの使用には、データセットの準備、アルゴリズムの選択、モデルのトレーニング、精度の最適化、本番稼働環境へのデプロイ、パフォーマンスの経時的モニタリングといった、一部の科学者やデベロッパーだけが有しているスキルと経験が必要になります。

モデルの構築プロセスを簡素化するために、機械学習コミュニティは、モデルズーと呼ばれる、人気の高いオープンソースライブラリによるモデルのコレクションを作成しました。モデルズーは多くの場合、リファレンスデータセットで事前トレーニングされています。例えば、TensorFlow HubPyTorch Hub では、デベロッパーは多数のモデルをダウンロードして、コンピュータビジョンや自然言語処理などのアプリケーションに統合することができます。

モデルのダウンロードは第一歩にすぎません。デベロッパーはその後、TensorFlow Serving および TorchServe モデルサーバーといったさまざまなツール、または独自のカスタムコードを使用してモデルをデプロイし、評価とテストを行う必要があります。モデルを実行したら、デベロッパーは受信データの適切な形式を把握する必要があります。これは以前からの悩みの種です。毎回ここで頭を抱えているのは私だけではないでしょう。

もちろん、完全な機械学習アプリケーションには通常、多くの不確定要素があります。データを事前処理して、バックエンドから取得した追加データでエンリッチメントを行い、モデルに投入する必要があります。予測は多くの場合、後処理され、さらなる分析や視覚化を行うために保存されます。モデルズーは有用ですが、役に立つのはモデリング段階でのみです。完全な機械学習ソリューションが提供できるようになるまでにデベロッパーが行うべき作業は、まだたくさんあります。

そのため、機械学習エキスパートには、プロジェクトのバックログが殺到します。一方で経験の少ないプラクティショナーは、開始するまでに苦労します。これらの障壁は大変苛立たしいものです。お客様からもこの問題への対処を求められました。

Amazon SageMaker JumpStart のご紹介
Amazon SageMaker JumpStart は、機械学習用の完全な統合開発環境 (IDE) である Amazon SageMaker Studio に統合されているため、モデルやソリューションなどを直感的に見つけることができます。ローンチ時の SageMaker JumpStart には、以下が含まていれます。

  • 不正検出や予知保全といった、一般的な機械学習ユースケースに対応する 15 以上のエンドツーエンドソリューション
  • コンピュータビジョン (画像分類、物体検出) および自然言語処理 (文章分類、質問応答) に対応する、TensorFlow Hub および PyTorch Hub で公開されている 150 以上のモデル
  • Amazon SageMaker で利用可能な組み込みアルゴリズムのサンプルノートブック

SageMaker JumpStart には、障害の排除と学習のためのノートブック、ブログ、動画チュートリアルも用意されています。コンテンツには Amazon SageMaker Studio 内で簡単にアクセスできるため、機械学習をよりすばやく開始できます。

ワンクリックで、ソリューションとモデルをデプロイできます。フルマネージド型のインフラストラクチャであるため、デプロイ中は紅茶やコーヒーを楽しめます。Amazon SageMaker Studio で簡単に利用できるノートブックやサンプル予測コードがあるおかげで、数分後にはテストを開始できます。もちろん、独自のデータを使用するように変更することも簡単にできます。

SageMaker JumpStart では、経験豊富なプラクティショナーも初心者の方も、モデルやソリューションをきわめて簡単にすばやくデプロイして評価できるため、作業量が数日分または数週間分削減されます。SageMaker JumpStart は、実験から本番稼働までのパスを大幅に短縮することで、機械学習を活用したイノベーションを加速します。特に、機械学習ジャーニーの初期段階にあり、まだ多くのスキルや経験を蓄積していない組織やチームに適しています。

それでは、SageMaker JumpStart の仕組みをお見せしましょう。

Amazon SageMaker JumpStart を使用してソリューションをデプロイする
SageMaker Studio を開き、左側の [JumpStart] アイコンを選択します。新しいタブが開き、利用可能なすべてのコンテンツ (ソリューション、モデルなど) が表示されます。

コンピュータビジョンを使用して製品の欠陥を検出したいと考えているとします。機械学習は解決策になるでしょうか?

利用可能なソリューションのリストを参照すると、製品の欠陥を検出できるソリューションが 1 つあります。

それを開くと、解決する問題のタイプ、デモで使用されるサンプルデータセット、関連する AWS のサービスといった詳細が表示されます。

SageMaker のスクリーンショット

このソリューションはワンクリックでデプロイできます。内部では、AWS CloudFormation が組み込みのテンプレートを使用して、適切な AWS リソースをすべてプロビジョンします。

数分後、ソリューションがデプロイされます。また、そのノートブックを開くことができます。

SageMaker のスクリーンショット

ノートブックはすぐに SageMaker Studio で開きます。デモを実行すると、機械学習が製品の欠陥を検出するのにどのように役立つかを理解できます。簡単に自分のデータセットを使った実験ができるため、これは私自身のプロジェクトにとっても適切な開始点です (下の画像はクリックで拡大できます)。

SageMaker のスクリーンショット

ソリューションの使用を完了したら、ワンクリックで AWS CloudFormation がすべてのリソースをクリーンアップします。AWS リソースをアイドル状態のまま保持し続けずに済みます。

SageMaker のスクリーンショット

それでは、モデルを見てみましょう。

Amazon SageMaker JumpStart を使用してモデルをデプロイする
SageMaker JumpStart には、TensorFlow Hub と PyTorch Hub で利用可能なモデルの大規模なコレクションが含まれています。これらのモデルは、リファレンスデータセットで事前トレーニングされています。これらを直接使用して、幅広いコンピュータビジョンおよび自然言語処理タスクに対処することができます。また、これらのモデルを独自のデータセットでファインチューニングして、精度を高めることも可能です。この手法は転移学習と呼ばれます。

SageMaker のスクリーンショット
ここでは、質問応答のトレーニングが行われた、あるバージョンの BERT モデルを選択します。そのままデプロイすることも、ファインチューニングすることもできます。説明を簡潔にするため、ここでは前者を選択します。[Deploy (デプロイ)] ボタンをクリックするだけです。

SageMaker のスクリーンショット

数分後、フルマネージド型のインフラストラクチャを使用したリアルタイムエンドポイントにモデルがデプロイされました。

SageMaker のスクリーンショット

テストしてみましょう。 [Open Notebook (ノートブックを開く)] をクリックするとサンプルノートブックが起動します。すぐに実行してモデルをテストできます。その際、コードを変更する必要はありません (下の画像はクリックで拡大できます)。ここで、私は次の 2 つの質問 (「南カリフォルニアは一般的に何と略されますか?」と「『007 スペクター』を監督したのは誰ですか?」) をして、答えが含まれているいくつかのコンテキストを渡します。2 つの質問に対して、BERT モデルはそれぞれ「socal」、「Sam Mendes」という正しい答えを返します。

SageMaker のスクリーンショット

テストが終わったら、ワンクリックでエンドポイントを削除し、料金の発生を停止することができます。

使用を開始する
ご覧のとおり、機械学習スキルがほとんどなくても、あるいはまったくなくても、SageMaker JumpStart を使用すれば、モデルとソリューションをほんの数分できわめて簡単にデプロイすることができます。

この機能は、SageMaker Studio を利用できるすべてのリージョンで、追加料金なしですぐに使用を開始できます。

ぜひお試しください。また、ご意見をお聞かせください。

フィードバックはいつでも大歓迎です。通常の AWS サポート連絡先、または SageMaker 用の AWS フォーラム から送信できます。

– Julien

初期のテスト段階で真摯に協力してくれた同僚の Jared Heywood に感謝を述べます。