Amazon Web Services ブログ

Amazon SageMaker Studio で ML インスタンスをオンザフライで選択する方法



アマゾン ウェブ サービス (AWS) は、Amazon SageMaker Studio 内で、ノートブックの一般提供を開始しました。Amazon SageMaker Studio は、機械学習 (ML) インスタンスタイプのオンザフライ選択、最適化されあらかじめパーケージ化された Amazon SagMaker イメージ、および Jupyter ノートブックの共有をサポートしています。作業を中断したりインフラを管理したりすることなく、例えば ml.t3.medium から ml.p3.2xlarge へ、あるカーネルを使用するインスタンスタイプのノートブックで、別のインスタンスタイプに切り替えることができます。インスタンスの移動はシームレスで、インスタンスの起動中も作業を継続できます。Amazon Sagemaker Studio ドメイン用に作成された Amazon Elastic File System (Amazon EFS) により、新しいインスタンスでノートブックとデータをすぐに利用できます。ドメイン内のすべてのユーザーは、EFS ボリューム上に作成されたホームディレクトリを取得します。

Amazon Sagemaker Studio でノートブックを使用

ML ワークフロー用に完全に統合された開発環境である Amazon SageMaker Studio を使用してノートブックにアクセスできます。Amazon SageMaker Studio のご利用を開始すると、さまざまなインスタンスタイプの柔軟姓を活用できるようになります。

次のスクリーンショットは、2 つのノートブックが並んで動作している様子を示しています。

左側のノートブックでは、2 vCPU と4 GiB のメモリを搭載するインスタンスを使用して、データサイエンス SageMaker イメージ上で Python 3 Jupyter ノートブックを実行しています。右側のノートブックでは、4 vCPU と16 GiB のメモリを搭載する GPU インスタンス上で PyTorch GPU の最適化された SageMaker イメージを実行しています。これら 2 つのノートブックは異なるインスタンス上で実行されており、それぞれが他方のノートブックを停止することなく、そのインスタンスのリリースをすべて使いきることができます。これにより、あるノートブックで自由にプロトタイプを作成しながら、別のインスタンスで集中的なコンピューティングを実行することができます。

Amazon SageMaker Studio でインスタンスを選択すると (別のカーネルを選択する場合と同じ方法で) 、[インスタンスの選択]ボックスが表示されます。

このダイアログには、このインスタンスと現在のインスタンスタイプを使用している現在のノートブックが表示されます。デフォルトでは、高速起動に使用できるインスタンスとして、vCPU 、GPU 、およびメモリを含むインタンスのリストが表示されます。これは、これらのインスタンスが短時間で使用できる状態にあることを意味します。[高速起動のみ] を無効にすると、Amazon SageMaker Studio でサポートされているすべての ML インスタンスのリストが表示されます。

ノートブックの新しいインスタンスタイプを選択すると、プロセスが進行中であることを示す通知が表示されます。

インスタンスの変更中も現在のノートブックを編集することはできますが、インスタンスが実行されるまでセルを使うことはできません。ただし、これはそのノートブックにのみ適用されます。その他のすべてのノートブックやその他の Amazon SageMaker Studio 機能は、中断することなく機能し続けます。上記のスクリーンショットでは、データサイエンティストが今回、分割パネルの Git プラグインを使用してノートブックに対する変更を確認しています。

Amazon SageMaker Studio には TensorFlow、MXNet、PyTorch、TensorFlow 2、Data Science、および Python 用にあらかじめ設定された Amazon SageMaker イメージが付属しています。これらのイメージは、最適化されあらかじめパーケージ化された AWS Deep Learning Containers に基づいています。Data Science イメージは、最も一般的なデータサイエンスワークフローに最適化されており、人気のある Anaconda ディストリビューション、 AWS コマンドラインインターフェイス (AWS CLI) 、および Amazon SageMaker Python SDK が含まれています。基本 Python イメージは、追加の依存関係なしで最小限の Python 3 ランタイムを提供します。

次のスクリーンショットは、起動ページを示しています。このページでは、Amazon SageMaker イメージを使用して、ノートブック、インタラクティブシェル、またはターミナルを作成できます。独立した (異なるインスタンスで実行される可能性がある) 環境でノートブック (カーネル) 、シェル、およびターミナルを起動する機能は、Amazon SageMaker Studio 独自の革新的な機能です。

Amazon SageMaker Studio では、同僚とノートブックをシームレスに共有できます。Studio 内でノートブックの共有可能なリンクを生成することができ、同僚はこのリンクを使用してノートブックを自分のworkspaceにインポートし、レビューまたは繰り返し作業を行うことができます。

次のスクリーンショットは、実行中の Amazon SageMaker Images を一覧表示するパネルを示しています。このパネルには、どのカーネルとターミナルがどのインスタンスで実行されているかも表示されます。

次の方法でイメージをシャットダウンすることができます。

  • インスタンスの追加料金が発生しないように、特定のインスタンスのすべてのイメージをシャットダウンする
  • 全ての料金の発生を停止するために、すべての実行中のイメージをシャットダウンする
  • イメージを使用しているすべてのターミナルとカーネルを終了し、実行中のイメージをシャットダウンする

実行中のターミナルとカーネルをシャットダウンしても、実行中のイメージには影響しません。

[ファイル] 、[シャットダウン] を選択すると、[シャットダウンの確認] ポップアップボックスが表示されます。[すべてをシャットダウン]を選択すると、実行中のすべてのイメージ、カーネル、ターミナル、および Jypyter サーバーを終了するのに便利です。[サーバーをシャットダウン]を選択すると、Jupyter サーバーのみがシャットダウンされます。これは、サーバーを再起動するときに最新の更新を取得する方法です。

まとめ

機械学習のための完全に統合された開発環境であるAmazon SageMaker Studio は、ノートブックベースの開発者エクスペリエンスに新しい強力な機能を追加してくれます。次のリージョンで、Amazon SageMaker Studio をお使いいただけます。

  • 米国東部 ( オハイオ )
  • 米国東部 ( バージニア北部 )
  • 米国西部 ( オレゴン )
  • 中国 ( 北京 )
  • 中国 ( 寧夏 )
  • 欧州 ( アイルランド )

今すぐ始めるには、Amazon SageMaker コンソールにアクセスするか、あるいは詳細はドキュメントをご参照ください。Amazon SageMaker Studio の右上にあるフィートバックフォーム、Amazon SageMaker 用のAWS フォーラム、または通常の AWS サポート連絡先からフィードバックをお寄せください。


著者について

David Leen は、Amazon SageMaker Studio チームのシニアソフトウェアエンジニアです。Amazon Comprehend、Amazon Translate、Amazon SageMaker アルゴリズムなどの AWS のサービスに貢献しています。科学者、ML エンジニア、データサイエンティスト向けのツールの構築に情熱を持っています。Amazonに入社する前は、ワシントン大学の計算神経科学と応用数学の博士課程で研究していました。

 

 

Japreet Singh は、Amazon SageMaker Studio チームのシニアソフトウェアエンジニアです。 2017 年の開発開始以来、Amazon SageMaker の開発に携わっており、さまざまな Project Jupyter オープンソースプロジェクトに貢献してきました。余暇には、太平洋岸北西部でハイキングやスキーを楽しんでいます。