Amazon SageMaker ノートブック

データ探索と機械学習モデル構築のためのフルマネージド型ノートブック

クラウドでフルマネージド型 Jupyter Notebook を使用して、機械学習開発を迅速に開始できます。

クラウド内のコンピューティング最適化インスタンスと GPU 高速インスタンスを幅広く選択して、コンピューティングリソースをスケールアップまたはスケールダウンします。

同じノートブックを一緒に編集することで、機械学習ライフサイクルのすべてのステップでチームと効率的に共同作業できます。

Spark、NumPy、Scikit-learn などの一般的なフレームワークやパッケージの最適化により、データから洞察を得るまでの時間が最大 2 倍速くなります。

Amazon SageMaker は、データ探索と機械学習モデル構築のための 2 種類のフルマネージド型 Jupyter Notebook を提供します。Amazon SageMaker Studio ノートブックとAmazon SageMaker ノートブックインスタンスです。

SageMaker Studio ノートブック

SageMaker やその他の AWS サービスの専用機械学習ツールと統合された、すぐに開始できるコラボレーションノートブックです。これは、Amazon EMR の Spark を使用したペタバイト規模のデータ準備から、モデルのトレーニングやデバッグ、実験の追跡、モデルのデプロイとモニタリング、パイプラインの管理まで、機械学習開発のすべてを機械学習用の完全統合開発環境 (IDE) である Amazon SageMaker Studio で行います。作業を中断することなく、コンピューティングリソースを簡単にダイヤルアップ/ダウンできます。共有可能なリンクでノートブックを簡単にチームで共有したり、1 つのノートブックを同時に共同編集することも可能です。

SageMaker Studio ノートブックの使用を開始する

Amazon SageMaker Studio ノートブックを使用して機械学習モデルを大規模に構築する (1:17)

Amazon SageMaker ノートブックインスタンス

Amazon SageMaker コンソールのスタンドアロン、フルマネージド型 Jupyter Notebook インスタンス。GPU による高速コンピューティングをはじめ、クラウド上で利用可能な最も幅広いコンピューティングリソースから選択し、信頼できる最新バージョンのオープンソースソフトウェアで作業することができます。

SageMaker ノートブックインスタンスの使用を開始する

次世代の SageMaker ノートブックのご紹介 (1:42)

仕組み

  • SageMaker Studio ノートブック
  • Amazon SageMaker Studio ノートブックの仕組み
  • SageMaker ノートブックインスタンス
  • Amazon SageMaker ノートブックの仕組み

主な特徴

SageMaker Studio ノートブック

SageMaker ノートブックインスタンス

クイックスタート
Studio 内のフルマネージド型 Jupyter Notebook にすばやくアクセスできます。SageMaker Studio ノートブックには、AWS に最適化された TensorFlow と PyTorch の深層学習環境が事前構成されており、モデルの構築を開始できます。

使い慣れた Jupyter Notebook をクラウドで利用可能
フルマネージド型 SageMaker サービスで、使い慣れた信頼できる Jupyter および JupyterLab Notebook を利用できます。コンピューティングリソースの設定、データサイエンスや機械学習パッケージのアップグレード、セキュリティパッチの適用といった面倒な作業は必要ありません。SageMaker ノートブックインスタンスを使用すると、コンピューティング環境を最新のオープンソースソフトウェアで安全かつ最新の状態に保ちながら、機械学習に完全に集中することができます。

大規模なデータを準備する
データエンジニアリング、分析、機械学習のための統合されたノートブック環境で、データワークフローを簡素化します。SageMaker Studio ノートブックから直接 Amazon EMR クラスターや AWS Glue インタラクティブセッションを作成、閲覧、接続します。ノートブックから直接 Spark UI などの使い慣れたツールを使用して、Spark ジョブのモニタリングやデバッグを行うことができます。Amazon SageMaker Data Wrangler を搭載した組み込みのデータ準備機能をノートブックから直接使用します。これにより、データを可視化し、データ品質の問題を特定し、推奨ソリューションを適用して、コードをまったく記述することなくデータ品質とモデルの精度を向上させることができます。

AWS のパフォーマンスと拡張性の獲得
AWS によってパフォーマンスに合わせて最適化された事前にパッケージ化されたデータサイエンスおよび機械学習フレームワークにより、データからインサイトを得るまでの時間を短縮します。クラウド内のコンピューティング最適化インスタンスと GPU 高速インスタンスの幅広い選択肢から選択し、リソースを拡張することができます。組み込みの SageMaker Python SDK を使用して、SageMaker 上でモデルをトレーニングおよびデプロイします。Amazon CloudWatch で Jupyter のログを取得して、イベントやメトリクスの追跡、異常な動作の検出、アラームの設定、使用パターンの発見を行います。

エラスティックコンピューティング
作業を中断することなく、基盤となるコンピューティングリソースをスケールアップまたはスケールダウンしたり、共有永続ストレージを使用してコンピューティングリソースを切り替えたりすることができます。機械学習向けの最も強力な GPU インスタンスを含む、AWS が提供する最も幅広いコンピューティングリソースから選択します。

導入事例をご覧ください
構築方法のアイデアをお探しですか? ノートブックインスタンスには、SageMaker が提供する 200 以上のサンプルノートブックと、SageMaker を使用する機械学習ソリューションの適用方法を示すコードが含まれています。

ノートブックコードから本番環境に対応したジョブへの自動変換
ノートブックが選択されると、SageMaker Studio ノートブックはノートブック全体のスナップショットを取得し、依存関係をコンテナにパッケージ化し、インフラストラクチャを構築します。そして、プラクティショナーが設定したスケジュールでノートブックを自動ジョブとして実行し、ジョブ完了時にインフラストラクチャをプロビジョニング解除します。この自動化により、ノートブックの本番環境への移行にかかる時間を数週間から数時間に短縮できます。 

チーム向けに構築
AWS IAM アイデンティティセンター (AWS Single Sign-On の後継) を使用して、SageMaker Studio ノートブックへのチームアクセスを設定します。SageMaker Studio のコストや使用状況をモニタリングするために、プラットフォーム管理者とビジネスリーダーで別々の環境を構築します。共同作業とコミュニケーションを効率化するために、チームがリアルタイムでノートブックを読み、編集し、実行できる共有スペースを作成します。チームメイトで結果を確認し合うことで、情報をやり取りすることなく、モデルのパフォーマンスを即座に理解することができます。BitBucket や AWS CodeCommit などのサービスのサポートが組み込まれているため、チームは異なるノートブックのバージョンを簡単に管理し、経時的に変更を比較できます。すべてのリソースは自動的にタグ付けされるため、AWS Budgets や AWS Cost Explorer などのツールを使用してコストのモニタリングと予算計画を簡単に行うことができます。

カスタマイズ可能
カスタム Docker イメージを使用して、独自のノートブック開発環境を SageMaker Studio に導入します。ライフサイクル設定を使用して、ノートブック環境を自動化し、チーム用にカスタマイズすることができます。たとえば、カスタムパッケージやノートブック拡張機能のインストール、データセットのプリロード、アイドル状態のインスタンスのシャットダウンを自動化することが可能です。

お客様

AstraZeneca

Amazon SageMaker Studio を使用することで、AstraZeneca は大量のデータを分析するためのソリューションを迅速に展開し、データサイエンティストの手作業によるワークロードを軽減しながら洞察を迅速化することができました。これは、世界中の人々の人生を一変させる医薬品を発見し、開発するというアストラゼネカの使命にとってきわめて重要です。

「多くの手動プロセスを作成するのではなく、Amazon SageMaker Studio 内で簡単に機械学習開発プロセスのほとんどを自動化できます」

Cherry Cabading 氏、グローバルシニアエンタープライズアーキテクト – AstraZeneca

導入事例を読む

Vanguard
「Vanguard のデータサイエンティストとデータエンジニアが、分析と機械学習のために単一のノートブックで共同作業できるようになりました。Amazon SageMaker Studio に Spark、Hive、Presto との統合機能が組み込まれ、すべて Amazon EMR で動作するようになったため、開発チームの生産性が向上しました。この単一の開発環境によって、私たちのチームは機械学習モデルの構築、トレーニング、デプロイに集中することができます。」

Doug Stewart 氏、データおよび分析担当シニアディレクター – Vanguard

Provectus
「お客様が Amazon SageMaker Studio のノートブックから直接 Spark、Hive、Presto ワークフローを実行できるように、Amazon SageMaker Studio から直接 Amazon EMR クラスターを作成・管理する機能を待ち望んでいました。Amazon SageMaker がSpark や機械学習ジョブの管理を簡素化するこの機能をネイティブに構築したことを嬉しく思います。これにより、お客様のデータエンジニアとデータサイエンティストがより効果的に連携し、インタラクティブなデータ分析を行い、EMR ベースのデータ変換による機械学習パイプラインを開発することが可能になります。」

Stepan Pushkarev 氏、CEO – Provectus

チュートリアルを始めましょう

このステップバイステップのチュートリアルに従い、Amazon SageMaker を使用して推論用のモデルをデプロイしてください。

詳細 
Amazon Pinpoint の開始方法
セルフペースラボを体験してみてください

このハンズオンラボでは、Amazon SageMaker を使用して ML モデルを構築、トレーニング、デプロイする方法を学習します。

詳細 
コンソールで構築を開始する

AWS マネジメントコンソールから Amazon SageMaker を使った構築を開始しましょう。

サインイン