Amazon SageMaker ノートブック

データ探索と ML モデル構築のための JupyterLab におけるフルマネージドノートブック

SageMaker ノートブックとは何ですか?

Amazon SageMaker Studio からフルマネージド型 JupyterLab を数秒で起動できます。ノートブック、コード、データには統合開発環境 (IDE) を使用してください。IDEのクイックスタートコラボレーションノートブックを使用すると、SageMaker やその他の AWS サービスの専用 ML ツールにアクセスして、Spark on Amazon EMR によるペタバイト規模でのデータ準備から、モデルのトレーニングとデバッグ、モデルのデプロイと監視、パイプラインの管理まで、すべてを1つのウェブベースのビジュアルインターフェイスで行うことができます。作業を中断することなく、コンピューティングリソースを簡単にダイヤルアップ/ダウンできます。

SageMaker ノートブックの利点

Amazon SageMaker Studio でフルマネージド型 JupyterLab を数秒で起動できます。SageMaker Studio には、SageMaker ディストリビューションがあらかじめ設定されています。これには、PyTorch、TensorFlow、Keras などの深層学習フレームワークや、NumPy、scikit-learn、panda などの一般的な Python パッケージを含む、ML 用の一般的なパッケージが含まれます。
クラウド内のコンピューティング最適化インスタンスと GPU 高速インスタンスを幅広く選択して、コンピューティングリソースをスケールアップまたはスケールダウンします。
生成系 AI を使用するコーディング支援ツールとセキュリティツールを使用して、質の高いコードをより迅速に記述できます。Amazon CodeWhisperer を使用してソースコードの生成、デバッグ、説明を行い、Amazon CodeGuru を使用してセキュリティスキャンとコード品質スキャンを実施します。
統合アナリティクスと ML ワークフローを同じノートブックで構築できます。Amazon EMR と AWS Glue のサーバーレスインフラストラクチャで、インタラクティブな Spark ジョブをノートブックから直接実行できます。インライン Spark UI を使用して、ジョブの監視とデバッグをより迅速に行えます。いくつかの簡単なステップで、ノートブックをジョブとしてスケジュールすることで、データ準備を簡単に自動化できます。

ML を大規模に構築

クイックスタート

スタジオでフルマネージド型の JupyterLab を数秒で起動できます。SageMaker Studio には、PyTorch、TensorFlow、Keras などの深層学習フレームワーク、NumPy、scikit-learn、panda などの一般的な Python パッケージを含む ML 用の一般的なパッケージが含まれる、ビルド済みの SageMaker ディストリビューションがあらかじめ設定されています。

エラスティックコンピューティング

作業を中断することなく、基盤となるコンピューティングリソースをスケールアップまたはスケールダウンしたり、共有永続ストレージを使用してコンピューティングリソースを切り替えたりすることができます。機械学習向けの最も強力な GPU インスタンスを含む、AWS が提供する最も幅広いコンピューティングリソースから選択します。

ML 開発の生産性を向上

データ準備

統合環境でデータワークフローを簡素化します。JupyterLab から直接 Amazon EMR クラスターと AWS Glue インタラクティブセッションを作成、閲覧、接続できます。組み込みのデータ準備機能を使用してデータを視覚化し、データ品質を向上させます。

ノートブックの仕事

SageMaker ノートブックジョブを使用して、オンデマンドまたはスケジュールに従って実行する非対話型ジョブを作成できます。直感的なユーザーインターフェイスまたは SageMaker Python SDK を使用して、JupyterLab から直接ジョブをスケジュールできます。ノートブックが選択されると、SageMaker Studio ノートブックはノートブック全体のスナップショットを取得し、依存関係をコンテナにパッケージ化し、インフラストラクチャを構築します。そして、プラクティショナーが設定したスケジュールでノートブックを自動ジョブとして実行し、ジョブ完了時にインフラストラクチャをプロビジョニング解除します。この自動化により、ノートブックの本番環境への移行にかかる時間を数週間から数時間に短縮できます。SageMaker ノートブックジョブは Amazon SageMaker pipelines のネイティブステップとしても利用できるため、数行のコードで CI/CD デプロイメントの依存関係を持つノートブックを複数ステップのワークフローに自動化できます。

AI 搭載ツール

Amazon Q Developer は、SageMaker の機能に関する「ハウツー」ガイダンス、コード生成に関する支援、および JupyterLab 環境でのトラブルシューティングのサポートを提供します。自然言語で質問するだけで (例:「リアルタイム推論のために SageMaker エンドポイントにモデルをデプロイするにはどうすればよいですか?」)、Amazon Q Developer は、使用を開始するためのステップバイステップのステップとコードを提供します。コードの実行中にエラーが発生した場合は、Amazon Q Developer がいつでもサポートします。エラーを修正するように依頼するだけで、問題をデバッグして解決するための詳細なステップが提供されます。