Amazon SageMaker ノートブック

データ探索と ML モデル構築のための JupyterLab におけるフルマネージドノートブック

SageMaker ノートブックとは何ですか?

Amazon SageMaker Studio からフルマネージド型 JupyterLab を数秒で起動できます。ノートブック、コード、データには統合開発環境 (IDE) を使用してください。IDEのクイックスタートコラボレーションノートブックを使用すると、SageMaker やその他の AWS サービスの専用 ML ツールにアクセスして、Spark on Amazon EMR によるペタバイト規模でのデータ準備から、モデルのトレーニングとデバッグ、モデルのデプロイと監視、パイプラインの管理まで、すべてを1つのウェブベースのビジュアルインターフェイスで行うことができます。作業を中断することなく、コンピューティングリソースを簡単にダイヤルアップ/ダウンできます。

SageMaker ノートブックの利点

Amazon SageMaker Studio でフルマネージド型 JupyterLab を数秒で起動できます。SageMaker Studio には、SageMaker ディストリビューションがあらかじめ設定されています。これには、PyTorch、TensorFlow、Keras などの深層学習フレームワークや、NumPy、scikit-learn、panda などの一般的な Python パッケージを含む、ML 用の一般的なパッケージが含まれます。
クラウド内のコンピューティング最適化インスタンスと GPU 高速インスタンスを幅広く選択して、コンピューティングリソースをスケールアップまたはスケールダウンします。
生成系 AI を使用するコーディング支援ツールとセキュリティツールを使用して、質の高いコードをより迅速に記述できます。Amazon CodeWhisperer を使用してソースコードの生成、デバッグ、説明を行い、Amazon CodeGuru を使用してセキュリティスキャンとコード品質スキャンを実施します。
統合アナリティクスと ML ワークフローを同じノートブックで構築できます。Amazon EMR と AWS Glue のサーバーレスインフラストラクチャで、インタラクティブな Spark ジョブをノートブックから直接実行できます。インライン Spark UI を使用して、ジョブの監視とデバッグをより迅速に行えます。いくつかの簡単なステップで、ノートブックをジョブとしてスケジュールすることで、データ準備を簡単に自動化できます。

ML を大規模に構築

クイックスタート

スタジオでフルマネージド型の JupyterLab を数秒で起動できます。SageMaker Studio には、PyTorch、TensorFlow、Keras などの深層学習フレームワーク、NumPy、scikit-learn、panda などの一般的な Python パッケージを含む ML 用の一般的なパッケージが含まれる、ビルド済みの SageMaker ディストリビューションがあらかじめ設定されています。

エラスティックコンピューティング

作業を中断することなく、基盤となるコンピューティングリソースをスケールアップまたはスケールダウンしたり、共有永続ストレージを使用してコンピューティングリソースを切り替えたりすることができます。機械学習向けの最も強力な GPU インスタンスを含む、AWS が提供する最も幅広いコンピューティングリソースから選択します。

ML 開発の生産性を向上

データ準備

統合環境でデータワークフローを簡素化します。JupyterLab から直接 Amazon EMR クラスターと AWS Glue インタラクティブセッションを作成、閲覧、接続できます。組み込みのデータ準備機能を使用してデータを視覚化し、データ品質を向上させます。

ノートブックの仕事

SageMaker ノートブックジョブを使用して、オンデマンドまたはスケジュールに従って実行する非対話型ジョブを作成できます。直感的なユーザーインターフェイスまたは SageMaker Python SDK を使用して、JupyterLab から直接ジョブをスケジュールできます。ノートブックが選択されると、SageMaker Studio ノートブックはノートブック全体のスナップショットを取得し、依存関係をコンテナにパッケージ化し、インフラストラクチャを構築します。そして、プラクティショナーが設定したスケジュールでノートブックを自動ジョブとして実行し、ジョブ完了時にインフラストラクチャをプロビジョニング解除します。この自動化により、ノートブックの本番環境への移行にかかる時間を数週間から数時間に短縮できます。SageMaker ノートブックジョブは Amazon SageMaker pipelines のネイティブステップとしても利用できるため、数行のコードで CI/CD デプロイメントの依存関係を持つノートブックを複数ステップのワークフローに自動化できます。

AI 搭載ツール

Amazon CodeWhisperer は、リアルタイムでコード候補を生成する AI コーディングコンパニオンです。CodeWhisperer を使用すると、「CSV ファイルを使用して Pandas データフレームを作成する」など、特定のタスクの概要を説明するコメントを自然言語で記述できます。CodeWhisperer は、タスクを実行できる 1 つ以上のコードスニペットをノートブックに直接推奨します。Amazon CodeGuru Security は、ノートブックユーザーがインジェクションの欠陥、データ漏えい、弱い暗号方式、ノートブックセル内の暗号化漏れなどのセキュリティ上の脆弱性を検出するのに役立ちます。ノートブックに脆弱性や品質の問題が見つかると、CodeGuru は推奨事項を生成し、ユーザーが AWS のセキュリティベストプラクティスに基づいてそれらの問題を修正できるようにします。

柔軟性とカスタマイズ

チーム向けに構築

AWS IAM アイデンティティセンター (AWS Single Sign-On の後継) を使用して、SageMaker Studio ノートブックへのチームアクセスを設定します。SageMaker Studio のコストや使用状況をモニタリングするために、プラットフォーム管理者とビジネスリーダーで別々の環境を構築します。共同作業とコミュニケーションを効率化するために、チームがリアルタイムでノートブックを読み、編集し、実行できる共有スペースを作成します。チームメイトで結果を確認し合うことで、情報をやり取りすることなく、モデルのパフォーマンスを即座に理解することができます。BitBucket や AWS CodeCommit などのサービスのサポートが組み込まれているため、チームは異なるノートブックのバージョンを簡単に管理し、経時的に変更を比較できます。すべてのリソースは自動的にタグ付けされるため、AWS Budgets や AWS Cost Explorer などのツールを使用してコストのモニタリングと予算計画を簡単に行うことができます。

カスタマイズ可能

カスタム Docker イメージを使用して、独自のノートブック開発環境を SageMaker Studio に導入します。ライフサイクル設定を使用して、ノートブック環境を自動化し、チーム用にカスタマイズすることができます。

スタンドアロンノートブックインスタンス

フルマネージド型 SageMaker サービスで、使い慣れた信頼できる Jupyter および Jupyter Notebook を利用できます。コンピューティングリソースの設定、データサイエンスや機械学習パッケージのアップグレード、セキュリティパッチの適用といった面倒な作業は必要ありません。SageMaker ノートブックインスタンスを使用すると、コンピューティング環境を最新のオープンソースソフトウェアで安全かつ最新の状態に保ちながら、機械学習に完全に集中することができます。