データサイエンティスト向け Amazon SageMaker

機械学習ライフサイクルのための統合開発環境 (IDE)

1 か月あたり 250 時間の ml.t3.medium

最初の 2 か月間、Studio ノートブックで AWS 無料利用枠をご利用いただけます

構造化データソースと非構造化データソースからのデータへのアクセス

専用ツールで生産性を向上

数回クリックするだけのフルマネージド Jupyter Notebook

仕組み

データサイエンスは、ビジネスにとって意味のあるインサイトを抽出するためのデータの研究です。何が起こったのか、なぜ起こったのか、何が起こるのかなどの問題提起をし、それに答えます。機械学習 (ML) は、従来の分析ではルールベースのロジックでは簡単に解決できない問題を機械が解決できるようにするため、データサイエンスに不可欠です。機械学習はデータを分析し、例から学習してパターンを発見します。 その後、マシンはパターンを使用して未知のインスタンスを認識できます。Amazon SageMaker は、何万もの顧客が利用する幅広い機械学習機能のセットを提供して、データにアクセスして分析し、高品質の機械学習モデルを構築、トレーニング、デプロイできるようにしています。全体として、データサイエンスチームは Amazon SageMaker を使用して最大 10 倍の生産性を上げることができます。

データサイエンティスト向け Amazon SageMaker

準備

機械学習のデータを数分で準備する

SageMaker Data Wrangler のデータ選択ツールを使用すると、Amazon Athena、Amazon Redshift、AWS Lake Formation、Amazon Simple Storage Service (S3)、Amazon SageMaker Feature Store などの複数のデータソースからデータをすばやく選択できます。データソースのクエリを記述し、さまざまなファイル形式から SageMaker に直接データをインポートし、SageMaker Data Wrangler の可視化テンプレートと組み込みのデータ変換を使用して、用意されたデータが正確な ML モデルになるようにすることができます。

詳細はこちら »
機械学習のデータを数分で準備する

低レイテンシーの Feature Store

機械学習機能を保存、更新、取得、共有するためのフルマネージドリポジトリである SageMaker Feature Store は、トレーニング用のバッチ機能、推論用のリアルタイム機能でまったく同じ機能を提供するため、機能の一貫性を保つためにコードを記述する必要はありません。 新しい機能を簡単に追加したり、既存の機能を更新したり、トレーニング用に機能をバッチで取得したり、リアルタイムでの推論のためにミリ秒単位の 1 桁のレイテンシーで同じ機能を取得したりできます。

詳細はこちら »
低レイテンシーの Feature Store

ノートブックを使用したスケーラブルなデータ準備

SageMaker Studio のノートブックから、Amazon EMR で動作する Apache Spark データ処理環境を、数クリックで視覚的にブラウズ、発見、接続することができます。接続後は、データのクエリ、探索、可視化をインタラクティブに行い、SQL、Python、Scala などのお客様が選択した言語を使用して Spark ジョブを実行し、エンドツーエンドのデータ準備と機械学習ワークフローを構築することができます。

詳細はこちら »
ノートブックを使用したスケーラブルなデータ準備

データのラベル付け

Amazon SageMaker のデータラベリングにより、画像、テキストファイル、動画などの raw データを識別し、有益なラベルを追加して、機械学習モデル用の高品質のトレーニングデータセットを作成できます。

詳細はこちら »
データラベリング

構築

ワンクリック Jupyter ノートブック

Amazon SageMaker Studio ノートブックは、ワンクリックですばやくスピンアップができる Jupyter ノートブックです。根本となるコンピューティングリソースは完全に伸縮自在であるため、使用可能なリソースの量を簡単に増減させることができ、変更は作業を中断することなくバックグラウンドで自動的に反映されます。ノートブックはワンクリックで共有でき、同僚は同一の場所に保存されるまったく同じノートブックを取得できます。

詳細はこちら »
ワンクリック Jupyter ノートブック

組み込みアルゴリズム

Amazon SageMaker は、推論をすばやくトレーニングして実行するために使用できる、あらかじめ構築されたコンテナイメージで利用可能な 15 を超える組み込みアルゴリズムを提供します。

使用を開始する »
組み込みアルゴリズム

あらかじめ構築されたソリューションとオープンソースモデル

Amazon SageMaker JumpStart は、数回クリックするだけでデプロイできる、あらかじめ構築されたソリューションを使用して、機械学習をすばやく開始するのに役立ちます。SageMaker JumpStart は、150 を超える人気のオープンソースモデルのワンクリックデプロイと微調整もサポートしています。

使用を開始する »
あらかじめ構築されたソリューションとオープンソースモデル

主要なフレームワーク向けに最適化

Amazon SageMaker は、TensorFlow、Apache MXNet、PyTorch など、多くの一般的な深層学習フレームワーク向けに最適化されています。フレームワークは、最新バージョンにおいて常に最新の状態であり、AWS でのパフォーマンスのために最適化されています。これらのフレームワークは手動でセットアップする必要がなく、組み込みのコンテナ内で使用できます。

使用を開始する »
主要なフレームワーク向けに最適化

トレーニング

バイアスを検出し、予測を理解する

Amazon SageMaker Clarify は、データ準備中およびトレーニング後のバイアス検出を通じてモデルの品質を向上させるためのデータを提供します。SageMaker Clarify は、モデルの説明可能性レポートも提供するため、利害関係者はモデルが予測を行う方法と理由を確認できます。

詳細はこちら »
バイアスを検出し、予測を理解する

トレーニングの実行を整理、追跡、評価する

Amazon SageMaker Experiments は、トレーニングの入力パラメータ、構成、結果を自動的にとらえ、「実験」として保存します。ユーザーは、アクティブな実験結果を参照したり、性質別に前回の実験結果を検索したり、あるいは、その結果とともに前回の実験を検証、または実験結果を視覚的に比較できます。

詳細はこちら »
トレーニングの実行を整理、追跡、評価する

問題の検出とデバッグを行う

Amazon SageMaker Debugger は、メトリクスをリアルタイムでとらえるため、モデルを本番環境にデプロイする前にパフォーマンスの問題をすばやく修正できます。

詳細はこちら »
問題の検出とデバッグを行う

デプロイ

モデルを継続的にモニタリング

Amazon SageMaker Model Monitor は、モデルとコンセプトの変動を自動的に検出し、問題の原因を特定するのに役立つ詳細なアラートを提供します。これにより、時間の経過とともにモデルの質を改善することができます。SageMaker でトレーニングされたすべてのモデルは、SageMaker Studio で収集と表示が可能な主要メトリクスを出します。

詳細はこちら »
モデルを継続的にモニタリング

簡単なデプロイオプション

Amazon SageMaker は、リアルタイムかバッチかを問わず、ユースケースのニーズを満たす機械学習インフラストラクチャとモデルデプロイオプションの幅広い選択肢を提供するため、機械学習モデルを大規模に簡単にデプロイできます。SageMaker は、低レイテンシー (数ミリ秒) と高スループット (1 秒あたり数十万の推論リクエスト) から、自然言語処理 (NLP) やコンピュータビジョン (CV) などのユースケースの長時間実行推論に至るまで、推論要件の全範囲をサポートします。

詳細はこちら »
簡単なデプロイオプション

開始方法

Amazon SageMaker Studio の詳細

ウェブページを訪問する »

機械学習を学ぶ

構築を開始する »

ご不明な点がありますか?

リソースを詳しく確認する »

AWS の詳細を見る