Amazon SageMaker

機械学習モデルを大規模に構築、トレーニング、デプロイ

Amazon SageMaker は、開発者やデータサイエンティストが機械学習モデルをあらゆる規模ですばやく簡単に構築、トレーニング、デプロイできるようにするフルマネージドサービスです。Amazon SageMaker を使用すると、開発者による機械学習を通常減速させるような障害すべてを排除できます。

モデルを構築してトレーニングし、本番環境にデプロイするというプロセスは非常に複雑で多くの時間を必要とするため、ほとんどの開発者は機械学習は思っていたよりもずっと困難であると感じています。まず、トレーニングデータを収集して用意し、重要なデータセットの要素を検出する必要があります。次に、使用するアルゴリズムとフレームワークを選択する必要があります。アプローチを決定したら、予測方法をトレーニングによってモデルにティーチングしますが、これには多くのコンピューティングが必要です。その後、最適な予測を実現するようモデルを調整する必要がありますが、ほとんどの場合、これには手間と手動による労力がかかります。完全にトレーニングされたモデルを開発したら、そのモデルをアプリケーションに統合し、次いでこのアプリケーションをインフラストラクチャにデプロイしてスケールします。このような作業すべてにおいて、多くの専門知識、大量のコンピューティングやストレージ、プロセスの各部分をテストして最適化するための多くの時間が必要とされます。結局、このすべてを実行するのは不可能であるとほとんどの開発者が感じるのも不思議ではありません。

Amazon SageMaker では、開発者がこれらの各ステップを実行するのを阻む複雑性を取り除きます。Amazon SageMaker には、機械学習モデルを構築、トレーニング、デプロイするために、組み合わせても単体でも使用できるモジュールが用意されています。

Amazon SageMaker の紹介

仕組み

構築

Amazon SageMaker では、機械学習モデルの構築とトレーニングの準備がより簡単になるように、トレーニングデータにすばやく接続し、アプリケーションに最適なアルゴリズムとフレームワークを選択して、最適化するために必要なツールがすべて揃っています。Amazon SageMaker には、Amazon S3 に保存されているトレーニングデータを簡単に分析し可視化できる、ホスト型の Jupyter Notebook が含まれます。S3 のデータに直接接続するか、AWS Glue により Amazon RDS、Amazon DynamoDB、Amazon Redshift からデータを S3 に移動して、それらのデータを Notebook で分析できます。

アルゴリズムの選択に役立つように、Amazon SageMaker では、10 通りの最も一般的な機械学習アルゴリズムが事前にインストールされ最適化されています。他のどの機械学習サービスよりも、最大 10 倍高いパフォーマンスでこれらのアルゴリズムを実行できます。また、Amazon SageMaker は、最もよく使用されているオープンソースフレームワークの 2 つである TensorFlow と Apache MXNet を実行するように事前に設定されています。独自のフレームワークを使用することも可能です。

トレーニング

Amazon SageMaker コンソールを使用してワンクリックでモデルをトレーニングできます。Amazon SageMaker は、基盤となるすべてのインフラストラクチャを自動的に管理するほか、ペタバイト規模のモデルのトレーニング用に簡単にスケーリングできます。トレーニングプロセスをより高速かつ簡単にするために、Amazon SageMaker ではモデルを自動的に調整してその精度を最大限に高めます。

デプロイ

モデルのトレーニングと調整が完了したら、Amazon SageMaker を本番稼働用環境に簡単にデプロイして、新しいデータに対する予測 (推論と呼ばれるプロセス) を開始できます。Amazon SageMaker は、高パフォーマンスと高可用性の両方を実現するために、複数のアベイラビリティーゾーンに分散されている Amazon EC2 インスタンスの Auto Scaling クラスターにモデルをデプロイします。また、Amazon SageMaker には、A/B テスト機能も組み込まれており、モデルをさまざまなバージョンでテストし、試して、最良の結果を得るのに役立ちます。

Amazon SageMaker により、機械学習の難しくて手間のかかる作業が不要になり、機械学習モデルをすばやく簡単に構築、トレーニング、デプロイできます。

利点

機械学習を本番環境にすばやく移行

Amazon SageMaker により、機械学習モデルのトレーニング、調整、デプロイに必要な時間は大幅に短縮されます。また、Amazon SageMaker では高度なトレーニングやチューニングの技術すべてが管理および自動化されるため、モデルを本番環境にすばやく移行できます。

あらゆるフレームワークやアルゴリズムを選択可能

Amazon SageMaker では機械学習のすべてのアルゴリズムとフレームワークをサポートしているため、既に使い慣れているテクノロジーを使用できます。Amazon SageMaker には Apache MXNet と TensorFlow が事前にインストールされており、さまざまな組み込みのハイパフォーマンス機械学習アルゴリズムを利用できます。別のフレームワークまたはアルゴリズムを使ってトレーニングする場合は、独自の Docker コンテナを使用できます。

1-Click トレーニングおよびデプロイ

Amazon SageMaker コンソールでワンクリックするか、簡単な API コールを行ってモデルのトレーニングを開始できます。トレーニングが完了し、モデルをデプロイする用意ができたら、Amazon SageMaker コンソールでワンクリックするだけでモデルを起動できます。

既存のワークフローを簡単に統合

Amazon SageMaker は、既存の機械学習ワークフローの一部として、組み合わせても単体でも使用できる 3 つのモジュールで設計されています。

トレーニング済みのモデルに簡単にアクセス

Amazon SageMaker では、アプリケーションから呼び出すことができる HTTPS エンドポイントを提供することで、機械学習モデルをアプリケーションに簡単に統合できます。

ユースケース

広告のターゲティング

Amazon SageMaker と AWS の他のサービスを併用することで、広告収益を最適化できます。Amazon SageMaker では機械学習モデルのトレーニングとデプロイを簡単に行えるため、オンライン広告のターゲティング効率は高まり、顧客エンゲージメントとコンバージョンが向上します。レコメンドシステム、クリックスルーの予測、顧客セグメンテーション、ライフタイムバリュー引き上げモデルといったものすべては Amazon SageMaker のサーバーレスの分散環境でトレーニングできます。構築後のモデルは、低レイテンシーの Auto Scaling エンドポイントで簡単にホストすることも、他のリアルタイム入札システムに送信することもできます。

クレジットデフォルトの予測

Amazon SageMaker により、機械学習の一般的な問題であるクレジットデフォルトの可能性を予測することが簡単になります。Amazon SageMaker は、Amazon Redshift、Amazon EMR、AWS Glue などの既存の分析フレームワークと緊密に統合されているため、Amazon S3 のデータレイクに大規模かつ多様なデータセットを公開し、すばやく変換して機械学習モデルを構築し、すぐにホストしてオンライン予測を実行することができます。

産業用 IoT および機械学習

産業用 IoT および機械学習によるリアルタイム予測では、機械の故障またはメンテナンスのスケジュールを予測できるため、さらに高度なレベルの効率性を実現します。

ブログ記事

evangelist-randall-hunt

Amazon SageMaker – Accelerating Machine Learning
Randall Hunt、AWS シニアテクニカルエバンジェリスト
2017 年 11 月 29 日

Amazon SageMaker の詳細

特徴ページをご覧ください
始める準備はできましたか?
サインアップ