Amazon SageMaker Autopilot

完全な可視性を備えた機械学習モデルを自動的に作成する

Amazon SageMaker Autopilot は、完全な制御と可視性を維持しながら、データに基づいて最適な機械学習モデルを自動的にトレーニングおよび調整します。

機械学習 (ML) モデルを構築するには、データに最適なモデルを見つけるために、特徴を手動で準備し、複数のアルゴリズムをテストし、数百のモデルパラメータを最適化する必要があります。ただし、このアプローチには ML の深い専門知識が必要です。その専門知識がない場合は、自動化アプローチ (AutoML) を使用できますが、AutoML アプローチでは通常、モデル予測に対する特徴の影響をほとんど把握できません。その結果、そのアプローチを再現することができず、どのように予測されているのかを学ぶこともできないため、そのアプローチに対する信頼が低下する可能性があります。

Amazon SageMaker Autopilot は、ML モデルを構築する手間を省き、データに基づいて最適な ML モデルを自動的に構築、トレーニング、および調整するのに役立ちます。SageMaker Autopilot では、表形式のデータセットを提供し、予測するターゲット列を選択するだけです。これは、数値 (回帰と呼ばれる住宅価格など) またはカテゴリ (分類と呼ばれるスパム/非スパムなど) になります。SageMaker Autopilot は、さまざまなソリューションを自動的に探索して、最適なモデルを見つけます。その後、ワンクリックでモデルを本番に直接デプロイするか、Amazon SageMaker Studio を使用して推奨ソリューションを繰り返して、モデルの品質をさらに向上させることができます。

仕組み

Amazon SageMaker Autopilot の仕組み

主な特徴

自動データ前処理と特徴エンジニアリング

データが不足している場合でも、Amazon SageMaker Autopilot を使用できます。 SageMaker Autopilot は、不足しているデータを自動的に入力し、データセット内の列に関する統計的洞察を提供し、タイムスタンプの日付と時刻の情報など、数値以外の列から情報を自動的に抽出します。

自動 ML モデル選択

Amazon SageMaker Autopilot は、バイナリ分類、マルチクラス分類、回帰など、データに最適な予測のタイプを自動的に推測します。その後、SageMaker Autopilot は、勾配ブースティングデシジョンツリー、フィードフォワード型ディープニューラルネットワーク、ロジスティック回帰などの高性能アルゴリズムを探索し、これらのアルゴリズムに基づいて数百のモデルをトレーニングおよび最適化して、データに最適なモデルを見つけます。

モデルリーダーボード

Amazon SageMaker Autopilot を使用すると、データ用に自動的に生成されるすべての ML モデルを確認できます。正確性、精度、再現率、曲線下面積 (AUC) などのメトリクスでランク付けされたモデルのリストを表示し、予測に対する特徴の影響などのモデルの詳細を確認して、ユースケースに最適なモデルをデプロイできます。

自動ノートブック作成

Amazon SageMaker Autopilot が作成する任意のモデルのAmazon SageMaker Studio ノートブックを自動的に生成し、どのように作成されたかに関する詳細を調べ、必要に応じて改良し、将来いつでもノートブックから再作成できます。

特徴量重要度

Amazon SageMaker Autopilot では、Amazon SageMaker Clarify により生成される説明レポートが提供されます。このレポートにより、SageMaker Autopilot を使用して作成されたモデルがどのように予測を実行するかについてを、簡単に把握し説明できるようになります。また、トレーニングデータ内の個々の属性が予測結果にどの程度貢献しているかを、割合で示すこともできます。この割合が高いほど、その特徴がモデルの予測に与える影響度が大きくなります。

アプリケーションと簡単に統合

Amazon SageMaker Autopilot アプリケーションプログラミングインターフェイス (API) を使用すると、モデルを簡単に作成し、データ分析ツールやデータウェアハウジングツールなどのアプリケーションから直接推論を行うことができます。

ユースケース

価格予測

価格予測モデルは、金融サービス、不動産、エネルギーおよびユーティリティで、株式、不動産、および天然資源の価格を予測するために頻繁に使用されます。Amazon SageMaker Autopilot は将来の価格を予測して、需要、季節的傾向、その他の商品の価格などの履歴データに基づいて適切な投資判断を下すのに役立ちます。

顧客離れの予測

顧客離れとは、顧客またはクライアントを失うことであり、すべての企業が顧客離れをなくす方法を模索しています。Amazon SageMaker Autopilot によって自動的に生成されたモデルは、顧客離れのパターンの理解に役立ちます。顧客離れの予測モデルは、既存データのパターンを最初に学習し、新しいデータセットのパターンを識別することで機能するため、顧客離れの可能性が最も高い顧客に関する予測を得ることができます。

リスク評価

リスク評価では、個人、資産、および会社に悪影響を与える可能性のある潜在的なイベントを特定して分析する必要があります。Amazon SageMaker Autopilot によって自動的に生成されたモデルは、新しいイベントが発生するにつれてリスクを予測します。リスク評価モデルは既存のデータセットを使用してトレーニングされるため、ビジネスの最適な予測を取得できます。

お客様

Skullcandy Inc.
「Amazon SageMaker Autopilot を利用した Sisense の新しい ML サービスは、この新型コロナウイルス (COVID-19) の感染拡大下において、カスタマーサービスのあり方の変容を先取りするためにまさに必要なものでした。Skullcandy は、お客様のニーズについて深い洞察を得て、問題解決を改善し、顧客満足度スコアを向上させることができました」

Mark Hopkins 氏、Chief Information Officer、Skullcandy Inc.

Freddy’s
「以前は、単に同じように見えるレストランを 2 店選んだものでした。しかし今では、メニュー、お客様、場所という要素の関係について正しく理解しています。Domo の新しい機械学習機能を強化する Amazon SageMaker Autopilot により、マーケティングや購入チームが増強され、新しいアイデアを試したり、カスタマーエクスペリエンスを向上させたりできています」

Sean Thompson 氏、IT Director、Freddy’s

Mobilewalla
「人口統計マッピングの主な目標は、精度と規模の両方を最適化することです。これは一般的には困難ですが、Amazon SageMaker Autopilot を当社の包括的なトレーニングデータと洗練された特徴とともに使用することで、予測精度を 137% 向上させるより優れたモデルを作成することができました」

Anindya Datta 氏、CEO、Mobilewalla

RetentionX
「RetentionX では、e コマース企業にワンクリックでビジネスインサイトを提供しています。お客様にサービスを提供するためには、すぐに始められ、タイムリーなビジネス上の意思決定ができることが重要ですが、正確な機械学習モデルの構築にはコストがかかり、何ヶ月も試行錯誤を繰り返す必要があります。また、モデルの精度は、お客様ごとに用意されているトレーニングデータの広さや深さ、独自の機能セットにも大きく依存します。Amazon SageMaker Autopilot を利用することで、お客様は独自のデータセットに基づいて最適な機械学習モデルを自動的に生成することができます。SageMaker Autopilot のおかげで、私たちは AutoML の力を活用して、何千万人もの買い物客にパーソナライズされたインサイトを提供することができます」。

Alexander Jost 氏、CEO - RetentionX

Amazon SageMaker Autopilot のリソース

Amazon SageMaker Autopilot を使用して、高品質の機械学習モデルを簡単かつ迅速に構築する (31:39)

Amazon SageMaker Autopilot