完全な制御と可視性を維持しながら、データに基づいて最適な機械学習モデルを自動的に構築、トレーニング、および調整する
モデルの性能と精度の要求に対して、リーダーボードから最適なモデルを選択する
Amazon SageMaker Studio で、ワンクリックでモデルを本番環境にデプロイしたり、推奨モデルを繰り返し使用する
Amazon SageMaker Autopilot は、機械学習モデル構築のための重労働を排除します。表形式のデータセットを提供し、予測対象の列を選択するだけで、SageMaker Autopilot が自動的にさまざまなソリューションを探索し、最適なモデルを見つけます。その後、ワンクリックでモデルを本番に直接デプロイするか、推奨ソリューションを繰り返して、モデルの品質をさらに向上させることができます。
仕組み

主な特徴
自動データ前処理と特徴エンジニアリング
データに欠損がある場合でも、Amazon SageMaker Autopilot を使用できます。 SageMaker Autopilot は、欠損したデータを自動的に補完し、データセット内の列に関する統計的洞察を提供し、タイムスタンプの日付と時刻の情報などを数値以外の列から情報を自動的に抽出します。
自動 ML モデル選択
Amazon SageMaker Autopilot は、バイナリ分類、マルチクラス分類、回帰など、データに最適な予測のタイプを自動的に推測します。その後、SageMaker Autopilot は、勾配ブースティングデシジョンツリー、フィードフォワード型ディープニューラルネットワーク、ロジスティック回帰などの高性能アルゴリズムを探索し、これらのアルゴリズムに基づいて数百のモデルをトレーニングおよび最適化して、データに最適なモデルを見つけます。
モデルリーダーボード
Amazon SageMaker Autopilot を使用すると、データ用に自動的に生成されるすべての ML モデルを確認できます。正確性、精度、再現率、曲線下面積 (AUC) などのメトリクスでランク付けされたモデルのリストを表示し、予測に対する特徴の影響などのモデルの詳細を確認して、ユースケースに最適なモデルをデプロイできます。
特徴量重要度
Amazon SageMaker Autopilot では、Amazon SageMaker Clarify により生成される説明レポートが提供されます。このレポートにより、SageMaker Autopilot を使用して作成されたモデルがどのように予測を実行するかについてを、簡単に把握し説明できるようになります。また、トレーニングデータ内の個々の属性が予測結果にどの程度貢献しているかを、割合で示すこともできます。この割合が高いほど、その特徴がモデルの予測に与える影響度が大きくなります。
アプリケーションと簡単に統合
Amazon SageMaker Autopilot アプリケーションプログラミングインターフェイス (API) を使用すると、モデルを簡単に作成し、データ分析ツールやデータウェアハウジングツールなどのアプリケーションから直接推論を行うことができます。
カスタマイズ可能な autoML ジャーニー
Amazon SageMaker Autopilot を使用すると、autoML ジャーニーのステップをカスタマイズして、高品質の ML モデルを作成できます。SageMaker Data Wrangler 内の 300 以上の事前設定されたデータ変換を使用して、独自のデータ前処理と特微量エンジニアリング変換を行い、レシピを SageMaker Autopilot に取り込むことができます。トレーニングデータと検証データ用のカスタムデータ分割を定義したり、検証用のカスタムデータセットをアップロードしたりすることもできます。さらに、トレーニング用の機能を選択し、データ型を変更し、SageMaker Autopilot 実験用のトレーニングモード (アンサンブルまたはハイパーパラメータの最適化) を選択できます。
アプリケーションと簡単に統合
Amazon SageMaker Autopilot アプリケーションプログラミングインターフェイス (API) を使用すると、モデルを簡単に作成し、データ分析ツールやデータウェアハウジングツールなどのアプリケーションから直接推論を行うことができます。
自動ノートブック作成
Amazon SageMaker Autopilot が作成する任意のモデルのAmazon SageMaker Studio ノートブックを自動的に生成し、どのように作成されたかに関する詳細を調べ、必要に応じて改良し、将来いつでもノートブックから再作成できます。
ユースケース
価格予測
価格予測モデルは、金融サービス、不動産、エネルギーおよびユーティリティで、株式、不動産、および天然資源の価格を予測するために頻繁に使用されます。Amazon SageMaker Autopilot は将来の価格を予測して、需要、季節的傾向、その他の商品の価格などの履歴データに基づいて適切な投資判断を下すのに役立ちます。
顧客離れの予測
顧客離れとは、顧客またはクライアントを失うことであり、すべての企業が顧客離れをなくす方法を模索しています。Amazon SageMaker Autopilot によって自動的に生成されたモデルは、顧客離れのパターンの理解に役立ちます。顧客離れの予測モデルは、既存データのパターンを最初に学習し、新しいデータセットのパターンを識別することで機能するため、顧客離れの可能性が最も高い顧客に関する予測を得ることができます。
リスク評価
リスク評価では、個人、資産、および会社に悪影響を与える可能性のある潜在的なイベントを特定して分析する必要があります。Amazon SageMaker Autopilot によって自動的に生成されたモデルは、新しいイベントが発生するにつれてリスクを予測します。リスク評価モデルは既存のデータセットを使用してトレーニングされるため、ビジネスの最適な予測を取得できます。
お客様

「RetentionX では、e コマース企業にワンクリックでビジネスインサイトを提供しています。お客様にサービスを提供するためには、すぐに始められ、タイムリーなビジネス上の意思決定ができることが重要ですが、正確な機械学習モデルの構築にはコストがかかり、何ヶ月も試行錯誤を繰り返す必要があります。また、モデルの精度は、お客様ごとに用意されているトレーニングデータの広さや深さ、独自の機能セットにも大きく依存します。Amazon SageMaker Autopilot を利用することで、お客様は独自のデータセットに基づいて最適な機械学習モデルを自動的に生成することができます。SageMaker Autopilot のおかげで、私たちは AutoML の力を活用して、何千万人もの買い物客にパーソナライズされたインサイトを提供することができます」。
RetentionX、CEO、Alexander Jost 氏

"EPCVIP では、機械学習を活用して、ユーザーグループの属性をより深く理解し、処理時間を短縮し、製品サービスのコンバージョン率を向上させています。フィンテックは非常に複雑な業界であり、常に変化し続けています。新しいパートナー、アフィリエイト、トラフィックソース、製品サービスが週替わりで追加されています。私たちは機械学習モデルを構築しながら、優れた結果を生み出すために常にモデルを適応させるための実験を行っています。Amazon SageMaker Autopilot のおかげで、データを完全に可視化した上で、機械学習モデルを迅速に試作し、自動的に構築、トレーニング、調整することができるようになりました。SageMaker Autopilot では、機能、ハイパーパラメータ、アルゴリズム、データセットをカタログ化してレビューできるため、モデルの反復を完全に理解できるようになりました。SageMaker Autopilot によるマッチング率の向上やその他のデプロイされたモデルによる結果は、当社のリード単価に最大で 30% も貢献しています"
EPCVIP、データサイエンス責任者、Pascal Simpkins 氏

「Amazon SageMaker Autopilot を利用した Sisense の新しい ML サービスは、この新型コロナウイルス (COVID-19) の感染拡大下において、カスタマーサービスのあり方の変容を先取りするためにまさに必要なものでした。Skullcandy は、お客様のニーズについて深い洞察を得て、問題解決を改善し、顧客満足度スコアを向上させることができました」
Mark Hopkins 氏、Chief Information Officer、Skullcandy Inc.

「以前は、単に同じように見えるレストランを 2 店選んだものでした。しかし今では、メニュー、お客様、場所という要素の関係について正しく理解しています。Domo の新しい機械学習機能を強化する Amazon SageMaker Autopilot により、マーケティングや購入チームが増強され、新しいアイデアを試したり、カスタマーエクスペリエンスを向上させたりできています」
Sean Thompson 氏、IT Director、Freddy’s

「人口統計マッピングの主な目標は、精度と規模の両方を最適化することです。これは一般的には困難ですが、Amazon SageMaker Autopilot を当社の包括的なトレーニングデータと洗練された特徴とともに使用することで、予測精度を 137% 向上させるより優れたモデルを作成することができました」
Anindya Datta 氏、CEO、Mobilewalla