投稿日: Dec 8, 2020
Amazon Redshift ML を使用すれば、データアナリスト、データベースデベロッパー、データサイエンティストなどのデータウェアハウスユーザーが、使い慣れた SQL コマンドを使用して機械学習 (ML) モデルを作成、トレーニング、デプロイすることができます。Amazon Redshift は最も広く使用されているクラウドデータウェアハウスです。Amazon Redshift ML では、SQL を使用して、データを移動したり新しいスキルを習得したりすることなく、フルマネージドの機械学習サービスである Amazon SageMaker を活用できるようになります。
Amazon SageMaker を搭載した Amazon Redshift ML を使用すれば、SQL ステートメントを使用して Amazon Redshift のデータから機械学習モデルを作成およびトレーニングし、これらのモデルを使用して、クエリやレポートで直接チャーン予測や不正リスクのスコアリングなどを行うことができます。Amazon Redshift ML は、Amazon SageMaker Autopilot を使用して、トレーニングデータに基づいて最適なモデルを自動的に検出して調整します。SageMaker Autopilot は、最良の回帰、バイナリ、またはマルチクラス分類と線形モデルから選択します。
または、Xtreme Gradient Boosted tree (XGBoost) などのモデルタイプ、回帰や分類などの問題タイプ、およびプリプロセッサやハイパーパラメータを選択することもできます。Amazon Redshift ML は、パラメータを使用して、Amazon Redshift データウェアハウスでモデルを構築、トレーニング、およびデプロイします。ユーザー定義関数 (UDF) を呼び出すかのように、SQL クエリを使用してこれらのトレーニング済みモデルから予測を取得し、超並列処理機能を含め、Amazon Redshift のすべての利点を活用できます。
Amazon Redshift ML は、既存のクラスターリソースを予測に活用するため、Amazon Redshift の追加料金が発生することはありません。モデルの作成または使用による、Amazon Redshift の追加料金は発生しません。また、予測は Amazon Redshift クラスターでローカルに行われるため、クラスターのサイズを変更する必要がない限り、追加料金を支払う必要はありません。Amazon Redshift ML は、Amazon SageMaker を使用してモデルをトレーニングしますが、これには関連する追加コストがかかります。詳細については、Redshift の料金ページをご覧ください。