投稿日: Dec 3, 2019
Amazon SageMaker Autopilot が一般公開されました。この機能により、Amazon SageMaker では表形式のデータと指定したターゲット列を使用してモデルを自動的にトレーニングおよび調整し、プロセスを完全に可視化できます。名前が示すように、オートパイロットで使用でき、Amazon SageMaker Studio でワンクリックで最高の精度のモデルをデプロイできます。または、意思決定のガイドとして使用して、レイテンシーやモデルサイズの精度といったトレードオフを行うことができます。
特定のデータセットに最適な ML アルゴリズムを決定することは非常に困難です。適切なアルゴリズムパラメータを見つけるのが難しいことは言うまでもありません。さらに、適切な ML モデルを構築するには、データをクリーンアップするか、データを前処理する必要があります。これには時間がかかり、時には高度な機械学習スキルが必要です。これらの問題により、チームはデータのクリーニングや前処理を行うのではなく、データセットをそのまま使用するなどのショートカットや回避策を講じることになります。そうすると、チームは目の前の問題に適したアルゴリズムではなく、使いやすいアルゴリズムを使用することになります。その結果、企業は望ましいモデル品質に到達するのに苦労します。また、包括的な ML の知識を持つデータサイエンティストは、特定の問題、特にモデルサイズとレイテンシーの制約がある広告配信や IoT などのアプリケーションに最適なモデルを見つけるまでに、さまざまな ML モデルの実験に多大な時間を費やします。
Amazon SageMaker Autopilot はこのプロセス全体を簡素化し、機械学習をより簡単に、より速く、より透明にします。今回の一般公開で、機械学習に関する深い知識がなくても分類および回帰モデルを構築できるようになりました。表形式のデータセットを指定し、予測するターゲット列を選択するだけで、SageMaker Autopilot はデータプリプロセッサ、アルゴリズム、アルゴリズムパラメータ設定をさまざま組み合わせて機械学習ソリューションを自動的に探索します。これにより、最も正確なモデルを見つけられます。使用するアルゴリズムを決定するのではなく、SageMaker オートパイロットは、ネイティブサポートする高性能アルゴリズムのリストから適切なアルゴリズムを自動的に選択し、そのすべてのアルゴリズムを評価します。SageMaker Autopilot はまた、これらのアルゴリズムでさまざまなパラメータ設定を自動的に試行して、最高のモデル品質を取得します。これで、ワンクリックで本番環境に最適なモデルを直接デプロイしたり、複数の候補を評価して、精度、レイテンシー、モデルサイズなどのメトリクスをトレードオフしたりできるようになりました。SageMaker Autopilot は、データのクリーニングと前処理について心配する必要はありません。これは、さまざまなタイプのデータプリプロセッサをデータに自動的に適用してから、データをアルゴリズムを介して渡すことでモデルをトレーニングするためです。
Amazon SageMaker Autopilot は、米国東部 (オハイオ)、米国東部 (バージニア北部)、米国西部 (北カリフォルニア)、米国西部 (オレゴン)、アジアパシフィック (ムンバイ)、アジアパシフィック (ソウル)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、アジアパシフィック (東京)、カナダ (中部)、欧州 (フランクフルト)、欧州 (アイルランド)、欧州 (ロンドン)、欧州 (パリ)、および欧州 (ストックホルム) の AWS リージョンでご利用いただけます。SageMaker Autopilot の詳細については、ドキュメントページをご覧ください。モデル作成タスクで SageMaker Autopilot を使用する方法については、ブログ記事をお読みください。