投稿日: May 10, 2023

Amazon SageMaker Autopilot はローコードの機械学習 (ML) サービスであり、最適な ML モデルを自動的に構築、トレーニング、調整できます。今回、アンサンブルモードでの加重目標メトリクスを使用したトレーニングと、新しい 8 つの目標メトリクスをサポートしました。トレーニングデータセットの各データサンプルに加重を割り当てると、モデル全体のパフォーマンスが向上します。つまり、モデルの学習能力が向上し、特定のクラスへのバイアスが減少し、安定性が向上します。 

トレーニングを行う際に、一部のクラスのデータサンプルが他より大幅に少ない不均衡なデータセットを使用する場合があります。この場合、そのデータセットに高い加重を割り当てると、モデルの学習能力が向上し、サンプル数の多いクラスへのバイアスが減少します。本日から、Autopilot 実験を作成する際に、入力データセットで加重列名を渡すことができます。SageMaker Autopilot は、これらの加重値を使用してデータセットの詳細を学習し、学習した内容を ML モデルのトレーニングに適用します。 

また、RMSE、MAE、R2、バランス正解率、適合率、適合率マクロ、再現率、再現率マクロの 8 つの目標メトリクスも新たにサポートしました (ドキュメントはこちら)。選択した目標メトリクスはトレーニング中に最適化され、データから最適なモデルパラメータ値を推定できます。メトリクスを明確に指定しない場合、デフォルトの動作では、リグレッションには MSE、二項分類には F1、多クラス分類には正解率が自動的に使用されます。

使用を開始するには、SageMaker Studio のコンソールで SageMaker Autopilot の実験を作成してください。SageMaker Studio の最新バージョンにアップグレードすると、新しいサンプル加重列機能と追加の目標メトリクスのセットを使用できます。詳細については、デベロッパーガイド製品ページを参照してください。