投稿日: Sep 29, 2022
Amazon SageMaker Canvas がデータ探索の向上のため、数学関数および演算子のサポートを開始しました。これにより、データに新たな機能を定義できます。SageMaker Canvas はポイントアンドクリック式のビジュアルサービスです。そのため、ビジネスアナリストは、機械学習を使用した経験がなくても、またコードを一行も書かなくても、正確な ML 予測を自分で生成することができます。
SageMaker Canvas はさまざまデータ変換に対応し、データセットのフィルタリング、結合、修正ができます。また高度なビジュアライゼーションにも対応し、データ内の変数の関係性を把握できます。本日より、そのようなデータ変換に数学関数および論理演算子を使用して、ML モデルを構築する前にデータの分散を深く理解できるようになります。これらの関数および演算子の結果から、特定の属性を可視化できる新たな機能を作成できます。サポートする数学関数には、加算、減算、乗算、除算、平均、標準偏差、変化、指数、対数が含まれます。さらに、SageMaker Canvas では、条件を定義する if-then-else 文などの論理演算子もサポートしており、データの把握、分散、探索をより深く行える柔軟性をもたらします。
この新機能が加わり、SageMaker Canvas ではデータの前処理技術であるビニングが使用できます。ビニングとは、関連する数値またはカテゴリ値を、より少ない数のビンと呼ばれるセットにグループ分けする手法です。例えば、家具アイテムを追跡するデータセットがある場合、オフィス家具、リビング家具、寝室家具など、さまざまなビンにグループ分けできます。ビニングは、外れ値や無効な値を特定するのに役立ち、データセットの非線形性を低減させるため、ML モデルの精度が向上します。