投稿日: Nov 7, 2022
Amazon SageMaker Canvas が高度なデータ分析のための相関行列に対応しました。これにより、ML モデルを構築する前にデータからインサイトを取得する機能が拡張されました。SageMaker Canvas はポイントアンドクリック式のビジュアルインターフェイスです。ビジネスアナリストは機械学習を使用した経験がなくても、あるいはコードを 1 行も書かなくても、正確な ML 予測を自分で生成できます。
SageMaker Canvas は、欠損値と外れ値に標準値またはカスタム値を代入する機能、数学的関数と演算子を使用して新しい機能を定義および作成する機能、ボックスプロット、棒グラフ、散布図によるデータの視覚的な調査などのデータ分析/調査機能を提供します。SageMaker Canvas で相関行列を使用して、データセットを行列に要約し、2 つ以上の値の相関関係と相互の関連性を示せるようになりました。これにより、特定のデータセットのパターンを特定して視覚化し、高度な分析を行うことができます。
数値、カテゴリ、および両方の変数を組み合わせた相関行列を生成できるようになりました。データセットは、数値の場合は Pearson または Spearman 相関、カテゴリ値の場合は相互情報量を使用して分析できるため、柔軟に選択できます。これらの行列の出力を使用して、欠損データに代入したり、分散を理解するために値に重みを割り合てたり、その他の高度な分析を行ったりできます。相関行列は、需要と供給に基づく価格変動の分析、気象パターンに基づいた雨量の予測、製品やサービスの新しい機能に基づいた購買傾向の把握など、多くのユースケースに適用可能です。