投稿日: Oct 6, 2021
Amazon SageMaker Data Wrangler は、機械学習 (ML) 用のデータを集約して準備するのにかかる時間を数週間から数分に短縮します。SageMaker Data Wrangler を使用すると、データ準備と特徴エンジニアリングのプロセスを簡素化し、データ選択、クレンジング、探索、視覚化など、データ準備ワークフローの各ステップを単一のビジュアルインターフェイスから実行できます。
今すぐ、時系列変換の新たな収集や 2 つの新たな時系列の可視化を含む機械学習のためのデータ準備を簡単かつ迅速に行う Amazon SageMaker Data Wrangler の新機能を使用して、時系列データからインサイトを素早く生成できるのです。この新しい時系列変換機能は、不足値補完、時系列の特徴量化 (例えば、フーリエ係数、自己相関統計、エントロピーなと) をサポートしており、データセットをダウンサンプリングまたはアップサンプリングして演算子を再サンプリングして頻度の均一化、タイムラグ機能および Window 関数を展開します。この新しい時系列変換機能は、ベクトル値に基づく列のグループ分け、長さの均一化、フラット化、エキスポートなどのより一般的なオペレーションもサポートしています。
加えて、Amazon SageMaker Data Wrangler では、この新しい時系列可視化機能を使用すれば、データ上の季節的な需要や傾向を可視化し、例外を特定することができるようになりました。例えば、季節的な需要や傾向の可視化により、売上データ上の季節的な効果や傾向を切り分けることができるのです。加えて、この異常値可視化機能により、顧客の購買データベース内の異常値を特定し、顧客購買行動の変化を検出できます。
Amazon SageMaker Data Wrangler の新機能の使用を開始するには、最新のリリースにアップグレードしてから、Amazon SageMaker Studio を開き、メニューから [File] > [New] > [Flow] とクリックするか、SageMaker Studio ランチャーから [new data flow] をクリックします。この新しい時系列変換および可視化機能の詳細については、ドキュメントをご覧ください。