投稿日: Aug 29, 2022
Amazon SageMaker Data Wrangler は、ML 向けの初の完全統合開発環境 (IDE) である Amazon SageMaker Studio で、機械学習 (ML) のデータを集約して準備するのにかかる時間を数週間から数分に短縮します。SageMaker Data Wrangler を使用すると、データ準備と特徴量エンジニアリングのプロセスを簡素化し、データの選択、クレンジング、探索、可視化など、データ準備ワークフローの各ステップを単一のビジュアルインターフェイスから実行できます。Data Wrangler を使用しているお客様は、Amazon S3、Amazon Athena、Amazon Redshift、Snowflake、Databricks Lakehouse Platform などからデータをインポートできます。
本日より、Data Wrangler を初めて使用するお客様は、サンプルデータセットを使用し、製品を初めて操作するユーザーのためのガイド付き手順に従うことで、Data Wrangler をより迅速に使い始めることができます。Data Wrangler では、ML の教育と実験に広く利用されている公開の Titanic データセットを使えるため、お客様は使用開始するために独自のデータをインポートする必要がなくなりました。Data Wrangler では、データ品質およびインサイトレポートなどで初めてのユーザーが主要な特徴量を見つけるのに役立つアクションが提案されるようになりました。データ品質およびインサイトレポートは、データ品質をチェックし、データの異常を検出するのに役立つ一般的な機能です。
Amazon SageMaker Data Wrangler の使用を開始する方法の詳細については、ブログまたは AWS ドキュメントを参照してください。