投稿日: Jun 9, 2022
本日から、Amazon SageMaker Data Wrangler で利用できるようになったエクスポート機能により、これまでにない速度で Amazon SageMaker Feature Store に特徴量をエクスポートできるようになりました。Amazon SageMaker Data Wrangler は、機械学習 (ML) 用のデータを集約して準備するのにかかる時間を数週間から数分に短縮します。SageMaker Data Wrangler を使用すると、データ準備と特徴量エンジニアリングのプロセスを簡素化し、データ選択、クレンジング、探索、視覚化など、データ準備ワークフローの各ステップを単一のビジュアルインターフェイスから実行できます。SageMaker Data Wrangler のデータ選択ツールを使用すると、Amazon S3、Amazon Athena、Amazon Redshift、AWS Lake Formation、Amazon SageMaker Feature Store、および Snowflake などの複数のデータソースからデータをすばやく選択できます。Amazon SageMaker Feature Store は、機械学習 (ML) の特徴量を保存、更新、取得、共有するためのフルマネージド型の専用リポジトリです。
本日より、Amazon SageMaker Data Wrangler で数回クリックするだけで、特徴量を作成して Amazon SageMaker Feature Store にエクスポートできます。これまで、機械学習用のデータを準備する際に特徴量をエンジニアリングして特徴量ストアにエクスポートするには、かなりの量のコードを記述する必要がありました。今後は、数回クリックするだけで、SageMaker Data Wrangler の視覚的なポイントアンドクリックインターフェイスを使用して特徴量をエンジニアリングし、SageMaker Feature Store に特徴量をエクスポートできるようになりました。また、SageMaker Data Wrangler 内から、特徴量グループを簡単に参照したり、新しい特徴量グループを作成したり、特徴量グループスキーマを検証したりできるようにもなりました。
Amazon SageMaker Data Wrangler の新機能の使用を開始するには、最新のリリースにアップグレードしてから、Amazon SageMaker Studio を開き、メニューから [File] (ファイル) > [New] (新規) > [Flow] (フロー) とクリックするか、SageMaker Studio ランチャーから [new data flow] (新規データフロー) をクリックします。新機能の詳細については、ブログを読み、ドキュメントを参照してください。