投稿日: Dec 8, 2020
Amazon SageMaker Data Wrangler は、機械学習 (ML) 用のデータを集約して準備するのにかかる時間を数週間から数分に短縮します。Amazon SageMaker Data Wrangler を使用すると、データ準備と特徴エンジニアリングのプロセスを簡素化し、データ選択、クレンジング、探索、視覚化など、データ準備ワークフローの各ステップを単一のビジュアルインターフェイスから実行できます。
ほとんどの ML モデルは、さまざまなソースから得たデータを集約および準備するために数週間から数か月を費やしています。生データを、モデルのトレーニングと予測に使用できる機能に転換、変換、検証します。データをモデルに効率的に使用できる形式に変換できるように、データ変換を作成するためのコードを記述し、多数のデータソースにわたって大規模に実行できる追加のコードを作成する必要があります。これにより、価値の高いタスクにより多くの時間を費やすことができます。
Amazon SageMaker Data Wrangler のデータ選択ツールを使用すると、Amazon S3、Amazon Athena、Amazon Redshift、AWS Lake Formation、Amazon SageMaker モダンアプリケーションなどのさまざまなデータソースから必要なデータを選択し、ワンクリックでインポートすることができます。Amazon SageMaker Data Wrangler には 300 を超える組み込みのデータ変換が含まれているため、コードを記述しなくても、機能をすばやく正規化、変換、および結合できます。Amazon SageMaker Data Wrangler の視覚化テンプレートを使用すると、ML 用の最初の完全統合開発環境 (IDE) である Amazon SageMaker Studio で表示することにより、これらの変換が意図したとおりに完了したことをすばやくプレビューおよび検査できます。データの準備ができたら、Amazon SageMaker Pipelines を使用して完全に自動化された ML ワークフローを構築し、Amazon SageMaker モダンアプリケーションで再利用できるように保存できます。
Amazon SageMaker Data Wrangler は、Amazon SageMaker Studio が利用可能なすべてのリージョンで一般的に利用可能です。Amazon SageMaker Data Wrangler を今すぐ使用するには、ドキュメントをご覧ください。