投稿日: Jul 23, 2021
これで、AWS Glue DataBrew によりお客様は、どのデータ品質の統計がプロファイルジョブを実行するときにデータセットで自動生成されるかを指定できるようになりました。これによりユーザーは、データセットの性質とサイズに基づく重複値、相関値、および異常値の特定など、データプロファイルの統計をカスタマイズし、自分のニーズを満たす統計のみを用いてカスタムデータプロファイルの概要を作成することができます。
DataBrew は、すべての統計をプロファイルジョブからビジュアルなプロファイルダッシュボードに浮上させ、raw データを JSON オブジェクトとして Amazon S3 バケットに保存します。お客様は、どの統計が入ってくるデータを経時的に表示してモニタリングするかを制御して、データへの変更を数分以内に見つけることを、すべてコードの書き込みなしで行うことができます。お客様は、このブログポストに概要が示されているとおり、DataBrew および AWS Lambda を使用して、自動データ品質アラートをセットアップすることもできます。
使用を開始するには、AWS マネジメントコンソールにアクセスするか、ノートブック環境に DataBrew プラグインをインストールしてください。また、DataBrew のドキュメントを参照してください。