投稿日: Nov 18, 2021

AWS Glue DataBrew ユーザーは、特定のデータのビジネス要件を定義するカスタマイズ可能な検証チェックであるデータ品質ルールを作成できるようになりました。ユーザーは、特定の列の重複した値のチェック、1つの列が別の列と一致していないことの検証、または特定のデータ品質ユースケースに基づくさらに多くのカスタムチェックと条件の定義を行うためのルールを作成できます。効率化のために所定のデータセットのルールをルールセットにグループ化し、標準データプロファイルジョブの一部としてそれらのチェックを適用することができます。結果はデータ品質ダッシュボードと検証レポートに入力され、ルールの結果を素早く表示して、データが使用に適しているかどうかを判断できるようにします。

AWS Glue DataBrew は、250 を超える事前構築済みの変換を使用して、コードを記述することなくデータを簡単にクリーニングおよび正規化できるビジュアルデータ準備ツールです。外れ値の除外、標準形式へのデータの変換、無効な値の修正などのタスクを自動化することが可能です。

DataBrew の使用を開始するには、AWS マネジメントコンソールにアクセスするか、ノートブック環境に DataBrew プラグインをインストールしてください。詳細については、この開始方法の動画を視聴し、DataBrew のドキュメントを参照してください。