AWS Glue DataBrew 增加了指定為您的資料集產生哪些資料品質統計資料的功能

張貼日期: 2021年7月23日

AWS Glue DataBrew 現在允許客戶指定執行設定檔工作時,為資料集自動產生哪些資料品質統計資料。這可讓使用者自訂資料設定檔統計資料,例如根據資料集的性質和大小決定重複值、相關性和異常值,並建立自訂資料設定檔概觀,僅包含符合他們需求的統計資料。

DataBrew 會在視覺化設定檔儀表板上顯示設定檔工作中的所有統計資料,並將原始資料作為 JSON 物件儲存在 Amazon S3 儲存區中。客戶可以控制要顯示的統計資料、隨著時間的推移監控傳入資料的品質,並在幾分鐘內發現資料的變更,而無需編寫任何程式碼。客戶還可以使用 DataBrew 和 AWS Lambda 設定自動化資料品質警示,如本部落格文章中所述

若要開始使用,請造訪 AWS 管理主控台或在筆記型電腦環境中安裝 DataBrew 外掛程式,並參閱 Data Brew 文件。