為什麼選擇 AWS Glue?
準備您的資料以取得高品質結果是分析或 ML 專案的第一步。AWS Glue 是一項無伺服器資料整合服務,可使資料準備變得更簡單、快速而且實惠。您可以發現並連線到超過 70 個不同的資料來源,在集中式資料型錄中管理您的資料,並且以視覺方式建立、執行與監控 ETL 管道,將資料載入到您的資料湖。
AWS Glue 簡介 (01:54)

運作方式

AWS Glue 是一種無伺服器、可擴展的資料整合服務,可讓您更輕鬆地探索、準備、移動和整合來自多個來源的資料,以進行分析、機器學習 (ML) 和應用程式開發。

  • 資料整合引擎選項
  • 在 AWS Glue 中選擇您偏好的資料整合引擎,來為您的使用者和工作負載提供支援。

    圖表顯示了 AWS Glue 的多個資料處理引擎選項。
  • 事件驅動的 ETL
  • AWS Glue 可在新資料到達時執行擷取、轉換和載入 (ETL) 任務。例如,您可以設定 AWS Glue 在 Amazon Simple Storage Service (S3) 上的新資料變得可用時立即開始執行您的 ETL 任務。

    圖表顯示 AWS Glue 如何在新資料到達時執行 ETL 任務。
  • AWS Glue Data Catalog
  • 您可以使用資料型錄快速探索和搜尋多個 AWS 資料集,而無需移動資料。資料編入型錄之後,即可使用 Amazon Athena、Amazon EMR 和 Amazon Redshift Spectrum 搜尋和查詢。

    圖表顯示資料型錄發現與搜尋資料集,而不移動資料。
  • 無程式碼 ETL 任務
  • AWS Glue Studio 讓您可以更輕鬆地以視覺化方式建立、執行和監控 AWS Glue ETL 任務。您可以建置 ETL 任務,該任務可使用拖放編輯器移動和轉換資料,而 AWS Glue 可自動產生程式碼。

    圖表顯示使用者如何使用拖放編輯器,來編寫移動和轉換資料的 ETL 任務。
  • 管理和監控資料品質
  • AWS Glue Data Quality 可自動建立、管理和監控資料品質規則,以協助確保跨資料湖和管道的高品質資料。

    該圖表顯示 AWS Glue Data Quality 如何自動測量、監控和管理資料湖和資料管道中的資料品質。
  • 資料準備
  • 藉助 AWS Glue DataBrew,您可以探索和試驗直接來自資料湖、資料倉儲和資料庫的資料,包括 Amazon S3、Amazon Redshift、AWS Lake Formation、Amazon Aurora 和 Amazon Relational Database Service (RDS)。您可以從 DataBrew 中 250 多個預先建置的轉換中進行選擇,以自動化資料準備任務,例如篩選異常、標準化格式和更正無效值。

    圖表顯示 DataBrew 如何自動為使用者開始資料準備任務。

最新消息

  • 日期 (最新到最舊)
找不到結果
1

探索更多 AWS 服務