AWS Glue

發現、準備和整合任何規模的所有資料

1 百萬個物件免費存放

運作方式

AWS Glue 是一種無伺服器、可擴展的資料整合服務,可讓您更輕鬆地探索、準備、移動和整合來自多個來源的資料,以進行分析、機器學習 (ML) 和應用程式開發。

  • 資料整合引擎選項
  • 在 AWS Glue 中選擇您偏好的資料整合引擎,來為您的使用者和工作負載提供支援。

    圖表顯示了 AWS Glue 的多個資料處理引擎選項。
  • 事件驅動的 ETL
  • AWS Glue 可在新資料到達時執行擷取、轉換和載入 (ETL) 任務。例如,您可以設定 AWS Glue 在 Amazon Simple Storage Service (S3) 上的新資料變得可用時立即開始執行您的 ETL 任務。

    圖表顯示 AWS Glue 如何在新資料到達時執行 ETL 任務。
  • AWS Glue Data Catalog
  • 您可以使用資料型錄快速探索和搜尋多個 AWS 資料集,而無需移動資料。資料編入型錄之後,即可使用 Amazon Athena、Amazon EMR 和 Amazon Redshift Spectrum 搜尋和查詢。

    圖表顯示資料型錄發現與搜尋資料集,而不移動資料。
  • 無程式碼 ETL 任務
  • AWS Glue Studio 讓您可以更輕鬆地以視覺化方式建立、執行和監控 AWS Glue ETL 任務。您可以建置 ETL 任務,該任務可使用拖放編輯器移動和轉換資料,而 AWS Glue 可自動產生程式碼。

    圖表顯示使用者如何使用拖放編輯器,來編寫移動和轉換資料的 ETL 任務。
  • 管理和監控資料品質
  • AWS Glue Data Quality 可自動建立、管理和監控資料品質規則,以協助確保跨資料湖和管道的高品質資料。

    該圖表顯示 AWS Glue Data Quality 如何自動測量、監控和管理資料湖和資料管道中的資料品質。
  • 資料準備
  • 藉助 AWS Glue DataBrew,您可以探索和試驗直接來自資料湖、資料倉儲和資料庫的資料,包括 Amazon S3、Amazon Redshift、AWS Lake Formation、Amazon Aurora 和 Amazon Relational Database Service (RDS)。您可以從 DataBrew 中 250 多個預先建置的轉換中進行選擇,以自動化資料準備任務,例如篩選異常、標準化格式和更正無效值。

    圖表顯示 DataBrew 如何自動為使用者開始資料準備任務。
AWS Glue 簡介 (01:54)
為什麼選擇 AWS Glue?
準備您的資料以取得高品質結果是分析或 ML 專案的第一步。AWS Glue 是一項無伺服器資料整合服務,可使資料準備變得更簡單、快速而且實惠。您可以發現並連線到超過 70 個不同的資料來源,在集中式資料型錄中管理您的資料,並且以視覺方式建立、執行與監控 ETL 管道,將資料載入到您的資料湖。

使用案例

簡化 ETL 管道開發

透過自動佈建和工作者管理免除掉基礎設施管理,並將您的所有資料整合需求併入單一裝置中。

進一步了解 AWS Glue Auto Scaling »

有效探索資料

在多個 AWS 資料集間快速識別資料,然後使其立即可供查詢和轉換之用。

進一步了解 AWS Glue Data Catalog »

以互動方式探索、試驗及處理資料

利用 AWS Glue 互動式工作階段,資料工程師能夠以互動方式使用整合式開發環境 (IDE) 或自己選擇的筆記本,來探索及準備資料。

進一步了解 AWS Glue 互動式工作階段 »

支援多種不同的處理架構和工作負載

更輕易地支援多種不同的資料處理架構 (例如 ETL 和 ELT) 以及不同的工作負載 (包括批次、微批次和串流)。

進一步了解如何串流 ETL 作業 »

如何開始使用

免費試用 AWS Glue

輕鬆地發現、準備、移動和整合無伺服器環境中多個來源的資料。

使用 AWS Glue 進行建置

了解如何使用 AWS Glue Studio 視覺化 ETL 介面來建立資料管道。

整合您的資料

遵循說明以設定和開始使用 AWS Glue。


探索更多 AWS 服務