為什麼選擇 AWS Glue?
準備您的資料以取得高品質結果是分析或 ML 專案的第一步。AWS Glue 是一項無伺服器資料整合服務,可使資料準備變得更簡單、快速而且實惠。您可以發現並連線到超過 70 個不同的資料來源,在集中式資料型錄中管理您的資料,並且以視覺方式建立、執行與監控 ETL 管道,將資料載入到您的資料湖。
AWS Glue 簡介 (01:54)

運作方式

AWS Glue 是一種無伺服器、可擴展的資料整合服務,可讓您更輕鬆地探索、準備、移動和整合來自多個來源的資料,以進行分析、機器學習 (ML) 和應用程式開發。

  • 資料整合引擎選項
  • 在 AWS Glue 中選擇您偏好的資料整合引擎,來為您的使用者和工作負載提供支援。

    圖表顯示了 AWS Glue 的多個資料處理引擎選項。
  • 事件驅動的 ETL
  • AWS Glue 可在新資料到達時執行擷取、轉換和載入 (ETL) 任務。例如,您可以設定 AWS Glue 在 Amazon Simple Storage Service (S3) 上的新資料變得可用時立即開始執行您的 ETL 任務。

    圖表顯示 AWS Glue 如何在新資料到達時執行 ETL 任務。
  • AWS Glue Data Catalog
  • 您可以使用資料型錄快速探索和搜尋多個 AWS 資料集,而無需移動資料。資料編入型錄之後,即可使用 Amazon Athena、Amazon EMR 和 Amazon Redshift Spectrum 搜尋和查詢。

    圖表顯示資料型錄發現與搜尋資料集,而不移動資料。
  • 無程式碼 ETL 任務
  • AWS Glue Studio 讓您可以更輕鬆地以視覺化方式建立、執行和監控 AWS Glue ETL 任務。您可以建置 ETL 任務,該任務可使用拖放編輯器移動和轉換資料,而 AWS Glue 可自動產生程式碼。

    圖表顯示使用者如何使用拖放編輯器,來編寫移動和轉換資料的 ETL 任務。
  • 管理和監控資料品質
  • AWS Glue Data Quality 可自動建立、管理和監控資料品質規則,以協助確保跨資料湖和管道的高品質資料。

    該圖表顯示 AWS Glue Data Quality 如何自動測量、監控和管理資料湖和資料管道中的資料品質。
  • 資料準備
  • 藉助 AWS Glue DataBrew,您可以探索和試驗直接來自資料湖、資料倉儲和資料庫的資料,包括 Amazon S3、Amazon Redshift、AWS Lake Formation、Amazon Aurora 和 Amazon Relational Database Service (RDS)。您可以從 DataBrew 中 250 多個預先建置的轉換中進行選擇,以自動化資料準備任務,例如篩選異常、標準化格式和更正無效值。

    圖表顯示 DataBrew 如何自動為使用者開始資料準備任務。

使用案例

支援多種不同的處理架構和工作負載

More easily support various data processing frameworks, such as ETL and ELT, and various workloads, including batch, micro-batch, and streaming.

簡化 ETL 管道開發

Remove infrastructure management with automatic provisioning and worker management, and consolidate all your data integration needs into a single service.

有效探索資料

Quickly identify data across AWS, on premises, and other clouds, and then make it instantly available for querying and transforming.

以互動方式探索、試驗及處理資料

Using AWS Glue interactive sessions, data engineers can interactively explore and prepare data using the integrated development environment (IDE) or notebook of their choice.

最新消息

  • 日期 (最新到最舊)
找不到結果
1

探索更多 AWS 服務