為什麼選擇 AWS Glue?
準備您的資料以取得高品質結果是分析或 ML 專案的第一步。AWS Glue 是一項無伺服器資料整合服務,可使資料準備變得更簡單、快速而且實惠。您可以發現並連線到超過 70 個不同的資料來源,在集中式資料型錄中管理您的資料,並且以視覺方式建立、執行與監控 ETL 管道,將資料載入到您的資料湖。
AWS Glue 簡介 (01:54)
運作方式
AWS Glue 是一種無伺服器、可擴展的資料整合服務,可讓您更輕鬆地探索、準備、移動和整合來自多個來源的資料,以進行分析、機器學習 (ML) 和應用程式開發。
-
資料整合引擎選項
-
事件驅動的 ETL
-
AWS Glue Data Catalog
-
無程式碼 ETL 任務
-
管理和監控資料品質
-
資料準備
-
資料整合引擎選項
-
事件驅動的 ETL
-
AWS Glue 可在新資料到達時執行擷取、轉換和載入 (ETL) 任務。例如,您可以設定 AWS Glue 在 Amazon Simple Storage Service (S3) 上的新資料變得可用時立即開始執行您的 ETL 任務。
-
AWS Glue Data Catalog
-
您可以使用資料型錄快速探索和搜尋多個 AWS 資料集,而無需移動資料。資料編入型錄之後,即可使用 Amazon Athena、Amazon EMR 和 Amazon Redshift Spectrum 搜尋和查詢。
-
無程式碼 ETL 任務
-
AWS Glue Studio 讓您可以更輕鬆地以視覺化方式建立、執行和監控 AWS Glue ETL 任務。您可以建置 ETL 任務,該任務可使用拖放編輯器移動和轉換資料,而 AWS Glue 可自動產生程式碼。
-
管理和監控資料品質
-
資料準備
-
藉助 AWS Glue DataBrew,您可以探索和試驗直接來自資料湖、資料倉儲和資料庫的資料,包括 Amazon S3、Amazon Redshift、AWS Lake Formation、Amazon Aurora 和 Amazon Relational Database Service (RDS)。您可以從 DataBrew 中 250 多個預先建置的轉換中進行選擇,以自動化資料準備任務,例如篩選異常、標準化格式和更正無效值。