AWS Glue

簡單、可擴展和無伺服器的資料整合

AWS Glue 是一種無伺服器資料整合服務,可輕鬆探索、準備和合併資料,用於分析、機器學習及應用程式開發。 AWS Glue 提供資料整合所需的所有功能,以便您可以開始分析資料並在數分鐘而非數月內投入使用。

資料整合是準備並合併資料以進行分析、機器學習和應用程式開發的過程。這涉及多項任務,例如探索並從各種來源擷取資料、豐富、清理、標準化及合併資料;在資料庫、資料倉儲和資料湖中載入並整理資料。這些任務通常由不同類型的使用者處理,每個使用不同的產品。

AWS Glue 為您提供視覺化界面和程式碼界面,讓您可以輕鬆整合資料。使用者可使用 AWS Glue 資料型錄輕鬆尋找並存取資料。只需在 AWS Glue Studio 上按幾下,資料工程師和 ETL (擷取、轉換和載入) 開發人員就可以視覺化方式建立、執行和監控 ETL 工作流程。資料分析師和資料科學家可以使用 AWS Glue DataBrew 以視覺化方式豐富、清理和標準化資料,而無需編寫程式碼。

免費的 1 百萬個物件存放

優勢

更快的資料整合

您組織中的不同小組可以使用 AWS Glue 一起合作完成資料整合任務,包括擷取、清理、標準化、合併、載入和執行可擴展的 ETL 工作流程。 這樣,您可以將分析資料並投入使用的時間從幾個月縮短到幾分鐘。

將資料整合大規模自動化

AWS Glue 可自動執行資料整合所需的大部分工作。AWS Glue 可網路爬取資料來源、識別資料格式,以及建議儲存資料使用的結構描述。它會自動產生程式碼以執行資料轉換和載入程序。您可以使用 AWS Glue 輕鬆執行和管理數千個 ETL 任務,或跨多個資料存放區使用 SQL 合併和複寫資料。

不必管理伺服器

AWS Glue 在無伺服器環境中執行。您不需要管理基礎設施,AWS Glue 會佈建、設定和擴展執行資料整合任務所需的資源。您只需為任務在執行時使用的資源付費。

使用案例


建置時間驅動型 ETL (擷取、傳輸和載入) 管道

AWS Glue 可以在新資料到達時執行 ETL 任務。例如,您可以使用 AWS Lambda 函數,當新資料在 Amazon S3 可用時立即觸發執行 ETL 任務。您也可以在 AWS Glue 資料型錄註冊這個新資料集,做為 ETL 任務的一部分。

事件驅動的 ETL 管道圖表

建立統一的型錄,以跨多個資料存放區尋找資料

您可以使用 AWS Glue 資料型錄快速探索和搜尋多個 AWS 資料集,過程中無需移動資料。資料編入型錄之後,即可使用 Amazon Athena、Amazon EMR 和 Amazon Redshift Spectrum 搜尋和查詢。

在 AWS Glue 中建立和執行 ELT 任務

無需編碼即可建立、執行和監控 ETL 任務

AWS Glue Studio 讓您可以以視覺化的方式建立、執行和監控 AWS Glue ETL 任務。您可以編寫 ETL 任務,該任務可使用拖放編輯器移動和轉換資料,而 AWS Glue 可自動產生程式碼。然後,您可以使用 AWS Glue Studio 任務執行儀表板來監控 ETL 執行,以確認任務按預期執行。在此處進一步了解 AWS Glue Studio。

適用於 ETL 開發人員的視覺化 ETL 工具

透過自助式視覺化資料準備探索資料

AWS Glue DataBrew 讓您可以直接從資料湖、資料倉儲和資料庫 (包括 Amazon S3、Amazon Redshift、AWS Lake Formation、Amazon Aurora 和 Amazon RDS) 中探索資料並進行實驗。您可以從 AWS Glue DataBrew 中 250 多個預先建置的轉換中進行選擇,以自動化資料準備任務,例如篩選異常、標準化格式和更正無效值。資料準備好後,您可以立即將其用於分析和機器學習。在此處進一步了解 AWS Glue DataBrew。

視覺化資料清理和資料標準化

最新消息

日期
  • 日期
1
AWS Glue 功能
查看 AWS Glue 功能

進一步了解 AWS Glue 的主要功能。

進一步了解 
註冊 AWS 帳戶
註冊免費帳戶

立即存取 AWS 免費方案。 

註冊 
開始在主控台進行建置
開始在 AWS Glue 進行建置

開始在視覺化 ETL 界面使用 AWS Glue 進行建置。

登入