張貼日期: Apr 27, 2020

AWS Glue 現在支援無伺服器串流 ETL 任務。憑藉此功能,可以輕鬆設定連續的擷取管道,以準備 IoT 事件串流、點擊流和網路日誌等資料,並讓其可在幾秒鐘內進行分析。AWS Glue 現在可以取用來自 Amazon Kinesis 和 Apache Kafka 等串流來源的資料,在執行中對其進行清除和轉換,然後將結果連續載入 Amazon S3 資料湖、資料倉儲和其他資料存放區。AWS Glue 串流 ETL 任務在 Apache Spark 結構化串流引擎上執行,因此客戶可將其用於豐富、彙總和合併資料,以及執行各種複雜的分析和機器學習操作。 

之前,您必須手動建構串流處理和監控系統,並將其拼接在一起,以建置串流資料擷取管道。AWS Glue 中的串流 ETL 任務利用 AWS Glue 的無伺服器基礎架構來簡化資源管理,最佳化成本,讓您無需編寫程式碼即可設定連續的擷取管道,從而將實作時間從數月縮短至數天。 

這項功能目前在提供 AWS Glue 的相同 AWS 區域開放使用。 

若要進一步了解此功能,請瀏覽我們的文件。