Amazon SageMaker Unified Studio 現已支援在視覺化的 ETL 中更快進行資料預覽
Amazon SageMaker Unified Studio 推出適用於視覺化的 ETL 資料預覽 2.0 版,這是一種新的資料預覽模式,可在建置和迭代視覺化的 ETL 工作時提供近乎即時的結果。透過資料預覽 2.0 版,資料工程師和分析師可以在大約一秒內查看每個轉換的輸出結果,無需啟動工作階段,也不會產生額外的運算成本。
資料預覽 2.0 版使用瀏覽器內建的查詢引擎,在本機載入並處理資料,藉此消除了對在伺服器端 Spark 工作階段進行預覽作業的依賴性。只會擷取一次來源資料,並在瀏覽器中快取,因此後續轉換可以立即套用,而無需重新查詢基礎資料來源。對於 Amazon Redshift 使用者,這表示您可以在轉換上進行迭代,而無需對 Redshift 叢集進行額外查詢,從而保持預覽工作流程快速運行,並將叢集資源集中用於生產工作負載。資料預覽 2.0 版除了支援來自 Amazon Redshift、Amazon S3 Tables、AWS Glue Data Catalog 以及第三方來源 (包含 Snowflake、MySQL、PostgreSQL、SQL Server、Oracle、Google BigQuery、Amazon DynamoDB 和 Amazon DocumentDB) 外,還支援來自 Amazon S3 的 CSV、Parquet 和 JSON 檔案。視覺化的 ETL 編輯器中的切換功能,可讓您隨時在資料預覽 2.0 版和原始 Spark 型預覽之間切換。
視覺化的 ETL 中資料預覽 2.0 版已在支援 Amazon SageMaker Unified Studio 的所有 AWS 區域推出。若要進一步了解,請造訪 Amazon SageMaker Unified Studio 文件。