Amazon SageMaker 提供額外的視覺化 ETL 轉換和 S3 Tables 支援
Amazon SageMaker 現在提供 14 個新的內建 Visual ETL 轉換:「格式時間戳記」、「拆分字串」、「Regex 提取器」、「自動平衡處理」、「UUID (通用唯一識別)」、「識別碼」、「將欄轉換為列」、「剖析 JSON 欄」、「擷取 JSON 路徑」、「查閱」、「條件式路由器」、「路由群組」和「排序依據」。有了這些轉換,ETL 開發人員可以快速建置更複雜的資料管道,而無需為常見的轉換任務編寫自訂程式碼。此外,Amazon S3 Tables 已經由 Amazon SageMaker 資料湖倉節點提供支援。這可為您提供跨 S3 資料表的彈性存取和就地資料預覽功能。
Amazon SageMaker 中的視覺化 ETL 提供拖放介面,可用於使用 Amazon Q Developer 建置 ETL 流程和編寫流程。每個新的視覺化 ETL 轉換都能滿足獨特的資料處理需求。例如,使用「識別碼」為資料集中的每一列指派一個數字識別碼,使用「剖析 JSON 欄」將 JSON 字串轉換為資料結構或陣列,或者使用「擷取 JSON 路徑」轉換來僅擷取所需的 JSON 路徑。
這些視覺化 ETL 轉換現在適用於所有提供 Amazon SageMaker 的 AWS 區域。請存取支援的區域清單,以取得最新的可用性資訊。
若要進一步了解,請瀏覽我們的 Amazon SageMaker 文件。