Amazon SageMaker 提供额外的可视化 ETL 转换和 S3 表类数据存储服务支持
Amazon SageMaker 现在提供 14 种新的内置可视化 ETL 转换:“格式化时间戳”、“拆分字符串”、“正则表达式提取器”、“自动均衡处理”、“UUID(通用唯一标识符)”、“标识符”、“将列逆透视为行”、“将行透视为列”、“解析 JSON 列”、“提取 JSON 路径”、“查询”、“条件路由器”、“路由组”以及“排序依据”。通过这些转换,ETL 开发人员无需为常见的转换任务编写自定义代码,即可快速构建更复杂的数据管道。此外,Amazon SageMaker 智能湖仓节点现在支持 Amazon S3 表类数据存储服务。您可以灵活地在 S3 表类数据存储服务中就地访问和预览数据。
Amazon SageMaker 中的可视化 ETL 提供了一个拖放式界面,用于构建 ETL 流,以及使用 Amazon Q 开发者版编写流。每种新的可视化 ETL 转换都能满足独特的数据处理需求。例如,使用“标识符”为数据集中的每一行分配数字标识符,使用“解析 JSON 列”转换 JSON 字符串,可将 JSON 字符串转换为数据结构或数组,或使用“提取 JSON 路径”转换以仅提取所需的 JSON 路径。
这些可视化 ETL 转换现已在所有提供 Amazon SageMaker 的 AWS 区域推出。请访问支持的区域列表,了解最新的可用性信息。
要了解更多信息,请访问 Amazon SageMaker 文档。