Amazon SageMaker 融通式合作开发工作室现已在可视化 ETL 中支持更快的数据预览功能

发布于: 2026年3月9日

Amazon SageMaker 融通式合作开发工作室为可视化 ETL 推出了数据预览 v2.0,这是一种全新的数据预览模式,在构建和迭代可视化 ETL 作业时可提供近乎即时的结果。借助数据预览 v2.0,数据工程师和分析师可以在约一秒钟内看到每次转换的输出,无需启动会话,也不产生额外的计算成本。

数据预览 v2.0 使用浏览器内查询引擎在本地加载和处理数据,从而消除了预览操作对服务器端 Spark 会话的依赖。源数据仅提取一次并缓存在浏览器中,因此后续转换会立即生效,无需重新查询底层数据来源。对于 Amazon Redshift 用户而言,这意味着您可以迭代转换,无需对 Redshift 集群发起额外查询,既保证预览流程快速流畅,又能让集群资源专注于生产工作负载。数据预览 v2.0 支持来自 Amazon S3 的 CSV、Parquet 和 JSON 文件,此外还支持来自 Amazon Redshift、Amazon S3 表类数据存储服务、AWS Glue Data Catalog 以及包括 Snowflake、MySQL、PostgreSQL、SQL Server、Oracle、Google BigQuery、Amazon DynamoDB 和 Amazon DocumentDB 在内的第三方来源的数据。可视化 ETL 编辑器中提供一个开关,使您可以随时在数据预览 v2.0 和基于 Spark 的原始预览之间切换。

可视化 ETL 中的数据预览 v2.0 已在支持 Amazon SageMaker 融通式合作开发工作室的所有 AWS 区域推出。要了解更多信息,请访问 Amazon SageMaker 融通式合作开发工作室文档