发布于: Jan 28, 2021
AWS Glue DataBrew 的数据集现在支持另外六种分隔符,让您能够灵活地将多种 .csv 和 .tsv 文件导入 DataBrew 以准备数据。支持的分隔符包括:
- 逗号 (,)
- 冒号 (:)
- 分号 (;)
- 管道 (|)
- 制表符 (\t)
- 脱字符 (^)
- 空格 ( )
AWS Glue DataBrew 为客户提供了 250 多种预构建的转换来自动执行数据准备任务(例如,筛选异常、标准化格式和更正无效值),不再需要花费数天或数周的时间来编写人工编码转换。准备好数据后,客户可以立即将其用于 AWS 和第三方分析及机器学习服务,从而查询数据和训练机器学习模型。
要了解更多信息,请观看此入门视频或使用示例数据集来了解 DataBrew。
要开始使用,请访问 AWS 管理控制台或在您的笔记本环境中安装 DataBrew 插件并参阅 DataBrew 文档。