发布于: Aug 29, 2022

Amazon SageMaker Data Wrangler 可将 Amazon SageMaker Studio 中的机器学习 (ML) 所需数据的聚合和准备时间从数周减少至几分钟。Amazon SageMaker Studio 是首个适用于机器学习的完全集成式开发环境 (IDE)。借助 SageMaker Data Wrangler,您可以简化数据准备和特征工程的过程,并从单个直观的界面完成数据准备工作流程的每个步骤,包括数据选择、清洗、探索和可视化等。使用 Data Wrangler 的客户可以从 Amazon S3、Amazon Athena、Amazon Redshift、Snowflake、Databricks Lakehouse Platform 等导入数据。

从今天开始,刚开始使用 Data Wrangler 的客户可以通过使用一个示例数据集并按照指导步骤首次浏览该产品,以更快地开始使用 Data Wrangler。Data Wrangler 提供了广泛用于机器学习指导和试验的公共泰坦尼克号数据集,因此客户不再需要导入自己的数据即可开始使用。Data Wrangler 现在会提供操作建议,以帮助首次使用的用户发现关键功能,例如数据质量和洞察报告,这是一种检查数据质量并帮助检测数据异常的常见功能。

要了解有关开始使用 Amazon SageMaker Data Wrangler 的更多信息,请访问博客AWS 文档