发布于: May 1, 2023
Amazon SageMaker Data Wrangler 可将汇总和准备机器学习 (ML) 数据所需的时间从数周缩短至几分钟。借助 SageMaker Data Wrangler,您可以简化数据准备和特征工程的过程,并完成数据准备工作流的每个步骤,包括通过单个可视界面进行数据选择、探索、清理和处理。
从今天开始,您可以使用 Amazon SageMaker Data Wrangler 的新功能来准备用于标记、训练或推理的图像数据。您可以从 Amazon S3 预览和导入图像,使用各种内置图像转换功能来清理、标准化和提高图像数据的质量。这些内置转换包括调整大小、删除重复项、旋转、翻转、灰度、增强对比度、模糊和添加噪声等。Data Wrangler 还支持高级使用案例,例如检测异常值或使用自定义代码和内置代码段从图像中提取文本。这些代码段包含有关如何借助 Amazon Sagemaker Jumpstart 使用预训练模型通过调用预部署模型端点执行高级分析或转换的示例。在交互模式下对采样图像数据创建食谱后,您可以通过可视界面创建 PySpark 作业,以扩展对数据集中所有图像的处理。
Data Wrangler 在其目前支持的所有区域中均支持图像数据准备。要了解更多信息,请参阅此博客文章和 AWS 技术文档。