发布于: Jul 19, 2019
借助 Amazon SageMaker 批量转换,您可以针对 Amazon S3 中存储的数据集运行预测。如果您需要处理大批量数据且不需要次秒级延迟,则 Amazon SageMaker 批量转换为理想之选。现在,您可以将您的批量转换作业配置为从预测请求中排除特定数据属性,并将一些或所有输入数据属性与预测结果关联起来。因此,针对 CSV 或 JSON 格式的数据运行批处理预测时,您无需再额外执行预处理或后处理操作。
例如,考虑包含 ID、年龄和身高这三个属性的数据集。ID 属性是一个随机生成的数或一个连续编号,在处理 ML 问题时,此属性不带符号,在训练 ML 模型时不使用此属性。现在,您可以将您的批量转换作业配置为从每条记录中排除 ID 属性,且在发送给 ML 模型的预测请求中仅传递年龄和身高属性。您还可以将您的批量转换作业配置为将 ID 属性与作业的最终 S3 输出中的预测结果相关联。按照这种方式保留记录级别的属性对分析预测结果非常有用。
这项新功能已在支持 Amazon SageMaker 的所有区域推出。要详细了解此功能,请参阅《Amazon SageMaker 开发人员指南》。