发布于: Oct 23, 2023

Amazon SageMaker Feature Store 支持将自定义数据源整合到特征处理管道的功能。您可以通过合并不同的数据源、定义要执行的转换函数来构建更丰富、更多样化的机器学习特征,SageMaker Feature Store 负责将数据处理成机器学习特征。 

通过此次发布,您可以连接到 Amazon Kinesis 等流数据源,并使用 Spark 结构化流式传输创作转换,Spark 结构化流式传输是一款用于实时数据处理的可扩展且容错的流处理引擎。您还可以连接到 Amazon Redshift、Snowflake 和 Databricks 等数据仓库进行批量特征处理,并使用 Amazon EventBridge 规则按计划或使用触发器启动特征处理。Amazon SageMaker Feature Store 创建和管理管道,并写入特征组,以便在机器学习模型服务和训练中使用。您可以追踪管道执行情况、可视化任务流水线以将特征追溯回数据来源,以及查看特征处理代码,这些都可以在 Amazon SageMaker Studio 的一个环境中完成。

要了解更多信息,请查看此处的文档。要开始使用,请从 Amazon SageMaker 控制台前往 SageMaker Studio。