发布于: Dec 16, 2022
今天,Amazon SageMaker Feature Store 宣布 SageMaker Python SDK 支持离线存储。Amazon SageMaker Feature Store 是一个完全托管的专用存储库,用于存储、更新、搜索和共享机器学习 (ML) 特征。SageMaker Feature Store 离线存储包含历史 ML 特征,您可以使用它来生成用于训练和批量推理的训练数据集。直至今日,您必须使用 Athena 和 Glue 并编写临时 SQL 查询来创建这些训练数据集。
此次发布后,您可以使用 Python SDK 方法创建训练数据集。SDK 可用于将数据读入数据框架或将其导出为 csv。您无需编写复杂的 SQL 查询,即可调用这些方法来处理常见的离线存储使用案例,例如加入特征组、时间旅行、创建时间点精确联接以及筛选训练数据集中的重复记录。
要了解更多信息,请查看此处的文档。要开始使用,请登录 Amazon SageMaker 控制台。