发布于: Dec 8, 2020
我们很高兴地宣布推出 Amazon SageMaker Feature Store,这是 Amazon SageMaker 的一项新功能,用于摄取、存储、共享、重用和提供实时和批处理机器学习 (ML) 应用程序的特征。
在机器学习中,特征是 ML 模型赖以做出精确预测的数据信号。在训练过程中,需要批量存储特征以训练多个变体。在精确预测推理过程中,需要实时使用相同的特征。保持训练和推理之间的一致性非常困难,因为这可能会导致预测不准确或需要额外编写编码。
Amazon SageMaker Feature Store 是一个完全托管的存储库,它有助于保持推理和模型训练所用特征的一致性,因此您可以放心地在生产环境中部署模型,并提高行为可预测性,以大规模运行 ML 模型。Amazon SageMaker Feature Store 通过简单的标记和搜索来管理元数据和发现特征,因此数据科学团队可以轻松地重用现有特征,而不必为每个新模型重写和处理特征。对于实时预测,可以较低的毫秒延迟提供特征,或从特征库中提取特征,以用于模型训练或批量预测使用案例。Amazon SageMaker Feature Store 管理特征数据的历史记录,以便可以在特定时间点轻松重现这些特征。借助 Amazon SageMaker Feature Store,您可以加快机器学习速度、提高生产率,并跨数千个模型进行扩展。