发布于: Oct 11, 2021
我们很高兴地宣布推出 Amazon Fraud Detector 的事件数据集存储。此新功能帮助客户直接在 Amazon Fraud Detector 中轻松发送以及存储其生产欺诈数据。客户可以使用其事件数据集来训练具有更高预测性能的机器学习 (ML) 模型,因为这些模型能够通过自动计算账户年龄和购买频率等数值,将历史背景应用于新事件。客户还可通过再训练模型更快地行动,而无需将新的训练数据集上载至 S3,并且能够通过更新存储事件的欺诈标签,关闭离线欺诈调查的反馈循环。
在此功能发布之前,客户仅能根据存储在 S3 中的数据训练模型。若要对模型进行再训练,客户需要手动更新其数据集,将最新的数据集上载到 S3,然后将 Amazon Fraud Detector 指向它。这些数据准备步骤使得模型再训练耗时更长,从而增加了模型“过时”的风险。
使用最新推出的事件数据集,客户可将其历史事件数据直接上载至 Amazon Fraud Detector 以训练模型。事件数据集还会随着每个新预测自动更新,因此无需为每个模型再训练上载新数据集。事件数据集指标(例如事件数量和数据集大小)会自动更新,也可按需刷新。客户可以根据离线评论更新事件标签(例如,欺诈、合法)以关闭机器学习 (ML) 反馈循环。通过将事件数据集存储在 Amazon Fraud Detector 中,客户现在能够以更少的点击次数训练新模型或再训练现有模型。
首先,创建一个新的事件类型或选择一个现有的事件类型,然后导航到 Fraud Detector 控制台中的“Stored events(存储事件)”选项卡。在此选项卡中,您可以为预测启用实时事件存储。要存储历史数据,您可以上载事件数据的 CSV 文件或使用新的 SendEvent API 将事件流式传输到 Amazon Fraud Detector。拥有存储的数据集后,您可以通过选择“stored events(存储事件)”作为模型训练数据源来快速训练或再训练模型版本。事件数据存储成本为每月每 GB 0.10 美元,现已在美国东部(弗吉尼亚北部)、美国东部(俄亥俄)、美国西部(俄勒冈)、欧洲(爱尔兰)、亚太地区(新加坡)和亚太地区(悉尼)区域推出。有关事件数据存储的其他详细信息,请参阅我们的文档。