亚马逊AWS官方博客

Amazon Fraud Detector 现已全面推出

 

公告的内容

Amazon Fraud Detector 现已全面推出! 🥳

如果您错过了 2019 re:Invent 周期间的公告,Amazon Fraud Detector 最初是在 2019 年 12 月 3 日以预览模式发布的。但今天,它已全面推出,供客户查看。

什么是 Amazon Fraud Detector?

Amazon Fraud Detector 是一项完全托管的服务,可用于轻松识别潜在的网络欺诈行为,例如在线支付欺诈和创建虚假账户。

你知道吗,每年全世界因网络欺诈造成的经济损失达数百亿美元?

开展网上业务的公司必须时刻警惕欺诈行为,比如伪造账户和用被盗信用卡进行支付。  他们识别欺诈者的一种方法是使用欺诈检测应用程序,其中一些应用程序使用了 Machine Learning (ML)。

进入 Amazon Fraud Detector! 这项服务使用您的数据、ML 并利用 Amazon 20 多年的欺诈检测专业知识自动识别潜在的网络欺诈行为,使您可以更快的抓获更多欺诈行为。您只需单击几下就可以创建一个欺诈检测模型,并且不需要任何 ML 经验,因为 Fraud Detector 可以为您处理所有繁重的 ML 工作。

工作原理…

“但它的工作原理是什么?”或许你会问。🤷🏻‍♀️

非常高兴你提出这样的问题! 我们用 5 个主要步骤对它进行总结。👩🏻‍💻

  • 步骤 1:定义您要评估是否具有欺诈性的事件。
  • 步骤 2:上传您的历史事件数据集到 Amazon S3 中并选择一种欺诈检测模型类型。
  • 步骤 3:Amazon Fraud Detector 将您的历史数据用作输入来构建自定义模型。该服务会自动检查和丰富数据,执行功能工程、选择算法、训练和调优您的模型并托管模型。
  • 步骤 4:创建规则以基于模型预测接受、审查或收集更多信息。
  • 步骤 5:从您的在线应用程序调用 Amazon Fraud Detector API,以接收实时欺诈预测并基于配置的检测规则采取措施。 (示例:电子商务应用程序可以发送电子邮件和 IP 地址,并从您的规则(例如审查)中接收欺诈评分以及输出)

我们来看一下演示…

我们来进行一下演示,以更好地了解它们是如何结合在一起的。在今天的博客文章中,我们将带您逐步了解两个主要组件:构建 Amazon Fraud Detector 模型生成实时欺诈预测

第 1 部分:构建 Amazon Fraud Detector 模型

我们首先将虚构生成的训练数据上传到 S3 存储桶中。事实上,用户指南中有示例数据集,我们可以使用。当我们下载该 CSV 文件后,我们需要将此训练数据放入 S3 存储桶中。

出于上下文考虑,我们也来打开这个 CSV 文件,看看里面有什么…

👉🏾注:使用 Amazon Fraud Detector,您最少能够选择 2 个变量来训练模型,而不仅仅是电子邮件IP 地址。(事实上,该模型最多支持 100 个输入!)

我们继续定义(创建)事件。事件本质上是特定事件的一组属性。我们对想要进行欺诈评估的事件的结构进行了定义。(Amazon Fraud Detector 评估“事件”是否存在欺诈。)

我们来创建一个新实体。此实体代表触发事件的人或物。

event_details

create_entity

我们继续了解 Event Variables(事件变量)。我们将从训练数据集中选择变量。这样一来,我们可以使用之前提到的 CSV 文件并拉入标题中。

对于 IAM role(IAM 角色)部分,我们创建一个新角色。我将使用与我刚创建的存储桶相同的名称“fraud-detector-training-data”。

现在,我们可以上传之前提到的 CSV 文件,以拉入标题中


由于我们将定义模型,我们必须至少定义两个标签

最后,我们来创建事件!

如果一切顺利,我们将看到一个绿色的条,提醒我们事件已成功创建!

event_detail_page

现在,是时候创建模型了。

 

我们来花点时间定义模型详细信息。我们确保选择以前创建的事件类型

create_model_step_1

我们继续配置训练并确保选择 Fraud(欺诈)和 Legitimate(合法)标签下的标签。(这使我们可以将分类分开,以便模型可以学会区分这两个表。)

模型需要 30-40 分钟,最多需要数小时,具体取决于数据集大小。此示例数据集大约需要 40 分钟来训练模型。

在本篇博客文章中,我们假设已跳过 40 分钟训练已完成模型的时间。🙌🏾

model_detail_page

您还可以查看您的模型性能指标

model_performance

现在,我们可以继续部署模型

deploy_model_1

弹出的模型要求我们确认这是我们想要部署版本

deploy_model_confirmation

 

 

第 2 部分:生成实时欺诈预测

是时候生成实时欺诈预测了! 准备好了吗?

此时,您已经拥有了一个满意的已部署模型,并且想要将它用于获取预测。

我们必须构建检测器,检测器是您的模型和规则的容器,是您想要用于评估事件的检测逻辑。

我们继续来定义检测器详细信息。

我们还要确保选择以前创建的事件

detector_wizard_step_1

现在,我们选择模型

add_model_to_detector

我们继续来制定一些阈值规则

这些规则可说明模型输出。它们还决定了探测器输出

high_fraud_risk_rule

我们再来指定两个规则。

除了 high_fraud_risk 标签之外,我们还想添加 low_fraud_riskmedium_fraud_risk 标签。

low_fraud_risk_rule

medium_fraud_risk_rule

请记住,这些规则阈值只是示例。当您为自己的检测器创建规则时,您应该基于您的模型、数据和业务使用适当的值。

现在,在本博文的示例中,这些特定阈值从来不会同时匹配。

three_rules_created

这意味着,任一个规则执行模式都适合在我们当前的示例中使用。

哇! 我们已经创建好自己的检测器

detector_created_banner

现在,我们来点击 Rules(规则)选项卡。

detector_rules_tab

我们还可以在 Models(模型)选项卡下查看我们有哪些模型。

detector_models_tab

如果我们返回 Overview(概述)选项卡,我们甚至可以运行快速测试! 我们可以运行测试,以从检测器输出中采样。

run_test

当我们准备就绪后,我们可以发布此版本的检测器使其成为活动版本。每个检测器一次都可以有一个活动版本。

publish_detector

弹出模型要求我们确认我们已准备好发布此版本

下一步是运行实时预测! 我们来用 Amazon SageMaker 笔记本展示一次性示例预测,看看它会是什么样子。

我们移动到 Amazon SageMaker 控制台,并转到 Notebook(笔记本)实例。

在此情况下,您可以看到,我已经有一个 Jupyter 笔记本,已准备好运行。

我们将要运行 get_event_prediction 数据块。这是我们的主运行时 API,客户可以使用脚本来调用它,以运行一批示例预测。或者,客户还可以将此 API 集成到他们的应用程序中以生成实时预测,并根据风险动态调整用户体验。

运行此数据块之后,我们收到下面几个模型评分结果。

我们在此检测器中有 1 个模型,它返回的评分为 933。根据我们创建的规则,这意味着我们认为此交易返回的是 high_fraud_risk

get_prediction

我们再回到 Amazon Fraud Detector 控制台并查看检测器中的规则

从检测器规则中,我们可以看到,如果风险评分超过 900,则结果应为 verify_customer。

循环到此完成!

现在,我们确认,您可以实时调用此检测器并获得自己的欺诈预测。

🌎 最后…
Amazon Fraud Detector 现已向客户全面推出,可以与很多 AWS 服务集成,例如 Amazon CloudWatchAWS CloudTrailAWS PrivateLink 等。

要了解 Amazon Fraud Detector 的更多信息,请访问网站开发人员指南

 

感谢阅读!
~Alejandra 💁🏻‍♀️🤖  y Canela 🐾