2022 年

HUMAN Security 使用 Amazon SageMaker 加快机器学习培训和上市速度

网络安全公司 HUMAN Security 通过使用 Amazon SageMaker，将其部署到生产环境中的机器学习（ML）模型数量增加了两倍，并提高了其数字解决方案的质量。HUMAN Security 提供使用机器学习检测欺诈的解决方案，该公司希望通过自动化训练和部署其机器学习模型来加快上市速度。

概述 | 机会 | 解决方案 | 结果 | 使用的 AWS 服务

几周到几小时

训练新 ML 模型所需的时间从几周缩短到几小时

3 倍

部署到生产环境的 ML 模型数量是原先的 3 倍

5 倍

与之前的系统相比，摄入的数据量是原先的 5 倍

15 万亿

每周验证的在线互动次数达到 15 万亿次

概述

HUMAN Security 希望更快地迭代其 ML 模型并加快上市速度，以便提高 MediaGuard 的性能，MediaGuard 是其领先的解决方案，可帮助保护媒体公司和广告商免受广告欺诈。但是，当该公司首次发布 MediaGuard 时，其工程团队是通过手动方式训练和部署所有机器学习模型的。这一手动过程消耗了 HUMAN Security 的很大一部分资源，在某些情况下，公司花费了数周时间才将 ML 模型部署到生产环境中。

为了更高效地训练其 ML 模型，HUMAN Security 希望将其手动训练过程自动化。由于过去使用过 Amazon Web Services（AWS），因此 HUMAN Security 采用了 Amazon SageMaker，它使公司能够使用完全托管的基础设施、工具和工作流，为几乎任何应用场景构建、训练和部署 ML 模型。通过将自动化与可扩展性相结合，该公司训练的 ML 模型数量达到之前流程的三倍，同时摄取的数据量是之前流程的五倍。现在，HUMAN Security 可以在几个小时内训练和部署机器学习模型，从而加快其上市速度并提高其产品质量。

机会 | 瓦解网络犯罪经济学

HUMAN Security 使用现代防御策略（包括中断、网络效应和互联网可见性）来瓦解网络犯罪的经济学。该公司通过提供范围广泛的网络安全解决方案，来帮助各行各业的企业提高其数字存在的安全性，这些解决方案可帮助企业保护其数字资产免受欺诈侵害，以及模仿人类的在线机器人的侵害。该公司为数字广告商创建了 MediaGuard，这是一种广告技术解决方案，该方案在人类防御平台中，使用 ML 来近乎实时地预测所有数字渠道和格式的在线广告曝光量的有效性。

由于在线机器人变得越来越复杂，HUMAN Security 对 MediaGuard 保持严格的延迟和准确性要求，其工程师团队不断迭代新的 ML 模型以提高其性能。但是，当 HUMAN Security 推出该解决方案时，其 ML 模型的训练过程完全是手动的，涉及运行大量脚本以及复制和粘贴不同的配置。在许多情况下，HUMAN Security 花费了数周时间来部署新的 ML 模型。“我们想节省人工时间，”HUMAN Security 的数据科学家 Austin Leirvik 说。“我们希望建立一个完整的数据管道，只需按一下按钮即可完成数据准备、数据提取、模型训练和离线模型评估。”

自 2012 年成立以来，HUMAN Security 一直依赖 AWS 提供云解决方案，2020 年，该公司聘请 AWS 团队来完善其 ML 能力。“我们每两周合作一次”，Leirvik 说。“我们收到了很多关于如何实现模型训练自动化的反馈，并将 SageMaker 视为可以用来解决我们面临问题的工具。”

通过使用 Amazon SageMaker，我们大大缩短了训练机器学习模型所需的时间。”

Austin Leirvik
HUMAN Security 资深数据科学家

解决方案 | 自动化 ML 的训练过程

在 HUMAN Security 与 AWS 团队互动的同时，该公司还通过 AWS 参与了多个培训机会，包括 AWS 合作伙伴网络沉浸日，这是 AWS 合作伙伴举办的客户研讨会。这些培训机会帮助 HUMAN Security 提高了员工的技能，并对 ML 模型生命周期有了更深入的了解。HUMAN Security 还采用了 Snowflake Data Cloud，这是由 AWS 合作伙伴 Snowflake 提供的一款用于数据仓库、数据湖、数据工程、数据科学、数据应用程序开发和数据共享的解决方案。该公司使用该解决方案来大规模处理和存储其数据表。“在典型的模型训练运行中，我们要处理大约 5000 万个数据点”，Leirvik 说。“因为我们可以在更大的数据集上进行离线评估，所以我们对长尾有更全面的了解，这真的很不错。”

该公司还开始使用 AWS Glue，这是一种简单、可扩展的无服务器数据集成服务。HUMAN Security 使用 AWS Glue 进行提取任务并准备数据以供查询。准备好数据后，HUMAN Security 使用 SageMaker 来构建、训练和部署新的机器学习模型。“通过使用 Amazon SageMaker，我们大大缩短了训练机器学习模型所需的时间”，Leirvik 说。“我们的所有模型都具有完全的可追溯性和可重复性。” 以前，训练一个新的 ML 模型可能需要 HUMAN Security 花费数周时间。现在，该公司在数小时内即可构建、训练和部署新的 ML 模型。

此外，HUMAN Security 使用 Amazon Elastic Compute Cloud（Amazon EC2）M5 实例运行其工作负载，这些实例为通用工作负载提供平衡的计算、内存和网络资源。自从改用这种 Amazon EC2 实例类型以来，该公司增加了 15% 的成本节省，并且可以快速扩大需求。这种可扩展性有助于 HUMAN Security 为其 ML 模型提供支持，以验证每周 15 万亿次在线互动的人性化。“我们对 Amazon EC2 M5 实例的可扩展性和可靠性非常满意”，Leirvik 说。“我们已经能够将正在处理的数据量增加到原来的五倍。”

为了实现完全自动化，HUMAN Security 在其所有 AWS 解决方案中都设置了步骤函数，方法是使用 Amazon States Language 定义一组配置文件，并将这些文件与 ML 代码库的其余部分一起添加到其存储库中。无论何时对其代码库进行更改，该公司都会自动重新部署这些步骤函数，从而降低了其工作流程的复杂性。这种自动化帮助该公司缩短了上市时间并提高了业务灵活性。由于节省了更多时间，HUMAN Security 已将工作重点重新放在为 MediaGuard 发布新的预测功能上。“通过使用 AWS，我们的部署数量相较于之前的流程增加了两倍”，Leirvik 说。“现在，我们可以在发现性能问题后更快做出反应。”

结果 | 将其所学经验应用于其他 ML 模型

HUMAN Security 计划将其从该项目中吸取的经验应用于生产环境中的其他机器学习模型。该公司还将继续将 AWS 服务用于其各种应用场景。“与 AWS 团队合作是一次非常积极的经历”，Leirvik 说。“AWS 团队帮助我们以全新的方式看待我们面临的问题，并让我们跟上步伐，从而取得成功。”

关于 HUMAN Security

HUMAN Security 通过提供使用 ML 验证在线互动真实性的网络安全解决方案，帮助企业保护其数字资产免受欺诈。自 2012 年以来，该公司一直是 AWS 上的独立软件供应商。

使用的 AWS 服务

Amazon SageMaker

Amazon SageMaker 建立在 Amazon 二十年来开发现实世界 ML 应用程序的经验之上，这些应用程序包括产品推荐、个性化、智能购物、机器人技术和语音辅助设备。

了解详情 »

AWS Glue

AWS Glue 是一项无服务器数据集成服务，它简化了发现、准备和合并数据以进行分析、机器学习和应用程序开发的工作。

了解详情 »

Amazon EC2

Amazon Elastic Compute Cloud（Amazon EC2）提供最广泛、最深入的计算平台，拥有超过 500 个实例，可选择最新的处理器、存储、网络、操作系统和购买模型，以帮助您最好地满足工作负载的需求。

了解详情 »

Amazon EC2 M5 实例

M5 实例可针对各种工作负载实现计算、内存和联网资源平衡。

了解详情 »

行动起来

无论行业无论规模，每天都有各种机构在使用 AWS 实现自身业务转型、实现企业愿景。欢迎您联系我们的专家，立即踏上您的 AWS 之旅。

联系销售人员