10 倍



LSports 是一家为体育博彩行业提供创新 API 的体育数据公司,旨在为全球客户提供高质量的实时体育数据源。该公司在其数据仓库中有一个大型存储库,希望使用这些数据为客户提供高级功能。AWS 合作伙伴 CloudZone 开发了端到端机器学习(ML)管道。它基于强大机器学习基础服务设计和构建,提供的训练管道可控制数据准备、模型训练和模型部署,从而提高模型训练的效率,并借助更好的云计算能力提高性能。

High-Tech Betting Station with Multiple Screens Displaying Live Sports and Data in a Modern Gaming Environment

机会 | 投资机器学习的优势

LSports 在其数据仓库中有一个大型数据存储库,希望根据这些数据创建机器学习模型,以提高其主要由人为驱动的预测的准确性。该公司还希望简化运营,以便纵向扩展以满足不断增长的服务需求。该公司的内部机器学习模型的训练方法进展缓慢,需要大量的处理能力,而团队的个人笔记本电脑却难以应付,因此几乎无法利用所需的大型数据集来提高准确性。就像业务核心的运动员一样,LSports 希望以更快、更强大、更智能的方式迁移数据。它还计划通过迁移到云端机器学习平台来实现这一目标。

挑战在于找到一个机器学习平台,该平台能够高效应对大规模预处理、训练和部署模型的复杂性,同时还通过用于管理模型、跟踪版本和确保模型演变透明度的统一系统来简化机器学习开发生命周期。为应对这些挑战并抓住快速发展的体育博彩行业中的机遇,LSports 借助 CloudZone 将其体育博彩游戏提升到新的级别。


与 CloudZone 的数据团队合作非常愉快。他们反应迅速,始终履行承诺。我们机器学习管道的开发流程非常流畅,现在我们拥有采用 Amazon SageMaker 的有效机器学习平台。”

Daniel Netzer
LSports 研发副总裁

解决方案 | 新的数据处理方法

为帮助 LSports 实现其效率和准确性目标,CloudZone 开发了完整的机器学习管道,该管道基于 Amazon SageMaker 设计和构建。Amazon SageMaker 是一项完全托管的服务,汇集了大量工具,能以低成本执行各种机器学习任务,例如数据处理、训练、评估和推理。借助 Amazon SageMaker,您可以使用笔记本、调试器、分析器、管道、MLOps 等工具大规模构建、训练和部署机器学习模型,这一切都在一个平台中完成。

CloudZone 的解决方案实施了 MLOps 方法,定义了参与模型生命周期的每个团队的责任,并提供了可控制数据准备、模型训练和模型部署的训练管道。所有阶段均在 Amazon SageMaker 管道上实施,该管道封装在 Amazon Web Services(AWS)原生工具中,用于控制触发器和手动审批。数据科学团队还将 Amazon SageMaker Studio 集成为集成式开发环境(IDE),以利用专门构建的工具进行机器学习开发,例如管理实验、可解释性功能、数据可视化等。利用 AWS 的强大功能帮助该组织的数据科学团队更快地迁移数据,因为他们不再受笔记本电脑计算能力的限制。

CloudZone 机器学习管道中的关键步骤包括:

  1. 触发 CI 管道:用户可以使用计划、Webhook 或手动触发器启动管道,从而开始持续集成(CI)流程。
  2. Lambda 函数执行:执行 AWS Lambda 函数以触发 Amazon SageMaker 管道并等待其完成。
  3. Amazon SageMaker 管道处理:
    1. 处理步骤(Data Wrangler):准备和处理用于训练的数据。
    2. 训练步骤(模型训练):使用准备好的数据训练机器学习模型。
    3. 处理步骤(模型评测):评测训练模型的性能。
    4. 条件步骤(模型准确性):检查模型是否满足准确性要求。
  4. 模型注册和审批:
    1. 如果模型符合准确性标准,则继续执行创建模型步骤和注册模型步骤,对模型进行打包和注册。
    2. 然后,流程先等待手动审批,再继续进行。
  5. 模型部署:
    1. 一旦获得批准,流程会触发与持续部署(CD)管道连接的 AWS EventBridge
    2. CD 管道首先使用 Lambda 函数和 AWS CloudFormation 将模型部署到暂存环境中。
    3. 在再次进行手动审批后,模型将部署到生产环境中。


成果 | LSports 为他们的新机器学习管道打出高分

初始数据迁移和随后的 MLOps 项目使 LSports 能够在更大的数据集上训练模型,尝试新的中央处理器/图形处理单元(CPU/GPU)架构,并显著增强其机器学习能力。这不仅提高了其预测模型的效率,还使数据科学家摆脱了硬件限制,让他们能够专注于创新而不是基础设施。该项目的成功促使 LSports 扩大了 AWS 的使用范围,进一步开发了其机器学习平台并继续进行数字化转型。LSports 研发副总裁 Daniel Netzer 证实了 CloudZone 带来的价值,他表示:“很高兴与 CloudZone 的数据团队合作。他们反应迅速,始终履行承诺。我们机器学习管道的开发流程非常流畅,现在我们拥有采用 Amazon SageMaker 的有效机器学习平台。令人惊讶的是,我们在短短几周内就取得了如此大的进展!”

这些进展的实现在加强客户的机器学习计划方面取得了重大成就。该解决方案将新模型的训练和部署总时间从大约三周缩短到一周,减少了 50%。此外,实施解决方案后训练和部署的模型数量增加,这展示了 Amazon SageMaker 平台的可扩展性,允许开发和使用更多模型。实际上,模型部署时间最多缩短了 75%。最后,使用托管平台使 CloudZone 能够创建可促进改进模型开发的环境。这通过对大量数据进行测试、建模和实验来实现。在此实例中,训练数据最多扩展了 10 倍,这有助于确保更高质量的模型。

关于 LSports

LSports 是一家备受瞩目的体育博彩公司。自 2012 年以来,该公司与重要体育行业客户合作,为体育博彩和媒体公司提供有关各种赛事的高质量体育数据,使他们能够为其业务开发最佳产品。得益于充满激情的团队努力完善这项技术,LSports 可以为您提供广泛的体育数据服务和解决方案。

关于 AWS 合作伙伴 CloudZone

CloudZone 是 AWS 核心级服务合作伙伴,为云技术的各个方面提供一流的咨询、运营和专业服务。

使用的 AWS 服务

Amazon SageMaker

Amazon SageMaker 是用于数据、分析和人工智能的统一平台。Amazon SageMaker 汇集了广泛采用的 AWS 机器学习和分析功能,可统一访问您的所有数据,为分析和人工智能提供一体式体验。

AWS CloudFormation

借助 AWS CloudFormation 通过基础设施即代码加快云预置

