亚马逊AWS官方博客

沐瞳科技(Moonton)游戏全球化网络架构最佳实践

引言

客户介绍

沐瞳科技(Moonton)是一家全球领先的移动游戏开发与发行公司,成立于 2014 年,总部位于中国上海。公司致力于为全球玩家打造高品质的游戏体验,以满足多样化的需求。

沐瞳科技旗下最知名的产品是在线战术竞技游戏(MOBA)《决胜巅峰》(Mobile Legends: Bang Bang),该游戏在全球范围内,尤其是东南亚和拉丁美洲,拥有庞大的玩家基础和极高的市场占有率。

除了《决胜巅峰》,沐瞳科技还积极拓展产品线,在卡牌与策略类游戏领域不断发力。代表性作品包括《潮汐守望者》(Watcher of Realms)和《Mobile Legends: Adventure》等。《潮汐守望者》是一款史诗级奇幻策略 RPG,凭借精美的画面、丰富的世界观和高度的策略性获得了广泛的关注,而《Mobile Legends: Adventure》作为《Mobile Legends: Bang Bang》的 IP 衍生作品,则以其轻松放置玩法和深度英雄养成系统赢得了全球市场,特别是在欧美和亚洲地区的热烈反响。这些游戏充分展现了沐瞳科技在移动游戏领域的创新实力和全球化视野。

Moonton 的业务需求

作为全球知名的游戏开发商,Moonton 的目标是为全球用户提供一致、高质量的游戏访问体验。确保全球范围内用户的连接质量一直是一个关键挑战。

Moonton 的全球化业务要求其游戏服务具备高可用性、低延迟和自动化能力,这对技术架构提出了更高的要求。

项目背景

在 Moonton 之前的方案中,Moonton 采用了如下的方式进行游戏的部署以及访问体验优化:

  • 虚拟机自建代理

Moonton 在全球多个地区部署了虚拟机,作为用户访问游戏服务的代理节点。终端用户在访问游戏时,首先连接到这些代理节点,再通过专线骨干网将流量转发到后端的游戏服务器。这种方式可以在一定程度上确保跨区域网络的连接质量。

  • 传统管理工具运维

服务器的初始化和服务配置主要依赖于传统的多机器统一管理运维工具。通过这些工具进行批量操作,完成代理节点的环境部署、服务更新和故障排查。这种方法在一定程度上简化了初期的管理工作,但随着节点数量的增加,工具的适用性和灵活性逐渐显现出不足,难以满足动态扩展和自动化配置的需求。

现有架构的挑战

尽管自建代理方案在初期满足了部分用户的需求,但随着业务规模的增长和用户分布的复杂化,其局限性逐渐显现:

  • 覆盖范围有限:自建代理的部署受限于虚拟机的可用区域,无法覆盖所有目标市场,导致部分用户仍面临较高的网络延迟。
  • 运维复杂性高:需要管理大量分布在全球的虚拟机代理节点,包括配置、监控和故障处理。这不仅增加了技术团队的运维压力,也增加了出错的风险。
  • 成本高昂:自建代理方案需要长期支付虚拟机的租赁费用,同时为维护专线骨干网付出高额成本。

优化目标

为了解决上述问题,并更好地支持全球用户的服务连接需求,Moonton 的运维团队工程师们与亚马逊云科技技术团队合作,重新设计其网络架构,目标包括:

  • 提升全球用户访问服务的稳定性和速度,显著降低访问延迟。
  • 简化架构设计,降低运维复杂性和长期成本。
  • 构建一个具备弹性扩展能力和自动化部署支持的现代化全球网络架构。

优化后的架构需要结合亚马逊云科技的强大能力,通过边缘接入、自动化配置和全球化网络互联,为用户提供优质的访问体验,同时满足企业级别的可扩展性和经济性要求。

架构优化设计

为了提升全球用户的访问体验,解决传统架构的局限性,Moonton 在亚马逊云科技上设计了全新的网络架构。该优化方案从网络接入、边缘服务部署、全球互联和自动化运维多个层面进行改进,具体设计如下:

全球接入优化:使用 Amazon Global Accelerator(AGA)

为了优化全球用户的接入体验,Moonton 引入了 Amazon Global Accelerator (AGA),借助其覆盖全球的网络,为用户提供了卓越的连接性能和稳定性。这些边缘节点分布在全球 90 多个城市的不同地理区域,覆盖了绝大多数目标市场。

  • 全球覆盖广泛
    • 超过100个边缘节点:AGA 的边缘节点遍布北美、欧洲、亚太、南美、中东和非洲等地区,涵盖全球主流互联网市场。
    • 用户无论位于何处,其访问流量都会路由到距离最近的边缘节点,实现低延迟接入。不用在自己搭建维护Proxy节点。
  • 智能路由与优化
    • 动态最优路径选择:AGA 实时选择最佳的网络路径,将用户流量通过 亚马逊云科技 的全球骨干网传输到目标区域。
    • 自动故障切换:当某个接入点出现异常时,流量会快速切换到其他可用接入点,确保服务不中断。
  • 统一接入与低延迟
    • 用户只需通过一个固定的 IP 地址接入,无需手动选择服务器区域。AGA 会自动将流量路由到最近的接入点,从而优化延迟。
    • 结合 亚马逊云科技 全球骨干网络,这种机制能够显著减少数据在公共互联网中的传输时间。
  • 增强的高可用性
    • AGA 的边缘节点支持多区域覆盖,即使某一边缘节点所在区域发生故障,用户流量会迅速切换至其他区域的可用节点,确保服务稳定可靠。

边缘服务优化:多 Region 和 Local Zone 部署战斗服

为进一步降低延迟并提升玩家体验,Moonton 在多个亚马逊云科技 RegionLocal Zone 中部署战斗服,通过“核心战斗服 + 边缘战斗服”的模式,构建了高效的全球游戏服务架构。

Local Zone 在游戏业务中的应用

  • 贴近玩家,降低延迟
    • 亚马逊云科技 Local Zone 提供靠近用户的计算能力,可将战斗服部署到玩家所在城市附近。
    • 例如,通过在达拉斯等城市的 Local Zone 部署战斗服,为北美玩家提供低延迟的游戏服务。
  • 提升实时竞技类游戏性能
    • 对于 MOBA、FPS 等延迟敏感的竞技类游戏,Local Zone 可将关键的战斗逻辑和匹配服务下沉到边缘节点,显著减少玩家操作和服务响应之间的延迟。
  • 快速扩展覆盖新市场
    • 借助亚马逊云科技的 34 个已发布 Local Zone(覆盖北美、欧洲、亚洲等区域),Moonton 能够快速进入次级市场。例如,通过 墨西哥部署南美战斗服,满足该区域玩家的需求。
    • 在新市场上线时,通过现有的 Local Zone 快速部署战斗服节点,无需额外基础设施投入。

全球网络互联:利用 Amazon Transit Gateway(TGW)

Moonton 在新的架构中用 Amazon Transit Gateway (TGW) 取代了原有的 VPC Peering,通过 TGW 实现全球统一的网络互联。这一变革不仅简化了网络架构,还为游戏业务提供了显著的性能优化和运营效率提升。

从 VPC Peering 到 TGW 的改进

  • 简化网络拓扑
    • VPC Peering 是点对点连接模式,当多个 VPC 需要互联时,必须配置多个 Peering 链接,导致拓扑复杂且难以维护。
    • TGW 提供中心化路由枢纽,所有 VPC 和本地网络只需连接 TGW 即可互通,极大简化了网络架构。
  • 提升扩展能力
    • TGW 支持数百个 VPC 和本地网络互联,适应 Moonton 不断增长的全球业务需求,避免了 VPC Peering 随着规模扩大而增加的运维负担。
  • 跨区域优化
    • TGW 能高效连接分布于不同亚马逊云科技 Region 的 VPC,通过亚马逊云科技的全球骨干网传输流量,大幅降低跨区域传输的延迟和丢包。

TGW 在游戏业务中的应用与优势

  • 提升玩家连接体验
    • TGW 支持战斗服、数据库和边缘服务的高效互联,玩家无论位于哪个区域,都能快速连接到最近的服务节点,减少延迟,提升游戏体验。
  • 支持边缘服务的协作
    • TGW 无缝连接中心战斗服和 Local Zone 部署的边缘战斗服,使玩家的访问流量能快速路由到最近的服务节点,优化服务响应速度。
  • 简化运维与动态扩展
    • 技术团队通过 TGW 集中管理路由和互联,不再需要手动维护复杂的 Peering 链接,减少错误和运维压力。
    • 随着业务需求增长,可以快速将新 VPC 或 Region 加入 TGW,无需调整现有架构。
  • 提高灾备能力
    • TGW 的高效跨区域传输支持全球范围内的数据备份与容灾,确保业务稳定性和连续性。

自动化优化:基于 ASG、EventBridge、Lambda 和 Systems Manager

Moonton 通过 Auto Scaling Groups (ASG)EventBridgeLambdaSystems Manager 的结合,实现了游戏服务部署的高度自动化。该方案优化了服务实例的初始化与配置流程,显著缩短了部署时间并降低了运维复杂性。大规模服务实例从启动到可用的时间减少到 3 分钟内。

核心架构设计

  • 服务自动部署:ASG 和自定义 AMI
    • Auto Scaling Groups (ASG):通过 ASG 自动启动服务实例,包括战斗服、中心服和登录服等类型,每类服务实例根据预定义策略进行管理。
    • 自定义 AMI:每种服务类型使用自定义的 AMI,包含操作系统、服务依赖和基础环境,确保新实例启动后能够快速加载并运行目标服务。
  • 集中配置管理:S3 存储
    • 所有服务的配置文件(如战斗服、中心服和登录服的配置)集中存储在 S3 中。
    • 实例启动时会自动从 S3 拉取对应的配置文件,确保每个实例始终加载最新的配置。
  • 事件驱动任务:EventBridge 和 Lambda
    • EventBridge:监控实例启动等事件,根据预定义规则触发 Lambda 函数执行后续任务。
    • Lambda:用于完成实例初始化任务,例如:
      • 分配 Elastic IP (EIP)。
      • 注册实例到相应的服务组。
      • 调用 S3 下载配置文件。
  • 实例预配置:Systems Manager
    • 基础预配置:通过 Systems Manager 对所有实例进行统一的预配置,包括操作系统优化、软件依赖安装等操作,确保服务环境一致性。
    • 这种方法减少了实例启动后的手动配置需求。

在游戏业务中的实际应用

  • 快速服务部署
    • 通过 ASG 自动启动服务实例,结合自定义 AMI,战斗服、中心服和登录服的实例可以在几分钟内完成启动和运行。
    • 自动加载 S3 配置文件,使服务能根据最新的业务需求动态调整配置。
  • 动态初始化任务执行
    • 实例启动后,EventBridge 自动触发相关的 Lambda 脚本完成任务,例如为战斗服实例分配 EIP,确保其对外提供稳定的访问入口。
    • 自动化任务减少了人工干预,提升了部署效率。
  • 一致性和可靠性
    • Systems Manager 确保所有实例的操作系统和依赖环境一致,避免了因配置差异引发的运行故障。
    • 集中化配置管理让服务在更新配置时能够快速生效,降低维护复杂度。

总结

通过与 亚马逊云科技的技术团队的紧密合作,Moonton 成功完成了全球游戏服务架构的全面优化。借助 Amazon Global Accelerator (AGA) 提供的全球边缘节点,用户无需依赖自建代理即可实现低延迟、高可靠的接入体验;通过亚马逊云科技 Local Zone 和多 Region 的部署模式,战斗服下沉至玩家附近,显著降低了延迟,提升了玩家的操作体验;通过 Amazon Transit Gateway (TGW),实现了全球 VPC 的高效互联,大幅简化了网络管理并提升了跨区域连接的性能与可靠性。此外,结合 ASGEventBridgeLambda,Moonton 实现了服务实例部署的自动化与高效配置。

这次架构优化,不仅解决了原有方案的覆盖范围受限、运维复杂和成本高昂等问题,还显著提升了全球用户的游戏体验,为 Moonton 的全球化发展提供了坚实的技术支撑。优化后的架构具有高性能、高稳定性和低成本的特点,同时具备出色的扩展能力,能够灵活应对未来业务的增长需求。

本篇作者

朱锐

沐瞳科技卡牌项目运维负责人

崔自军

沐瞳科技卡牌项目运维工程师

李开元

亚马逊云科技解决方案架构师,十年云计算从业经验,主要支持客户的游戏解决方案与人工智能解决方案。