网易 游戏爱好者

AWS 案例研究: 网易游戏

2022

网易游戏是网易旗下的在线游戏部门(纳斯达克证券交易所代码:NTES;香港交易所代码:9999),研发并运营多款中国乃至全球广受欢迎的移动端和电脑客户端游戏。作为中国知名的游戏开发公司,网易游戏始终致力于支持全球各地创新型工作室的发展,同时正逐步提升自己的国际影响力。为完善自研游戏矩阵并强化世界级的游戏研发能力,网易游戏携手包括暴雪娱乐、Mojang AB(微软子公司)在内的其他全球知名游戏开发行业领袖,在中国运营多款备受欢迎的国际化精品游戏。同时,网易游戏与海外多家版权方均有合作,并获取了“哈利波特”“漫威”“指环王”“暗黑破坏神”等知名IP授权。

面临的挑战

2015年,网易游戏开始布局海外发行。当时,网易游戏在国内采用了自建数据中心的模式。但在海外发行游戏,考虑到整体时间投入成本,我们选择了可行度更高的云服务的模式。网易游戏IT团队需要迎接新的挑战。

  • 云服务跟物理数据中心有很大差异。云服务是虚拟化的,云上的资源是弹性的,虚拟化的网络和服务器资源能否满足游戏业务需求?哪家云服务商的云资源拥有极佳的弹性伸缩功能并且易于管理?
  • 海外发行面临全球范围的网络差异化问题。能否借助云服务商的网络整合这些差异?
  • 使用云服务之后,能否像自建数据中心那样管理网络安全和数据安全问题?

为了回答这些问题,网易游戏IT团队建立了一套严谨周密的云评测体系,对多家云服务商进行了全面深入的评测。评测内容包括四大方面:一,在计算和存储资源上,重点评测其性能和可靠性;二,在网络方面,全面评测了云服务商的 IDC 连接性和玩家网络的访问质量;三,在安全方面,深入测试云服务商的访问控制措施和防攻击能力;四,对成本、技术支持能力、云服务资源的可编程性等方面进行了多方位的评估。经过这一系列评测之后,网易游戏选择了 AWS 作为其海外业务的重要云服务提供商。
 

start a python tutorial
kr_quotemark

网易游戏旗下《荒野行动》通过使用第五代 Amazon EC2 M5 实例替换第四代实例,实现了40% 的 Amazon EC2 成本节省。音频语音服务和网络转发服务通过使用 Amazon EC2 A1 实例,使该部分服务的 Amazon EC2 成本节省高达 50% 。”

孙国良

网易游戏 资深云解决方案架构师

为什么选择 AWS ?

  • 丰富的实例类型满足各种业务需求
  • 作为全球云计算的先行者,AWS提供了功能强大的云服务组合,满足网易游戏的性能和资源弹性需求。Amazon Elastic Compute Cloud (Amazon EC2) 提供了 270 多种云服务器实例类型,可以根据不同的应用场景,选择不同的 CPU、内存、网络、存储类型和配置。

    例如 2018 年初推出的 Amazon EC2 第五代实例,采用 AWS 创新的 Nitro 系统,性能提升非常明显,让网易游戏团队印象深刻。当时,正值《荒野行动》游戏在春节期间人数直线上升的阶段,其游戏服务是网络密集型的应用,而一个 Amazon EC2 第五代实例可支持多达 8 个弹性网卡,将网络负载均衡分布到 8 个 CPU 内核上,计算资源的总利用率提升了一倍。使用第五代 Amazon EC2 实例替换之前的第四代实例,节省了不少成本。而且,弹性网卡的设计非常灵活,每一个网站可以有多个 IP 地址,可以在不同的实例之间漂移,使用起来非常方便。针对音频语音服务和网络转发服务,网易游戏选择 Amazon EC2 A1 实例来降低运营成本。音频语音服务支持实时玩家聊天,而网络转发服务旨在加速游戏流量。“音频语音和网络转发服务为网络 I/O 密集型,A1 实例可提供高达 10 Gbps 的网络带宽。这些服务业务逻辑是用 Python 编写的,这使它们可独立于平台,并能够快速轻松地转换到 Amazon EC2 A1 实例。”网易游戏资深云解决方案架构师孙国良说。

    在伸缩性方面,Amazon EC2 提供了丰富的接口功能,可以从多个维度监控实例的利用率和运行状态,根据不同游戏的特点,进行游戏服的增加、合并与关闭。例如要关闭一个游戏战斗服,不能只看 CPU 利用率低就直接关闭,需要把这个实例隐藏起来,不让新的玩家进入,同时等待这个实例上所有玩家都已经结束战斗,才能关闭。
     

  • AWS 全球骨干网保障海外玩家的极致体验
  • 网络访问质量对游戏玩家的体验至关重要。游戏发行商不可能在每个国家都建立游戏服务,而是根据玩家的数量,在全球建立区域性的通服,服务所在区域的玩家。AWS 拥有覆盖全球的骨干网,在海外区域之间形成低延时、高吞吐量、高冗余的连接,同时有 300 多个接入点,进一步加强对全球用户的覆盖。

    丢包时长是一个用来衡量网络质量的指标。它是指一天内丢包超过正常值的时间。网易游戏 IT 团队的测试发现,全球玩家通过国际互联网连接,容易出现丢包抖动;而使用 AWS 全球骨干网后,玩家访问的丢包时长明显降低。网易游戏通过 AWS 全球接入点让玩家就近连接到 AWS,然后通过 AWS 骨干网访问游戏通服,大大提高了玩家的游戏体验。
     

  • 数百个 Amazon VPC 互联,兼顾灵活与安全性
  • 在安全管控方面,网易游戏主要通过 Amazon Virtual Private Cloud (Amazon VPC) 来实现,通常为每个游戏服务建一个 Amazon VPC(虚拟私有云)。一些内部的 PaaS 服务例如数据库、大数据、网络加速等等,也会建立单独的 Amazon VPC。网易游戏总共建立了数百个Amazon VPC,AWS 上的 Amazon VPC 跟网易游戏自建数据中心、第三方数据中心通过网络进行连接。Amazon VPC 的网关 (Gateway) 非常丰富,除了支持 Virtual Gateway (VGW),还支持 AWS Transit Gateway,后者可以大大减少 Amazon VPC 互联的网络结构。

    通过 AWS 丰富的网关,除了实现跨 Amazon VPC 互联之外,还可以实现专线的连接、通过 AWS Transit Gateway 实现混合架构的连接,大大提高了灵活性。2018 年,Amazon VPC 推出了跨区域互联的新功能,进一步提升了网络架构的灵活性,轻松在多种类型之间做切换,网易游戏也引入了这项新功能。 

AWS的企业级支持服务(Enterprise Support)也为网易游戏团队提供了很大的助力。既有本地化的支持团队,就近协助解决全球各个区域遇到的问题;还可以通过AWS的技术客户经理连接 AWS 全球的专家,甚至直接跟产品研发团队进行深入的探讨,及时地解决疑难问题,真正成为客户可信赖的技术顾问,为业务快速发展保驾护航。

图1是网易游戏《荒野行动》基于AWS的架构示意图,使用的 AWS 服务包括 Amazon EC2、Amazon Simple Storage Service (Amazon S3)、Amazon VPC、Elastic Load BalancingAmazon CloudFrontAmazon RDSAmazon ElasticacheAWS Identity and Access Management (IAM) 、AWS Certificate ManagerAmazon CloudWatchAWS ShieldAmazon CloudTrailAmazon Simple Notification Service (Amazon SNS)、Enterprise Support等。

图 1 《荒野行动》基于 AWS 的架构示意图

图 2 是网易游戏使用的 Amazon VPC 服务架构示意图,主要包括的服务有:Amazon VPC、AWS Direct Connect、Internet Gateway(IGW)、VPC Peering、VPC Endpoint等。

图 2  网易游戏使用的 Amazon VPC 服务架构示意图

获得的好处

通过使用 AWS,网易游戏获得了以下几方面的好处:

  • 支撑海外业务快速增长。通过 AWS,网易游戏团队搭建了一个可以快速扩展的云基础架构,轻松满足海外游戏业务快速增长的要求。无论是覆盖地域的扩大,还是区域内玩家数量的迅速增长,IT 团队都能够从容应对。
  • 深度使用 AWS,追求极致性能。AWS 一直致力于针对不同的使用场景,持续研发创新的 CPU 及弹性伸缩技术。网易游戏团队及时跟进使用这些不断迭代升级的新技术,为游戏服务器带来极大的性能提升,进而为网易在游戏行业激烈的竞争中赢得胜利打下重要的基础。
  • 为海外玩家提供一流的游戏体验。利用 AWS 稳定可信赖的云服务平台,高质量的全球骨干网络,网易游戏团队得以搭建起一套稳定可靠的游戏环境,为海外游戏业务的强劲发展提供了坚实的保障。
  • 借助 AWS 新技术优势,显著降低成本。网易游戏团队深入应用 AWS 提供的多项新功能,满足业务高速增长需求的同时兼顾性价比。《荒野行动》通过使用第五代 Amazon EC2 M5 实例替换第四代实例,实现了 40% 的 Amazon EC2 成本节省。而音频语音服务和网络转发服务通过使用 Amazon EC2 A1 实例,该部分服务的 Amazon EC2 成本节省高达 50%。

网易游戏团队通过与 AWS 产品研发团队的交流,一方面加深了对 AWS 云服务的理解;另一方面还根据网易游戏的应用场景,为 AWS 产品团队提供了宝贵的意见。AWS 有 90% 的服务和功能迭代都来自于网易游戏这样的深度用户。在双方相互成就的共识中,网易游戏团队以其雄厚的技术实力,对 AWS 的基础服务进行了深入的探索和应用,取得今天傲人的佳绩,这背后离不开 AWS 的强大支撑。


关于网易游戏

网易游戏是网易旗下的在线游戏部门(纳斯达克证券交易所代码:NTES;香港交易所代码:9999),研发并运营多款中国乃至全球广受欢迎的移动端和电脑客户端游戏。

为什么使用 AWS

  • 丰富的实例类型满足各种业务需求
  • AWS全球骨干网保障海外玩家的极致体验
  • 数百个 Amazon VPC 互联,兼顾灵活与安全性

使用的AWS服务

Amazon EC2

M6g instances

Amazon EC2 M6g 实例由基于 Arm 的 AWS Graviton2 处理器提供支持。

了解更多》

Amazon EC2

M6i instances

Amazon EC2 M6i 实例搭载了第三代 Intel Xeon 可扩展处理器,相较于 M5 实例,能够提升15%的性价比。

了解更多》

AWS

Global Accelerator

AWS Global Accelerator 是一项联网服务,可通过使用 Amazon Web Services 的全球网络基础设施将您的用户流量性能提升高达 60%。

了解更多》

AWS

Shield Advanced

AWS Shield 是一种托管式分布式拒绝服务 (DDoS) 防护服务,可以保护在 AWS 上运行的应用程序。

了解更多》


开始使用

各行各业中所有规模的公司都在使用 AWS 对其日常业务进行转型。联系我们的专家,立即踏上您的 AWS 云之旅。