作为AWS的深度用户,猎豹移动的海外业务全部运行在AWS上。包括AWS中国区域在内,我们使用了AWS全球将近20个区域的资源,实现了对用户的全球覆盖。在历次转型过程中,猎豹移动充分利用AWS,快速迭代,快速交付,把握住转瞬即逝的市场机会。
朱军 猎豹移动运维总监

猎豹移动(NYSE:CMCM)是一家崛起于移动互联网时代的知名公司,是中国移动互联网公司出海的前沿者。公司于 2010 年 11 月成立,2014 年 5 月 8 日于纽交所正式挂牌上市。截至2018年12月31日,猎豹移动收入49.82亿元,其中海外收入占比60.4%。当前,猎豹移动形成了以工具应用、互联网娱乐(游戏+直播)、AI和投资为核心的“四轮驱动”增长模式。

目前,猎豹移动旗下移动工具应用家族包括猎豹清理大师、猎豹安全大师等;游戏矩阵包括《钢琴块2》、《滚动的天空》和《跳舞的线》等;直播社交产品LiveMe是美国时尚年轻人最喜爱的社交产品之一。旗下人工智能公司“猎户星空”发布了自主研发的猎户机器人平台 Orion OS,并推出一系列机器人产品,包括接待服务机器人豹小秘、零售机器人豹小贩、儿童陪伴机器人豹豹龙、小豹翻译棒、小豹 AI 音箱和基于猎户机械臂平台的豹咖啡,广泛落地博物馆、政务大厅、图书馆、酒店、银行、法院律所、派出所、医疗场所、学校、购物中心、连锁超市等20余个场景,不断提供智能导览、智能导购、智能政务、智能会务等服务。

cheetah-thumbnail

猎豹移动很早就开始使用Amazon Web Services (AWS),海外业务全部运行在AWS上。2012年,猎豹移动(前身金山网络)在海外推出安卓系统专业手机清理应用Clean Master。当时,猎豹移动曾经考虑过在海外市场自行购买服务器建设机房,但经过评估发现这样无法满足业务增长的需要。使用AWS成为理想的、理性的选择。AWS全球覆盖,与猎豹移动的全球化需求相契合;AWS资源充足,可以满足猎豹移动突发性流量增长。猎豹移动曾经在一年时间内用户增长过亿,且分布世界各地,得益于使用AWS,猎豹移动能够轻松应对并抓住市场机会。

时隔几年之后,总结回顾猎豹移动使用AWS的经验,同时分享猎豹移动使用AWS高级功能和新服务方面的经验,以及猎豹移动作为AWS海外区域的资深用户,使用AWS中国区域的计划。

从2010年成立至今,猎豹移动经历过几次业务扩展和转型。

2014年,面对国内互联网行业的激烈竞争,猎豹移动积极走向海外市场,并取得巨大的成功,2014年5月成功登陆纽交所。2015年,猎豹移动推出游戏《钢琴块2》,于全球App Store和Google Play双平台获得大量下载。2016年,猎豹移动推出直播社交产品LiveMe,受美国众多时尚年轻人喜爱。2017年,猎豹移动进军人工智能领域。

在历次转型过程中,猎豹移动充分利用AWS,快速迭代,快速交付。一是尽可能使用AWS的托管服务取代自行搭建;二是利用AWS快速获取资源。

以一款游戏为例,猎豹移动会上线大量轻游戏、小游戏。如果用传统IDC的方式,从准备服务器、上架、装系统到上线,通常要一周时间。而使用AWS,只需要1小时就可以完成部署。这就为猎豹移动上线大量轻游戏提供了基础保障。

大量上线新游戏也意味着需要把更多的时间投入到业务上,减少基础运维的工作。以数据库为例,运维人员可以基于开源数据库自己搭建,但是需要花费不少时间,而且性能、稳定性都很难保障。而使用Amazon Aurora这样的托管式数据库服务,复制延迟从几十秒缩短到几十毫秒,允许快速在线修改表结构,从而适应不断变化的业务需求。

在业务转型过程中,还意味着对一些应用的关停并转。在传统的IDC模式下,必然会出现资源闲置、浪费的情况,机房空间、带宽线路要等合约到期才能清退,服务器、软件授权也很难处置,而使用AWS,可以分分钟关闭不需要的实例。

作为AWS的深度用户,猎豹移动总是乐意使用AWS的新服务、新功能,践行“专业的人做专业的事”。

猎豹移动使用了Amazon Elastic Container Service (Amazon ECS)Amazon Elastic Container Service for Kubernetes (Amazon EKS)等高阶功能,实现了微服务、容器化的架构,DevOps开发运维一体化,简化了运维,并保证运维配置的一致性。在这样的基础上,通过自动化利用预留实例和竞价实例,将资源利用率提高了30%,成本降低了40%。

AWS Lambda刚发布不久,猎豹移动就开始使用。当一款应用得到玩家认可以后,很可能在极短时间内出现流量爆增,例如15天进入应用市场下载量Top100,1个月进入Top20,3个月进入Top5。这样的节奏意味着在短时间内会有大量玩家涌入,需要快速增加服务器资源,抓住稍纵即逝的市场机会。猎豹移动在前端采用AWS Lambda无服务器技术,不需要配置或管理服务器,直接运行代码,无限量扩容,以代码执行时间和代码触发次数计费,从容应对任意的流量高峰。在海外市场非常受欢迎的猎豹移动短视频直播应用LiveMe也会经常遇到流量突增的情况,当影响力比较大的网红上线时,流量可能出现几十倍的增长,猎豹移动通过AWS Lambda,实现了无限量的用户接入。

AWS Global Accelerator是AWS在re:Invent 2018推出的新服务。它使用AWS庞大、高可用和顺畅的全球网络,将用户流量路由至最佳的接入位置,避免用户的访问请求在公共互联网上多次跳转而增加延时。猎豹移动的应用主要部署在美国,通过在全球其他区域使用AWS Global Accelerator,大大缩短了用户接入的延时,例如香港用户的访问部署在美国服务器端的延时从之前的平均455ms左右降至平均311ms左右,东京用户的访问延时从平均351ms左右降至平均214ms左右。

AWS re:Invent 2018发布的另一款服务Amazon Elastic Inference,可以高效利用GPU实例,将深度学习推理的成本降低多达75%。猎豹移动正在将该项服务应用在LiveMe的智能推荐上。“GPU服务器是非常昂贵的资源,一年的费用超过20万元。通过使用Elastic Inference,猎豹移动可以节省50%以上的费用。”朱军说。

针对一些重要应用,猎豹移动还使用了AWS Shield抗DDoS攻击Advanced级别服务,避免业务受到不必要的干扰。AWS Shield Advanced针对复杂的大型 DDoS攻击提供额外的检测和缓解服务,并且有AWS DDoS响应团队 (DRT) 随时待命,在DDoS高峰为客户提供全天候防护。朱军表示“我们更加信任原厂提供的针对DDoS的防护服务。”

猎豹移动始终保持着探索AWS新服务、新功能的深厚兴趣。只要AWS有新服务或新功能发布,能够应用于业务场景,猎豹移动就愿意尝试。通过使用AWS新服务和新功能,可以让猎豹移动的基础架构成本不断优化,效率进一步提升,管理快速升级。

2019年2月,AWS在光环新网运营的AWS中国(北京)区域和西云数据运营的AWS中国(宁夏)区域推出了新一代Amazon Elastic Compute Cloud (Amazon EC2)计算优化型实例C5和内存优化型实例R5。C5 和 R5 实例采用新一代 Intel® Xeon Platinum 处理器(之前的代号为 Skylake)和 Nitro 系统,结合了专用硬件和轻量级管理程序,与C4和R4相比,性价比分别提高了49%和50%。猎豹移动很快决定在AWS中国区域使用这两种服务运行其“趣输入app”应用。

作为资深用户,猎豹移动对AWS的深刻体会是,AWS的API接口功能和文档非常完善。猎豹移动使用了AWS全球几乎所有的区域,信息基础架构非常庞大,通常使用AWS多达几千个实例的规模。通过调用AWS提供的标准API接口,可以把接口信息抓取到猎豹移动自己开发的运维平台,进行统一管理,便于在自己的运维平台进行资源的创建、运行监测和状态显示。相比之前遇到的接口信息经常变更的问题,运维团队抓取信息不准确,很可能导致运维人员对资源的管控失效。“AWS的接口信息描述非常清晰,向下兼容,只需要在第一次使用时编写相关代码即可,运维管理非常方便。”

云服务商的规模是一个很重要的考量因素。猎豹移动运维总监朱军感慨地说,“猎豹移动的应用规模比较大,但AWS拥有服务众多超大规模用户的成功经验,能够为我们的使用和需求提供稳定保障。”

猎豹移动使用了AWS企业级支持服务。朱军认为这项服务非常有价值,他说:“AWS的支持团队能够快速调度全球的资源,帮助我们快速解决疑难问题,维护生产环境的稳定性。我们也能感受到,AWS的支持团队是真正以客户为中心,深入内部帮助我们发展,实现DevOps并完善运维团队,向我们介绍更优化的新服务,让我们把AWS的资源用得更好,成本更优。”

图1是猎豹移动的系统架构图,所使用的AWS云服务包括Amazon EC2、Amazon S3、Amazon EC2 Auto Scaling、Amazon ECS、Amazon EKS、Elastic Load Balancing (ELB)、AWS Lambda、Amazon Elastic Inference、AWS Shield Advanced、AWS WAF、Amazon CloudFront、AWS Global Accelerator、Amazon CloudWatch、AWS Systems Manager等。

cheetah mobile_arch-diag

图1 猎豹移动基于AWS的系统架构图

总体来说,猎豹移动使用AWS带来的效益包括以下几个方面:

让公司保持敏捷性

新应用上线时能够快速部署、快速迭代,支持业务高速发展,在市场上像一只真正的猎豹,敏捷灵活。

全球覆盖

猎豹移动使用了AWS全球几乎所有区域,并且充分利用AWS的全球网络,实现对猎豹移动全球用户的高质量覆盖。

节省成本

在全球近20个区域建设数据中心的成本是不可想象的,使用AWS避免了猎豹移动在基础设施方面大量的资本支出。同时,猎豹移动也通过AWS提供的丰富功能,实现运维自动化,减少了运维成本。

培养一支强大的云专家队伍

猎豹移动已经成为APN合作伙伴,未来,猎豹移动运维团队将对外输出他们使用AWS的经验和能力,为公司开辟新的收入来源。

未来猎豹移动将会利用AWS在日本等区域进一步尝试和拓展AI智能机器人业务和直播业务,与AWS展开更深入的合作。

了解如何在AWS构建可扩展的移动和 Web 应用程序的最快捷方法,请访问AWS Amplify详细信息页面。