充足算力,让老照片焕然新生——大觥科技的AWS云之旅
2020
作为一家专注AI影像处理领域科研和应用的公司,大觥科技有限公司(以下简称“大觥科技”)始终追求AI图像领域技术的制高点,并在科研领域取得了卓越成就,将颠覆性的技术带给老旧照片修复、画质增强等行业,引起相关行业的广泛关注和震动。针对C 端用户市场推出“你我当年”(国内)、“Remini” APP(海外),在很多国家和地区成为热门的“现象级”应用。在企业级市场,公司服务于国内外多家电影厂、电视台、影视后期公司以及其他有影像处理需求的公司。
业务需求与挑战
2019年,大觥科技面向海内外用户推出“你我当年”(国内)以及“Remini”(海外)两款APP,利用人工智能技术修复模糊照片和老照片,一经推出便在市场上成为热门爆款,这两款软件累积用户量已经超过千万。随着用户量持续上升,原有的基础设施难以满足GPU算力需求;此外,由于海内外明星引领的口碑营销,导致多次临时性下载井喷,峰值算力需求受到挑战。大觥科技也曾尝试用国内服务器处理海外业务,结果因为网络传输影响,算力利用率无法得到充分保障,难以解决当前问题。对于C端用户来说,用户体验极为重要。在某次明星热点营销事件中,“你我当年”APP因为下载量与图片处理量突然暴增,导致峰值压力过载,造成“需要排队70年才能够进行图片处理”的乌龙事件。网友笑称:“世界上最远的距离之一就是我和‘你我当年’之间的距离。” 鉴于以上挑战,大觥科技团队决心迁移系统,在成本不额外增加的情况下,以用户体验为先,选择算力更充裕、弹性且高效的解决方案。
大觥科技另一项十分看重的指标是云平台的安全性,希望能实现海外业务跨账户、跨公司合作的同时,保护自身数据安全。在大觥科技与以色列某公司的合作实践中,双方对资源、技术的安全性要求都十分苛刻。各自的核心数据不能共享,使合作一度陷入僵局。因此在发展海外业务时,大觥科技希望拥有一个生态系统完善、且可靠可信的云合作伙伴,解决类似棘手的问题。
作为创业公司,大觥科技致力于产品的研发与创新,并未设立专职的运维人员,而是由团队现有开发人员兼顾运维。因此对于体系完善、技术过硬的云服务商能否提供专业、及时的技术支持,也是大觥科技需要考虑的重要因素之一。
AWS全球化的生态和视野,让大觥科技无需担心底层的支持。AWS为我们提供的充沛算力,帮助我们成功服务数千万用户。”
黄硕
北京大觥科技有限公司 CEO
为什么选择Amazon Web Services
2020年,大觥科技海外Remini APP的用户数量突然激增,而AWS在北美的算力资源为Remini提供了坚实的保障,在AWS技术团队的指导下,大觥科技的开发团队快速上手,在几天内就解决了海外算力短缺的问题,这为双方的进一步合作奠定了坚实的基础。
为了彻底解决算力挑战,大觥科技与AWS的技术专家经过深入探讨,最终选择将海外业务全部GPU算力运行在AWS上,实现All-in on AWS。究其原因有以下四点:第一,覆盖全球的AWS云服务能够为大觥科技提供充足的算力资源、为业务发展提供坚实的保障;第二,Amazon EC2 Auto Scaling Group + Amazon EC2 Spot 实例的产品组合,在成本方面具备很大优势;第三,AWS拥有全球范围内的完善生态,为合作伙伴提供支持。第四,专业的AWS技术团队助力大觥科技降低学习门槛。大觥科技所使用的AWS云服务包括Amazon EC2 M6g, Amazon Simple Storage Service (Amazon S3),Amazon CloudFront,Amazon EC2 Auto Scaling Group + Amazon EC2 Spot 实例,Amazon Rekognition,Amazon Simple Queue Service (SQS),Amazon Simple Notification Service (SNS)等。图1 是大觥科技基于AWS系统架构示意图。
-
日处理百万图像,Amazon EC2 M6g提供充足算力
-
Amazon EC2 M6g+Amazon EC2 Spot实例,实现 40%总成本节省
-
AWS Organizations与AWS RAM保障跨账户、跨公司核心技术安全
-
AWS专业技术团队有力支持,降低学习门槛
-
日处理百万图像,Amazon EC2 M6g提供充足算力
-
对于大觥科技来说,充足的算力是本次项目的核心需求。为此,AWS为其提供了 Amazon Elastic Compute Cloud (Amazon EC2)+Amazon S3+Amazon EC2 Auto Scaling Group+ Amazon EC2 Spot实例的产品组合,可以灵活调动全球各地的算力资源。
值得一提的是,在此次合作中,大觥科技创新性地选择了Amazon EC2的新一代实例类型M6g (Graviton),与上一代机型相比,在性能方面提高 7 倍、计算核心增加4 倍并扩容 5 倍内存及 2 倍缓存。目前大觥科技海外业务全部GPU算力都运行在AWS上,日处理图片量100万+,按T4处理能力折合机时约1500小时,日处理视频量 3000秒+,按T4处理能力折合机时约100小时。凭借算力资源的自动扩展,大觥科技即使在业务高峰期也能获得充足算力支持。
-
Amazon EC2 M6g+Amazon EC2 Spot实例,实现 40%总成本节省
-
对每个企业来说,成本控制尤为重要,大觥科技也是如此。如何在保证业务需要的同时,尽可能降低成本,这也是大觥科技选择Amazon EC2 M6g+Amazon EC2 Spot 实例组合的原因之一。Amazon EC2 M6g(Graviton)能够为各种工作负载提供高达 40% 的性价比提升,与对等的x86服务器相比,也能够在提升40%性能的同时节省20%的经济成本。搭配Amazon EC2 Spot实例后,通过算力资源的动态扩容,使得大觥科技总体成本与此前相比降低40%。此外,大觥科技还将原来的Amazon EC2 P3实例替换为GSDN T4卡,在保证相同性能的前提下大幅节省成本。
-
AWS Organizations与AWS RAM保障跨账户、跨公司核心技术安全
-
针对大觥科技与以色列某客户的合作项目,AWS为大觥科技提供了AWS Organizations与 AWS 资源分配管理(RAM) 集成解决方案,以便双方可以跨账户指定中央配置、安全机制并实现资源共享,与此同时满足双方的数据审计要求。通过三重嵌套的方案,在合作双方核心数据拥有安全保障的前提下,AWS帮助大觥科技达成了项目签约,实现了合作。
-
AWS专业技术团队有力支持,降低学习门槛
-
此次合作的成功,不得不提到AWS专业团队对大觥科技的鼎力支持。大觥科技技术VP袁泉对于AWS专业技术团队的帮助给予了高度评价:“AWS技术团队的指导大大缩短了我们的学习时间,降低了技术门槛。在产品需要进入下一轮迭代时,他们总会走在我们前面,替我们考虑。我们只需听取AWS技术团队的建议即可开展学习。”随着业务的持续扩大,AWS专业技术团队帮助大觥科技不断优化架构,提高业务承载能力的同时始终把成本控制在可接受的水平。
获得的成效
-
进击的Remini借助AWS冲破算力瓶颈
-
高性价比解决方案满足算力需求
-
开拓数据敏感型行业新思路
-
进击的Remini借助AWS冲破算力瓶颈
-
如今,大觥科技的海外用户群基本实现了全球覆盖。在迁移至AWS云后,充足的算力资源为用户带来了更好的使用体验。当用量高峰突袭,用户不必再像原来那样等待数小时甚至数十小时,凭借弹性计算的能力彻底消除了排队等待的时间。目前,大觥科技海外APP Remini在全美官方的软件应用排行榜上位列前20,在多次海外口碑营销引起用量突增时,自动弹性扩容。
在谈及AWS充足且稳定的算力资源时,袁泉表示:“2020年2月至6月之间,我们在海外的APP用户量持续增加,最初阶段因为基数较小,增幅经常超过20%。同时,随着社交平台的公众传播,尤其是事件性传播以及某些地区APP Store排名的突然变化,也多次发生过单日增长量超过100%的情况。由于Amazon EC2 Auto Scaling Group的稳定工作,我们几乎是在未察觉的情况下轻而易举地度过了这些关口。”
-
高性价比解决方案满足算力需求
-
Amazon EC2 M6g (Graviton)高性价比解决方案的成功应用,极大程度上帮助大觥科技降低了基础设施的采购成本,Amazon EC2 Auto Scaling Group + Amazon EC2 Spot实例的自动弹性扩容组合,只需10台Amazon EC2 M6g即可获得超越原方案的算力能力。此外,鉴于AWS对服务安全的保障和承诺,大觥科技不必自行采用过于保守的加密方式,极大程度降低了部署的复杂度,并且使得Amazon EC2 Auto Scaling Group得以施展,从而实现零运维。
-
开拓数据敏感型行业新思路
-
AWS为大觥科技提供的AWS Organizations与 AWS 资源分配管理(RAM) 集成解决方案,对诸如医疗、金融等“双向数据敏感型”行业提供了解决方案新思路。AWS可为多方合作搭建起一个满足安全所需的场景,保障多方对于核心技术保护、官方审查、以及数据隐私等要求。本次AWS解决方案的顺利实施,为这些领域在多方交互的合作中如何保障自身数据的安全性,起到了积极引领的作用,有利于推进这一最佳实践在其它行业的成功复制。
目前,大觥科技已引入开箱即用的Amazon Rekognition服务,自动筛选用户上传的违规照片,极大地提升了工作效率。未来,大觥科技还将考虑引入更多AWS云服务,例如通过Amazon SageMaker的使用,借助机器学习的力量进行模型训练。此外在用户推广层面,将通过Amazon SageMaker对广告投放和用户的行为留存率进行AI模型分析,希望能够为广告投放带来积极有效的指导。在业务方面,大觥科技将继续完善APP产品,借助AWS云服务的充足算力引入视频增强功能,进一步提升自身整体竞争能力。
关于大觥科技
大觥科技有限公司作为一家专注AI影像处理领域科研和应用的公司,始终追求AI图像领域技术的制高点,并在科研领域取得了卓越成就,将颠覆性的技术带给老旧照片修复、画质增强等行业,引起相关行业的广泛关注和震动。
为什么使用AWS
- 充足的算力资源,无惧用量激增
- Amazon EC2 M6g实例拥有极高的性价比
- 完善的全球生态助力跨公司合作
- 专业的技术团队指导降低学习成本
使用的AWS服务
Amazon EC2 M6g 实例
Amazon EC2 M6g 实例由基于 Arm 的 AWS Graviton2 处理器提供支持。相较于目前这一代 M5 实例,其性价比提升高达 40%,并为一系列工作负载提供均衡的计算、内存和网络资源。
Amazon EC2 Spot 实例
借助 Amazon EC2 Spot 实例,您可以充分利用 AWS 云中未使用的 EC2 容量。与按需实例相比,Spot 实例最高可提供 90% 的价格折扣。
Amazon Rekognition
使用经过验证的、高度可扩展且无需机器学习专业知识就可使用的深度学习技术,Amazon Rekognition 可以轻松将图像和视频分析功能添加到您的应用程序中。
Amazon SageMaker
Amazon SageMaker 通过整合专门为 ML 构建的广泛功能集,帮助数据科学家和开发人员快速准备、构建、训练和部署高质量的机器学习 (ML) 模型。
开始使用
各行各业中所有规模的公司都在使用 AWS 对其日常业务进行转型。联系我们的专家,立即踏上您的 AWS 云之旅。