AWS稳定可靠的技术、全方位的安全管控功能和丰富的生态,使我们能专注于核心业务,实现产品的快速上线和快速迭代,为客户提供稳定可靠且个性化的在线学习服务。
胡哲人 流利说联合创始人兼CTO

流利说是较早成立的人工智能驱动的教育科技公司,智能教育的倡行者。由中央“千人计划”专家王翌和胡哲人、林晖在2012年9月共同创立。流利说拥有一支先进的人工智能团队,自主研发了人工智能英语老师,基于深度学习技术为每一位用户提供个性化、自适应的学习课程。经对比实践,有助于大幅提升学习效率。

经过多年积累,流利说已拥有大型的“中国人英语语音数据库”,在此基础上,公司自主研发了先进的英语口语评测、写作打分引擎和深度自适应学习系统,致力于从听说读写多个维度全面有效提升用户的英语水平,为用户提供一整套系统性的英语学习解决方案。

截止2018年7月,旗舰 App “英语流利说”的注册用户数已超过7,000万人,付费学员已逾百万,覆盖全球175个国家,包括中国的379个城市;同时,它亦是国内广受欢迎的英语学习App和活跃的语言学习社区,被苹果公司评为“App Store 精华”和“年度精选 App”。

流利说是中国在线教育领域较早实现规模化盈利的公司。2017年7月,流利说完成近亿美金的C轮融资。几轮投资方共包括:IDG、挚信资本、GGV、华人文化产业投资基金(CMC)、心元资本、双湖资本、赫斯特资本等知名VC。

流利说在成立之初采用自建服务器与公有云平台相结合的方式,在2013年2月14日上线了第一款产品“英语流利说”App,该产品结合了语音识别、打分引擎和自适应学习等核心技术,不仅有着场景对话、配音秀、地道发音课等丰富的学习内容和形式,还装载了AI 英语老师课程,同时在学习过程中采用了游戏化的角色扮演、打分和闯关等形式,提升用户兴趣。这款有趣又有效的产品很快获得了用户的认可,用户数持续攀升,当年就突破了百万,随后很快实现了用户数从百万到千万的跨越。

随着业务的快速发展,流利说已有的IT架构开始面临新的挑战,这主要体现在三个方面:其一是流量变化带来的挑战,一方面用户增长很快,用户数从百万到千万的跨越只用了短短一年,另一方面是每天不同时段的流量相差巨大,高峰时段的流量比平常时段高4-5倍,这就需要IT架构能够提供足够的可伸缩性;其二是业务扩展迅速,产品、功能越来越多,复杂度也不断增加,特别是在2016年开始商业化运营后,付费用户猛增,对访问性能和稳定性的要求更高;其三是大数据分析对系统性能和容量的挑战,随着业务的扩展,流利说拥有的“中国人英语语音数据库”容量不断增长,系统每天需要进行的用户行为分析、反馈的复杂度也不断增加,如何快速、合理地分配资源,提升分析效率就变得至关重要。“应对这些挑战的关键是要选择一个稳定、安全、功能丰富的云平台。基于之前对AWS的充分了解,我们在2014年决定选择AWS,将原有系统整体迁移至AWS,事实证明这是非常正确的选择。”流利说联合创始人兼CTO胡哲人说。

流利说以大数据和人工智能技术为基础,旗舰 App “英语流利说” 提供面向成人的英语学习产品,“安全、稳定、可伸缩”是流利说在选择云平台时主要的考虑因素。AWS以其稳定可靠的技术、全面的安全管控功能以及丰富的技术开发生态环境,成为流利说的最终选择。

稳定可靠的技术

AWS的稳定性和可靠性是由各功能产品的稳定性和整体技术架构体系决定的。流利说所使用的AWS产品主要涉及计算、存储和数据分析等。在计算方面,AWS提供了一系列相互配合的功能,包括Amazon Elastic Compute Cloud (Amazon EC2)Amazon Elastic Container Registry (Amazon ECR)AWS LambdaAWS Auto ScalingElastic Load Balancing等,这些功能的相互配合不仅提供了大小可调的计算容量,让用户可以完全控制其所需的计算资源,并在计算要求发生变化时随时扩展或缩减计算容量,同时还可以自动检测出不健康的实例,自动更改路由,指向健康的实例,直到不健康的实例恢复为止,从而实现更大程度的应用程度容错性。在存储方面,Amazon Simple Storage Service (Amazon S3)将数据以冗余方式存储在多个设施以及一个设施内的多个设备上,旨在为用户提供99.999999999% 的数据持久性;再配合Amazon GlacierAWS Storage Gateway,使用户不仅能将本地存储与AWS中存储进行安全、无缝的集成,同时还能以更低的成本安全、可靠地存储海量数据。“AWS全方位的稳定性使我们的开发团队能够专注于产品的研发,不必担心基础架构出现问题。”胡哲人说。

全面的安全管控功能

流利说拥有庞大的“中国人英语语音数据库”,这些数据是流利说的核心资产,随着数据量的不断增长,AWS对数据安全管控的重要性也日益凸显。另一方面,随着业务的扩展,流利说的产品线也在增加,如何进行集群隔离,在优化资源的同时实现不同业务的划分成为流利说必须解决的问题。“Amazon Virtual Private Cloud (Amazon VPC)AWS Identity and Access Management (IAM)等安全管控功能为我们提供了方便的途径来实现安全管理目标。”胡哲人说。Amazon VPC允许用户在AWS中预配置多个虚拟网络环境,将不同的业务置于不同的虚拟网络中,例如为前端接受用户访问的应用系统创建公有子网,而将数据库或应用程序服务器等后端系统放在不能访问Internet的私有子网中,并利用IAM来创建和管理AWS用户和群组,通过安全组和访问控制列表等多种安全层,实现对整个系统的安全管控。

丰富的生态环境

“流利说是创业公司,必须专注于核心业务,所以如果有开源工具能满足我们的需求,我们肯定是首选开源。从全球来说,无论是开源产品还是闭源产品,在与公有云平台结合时,通常都会选择AWS,这使得我们可以根据需求选择应用系统,节省人力。比如我们用开源工具Terraform来管理资源,它支持的云平台就包括AWS。”胡哲人说。除了在技术层面丰富的生态环境外,AWS每年还有丰富的线上、线下的培训、用户及开发者活动,这些活动汇聚了全球顶尖的开发者和各行业用户,提供了相互学习和交流的机会,帮助用户更好地借鉴其他用户的成功经验。

2014年9月,流利说将整个系统平滑迁移至AWS,包括流利说的官方网站、数据分析平台、支付流程、业务应用程序等系统都部署在AWS上,并始终保持安全、稳定的运行状态。目前流利说所使用的AWS服务包括Amazon EC2、Amazon S3、Amazon Relational Database Service (Amazon RDS)Amazon ElastiCacheAWS SupportAmazon Elastic Block StoreAmazon CloudWatch、AWS Data Transfer、Amazon EMRAmazon DynamoDBAWS Config、AWS Storage Gateway、Amazon Route 53AWS CloudTrailAmazon Simple Queue ServiceAmazon Simple Notification Service等。图1是流利说基于AWS的系统架构示意图。

liulishuo-arch-diag

图1 流利说基于AWS的系统架构示意图

使用AWS给流利说带来了两方面的好处。其一是系统的整体稳定性得到了大幅度提升,应用程序的可用性达到99.9%。流利说的业务发展有两个特点:一方面是用户数增长迅速,从百万用户到7000万用户仅用了四年时间;另一方面是每天24小时用户访问流量分布不均匀,在中午和下午6点之后的高峰时段,访问流量暴涨,是闲时流量的10倍。AWS的自动化运维功能使流利说的整个系统能够轻松应对流量的变化,旨在始终为用户提供稳定、可靠的访问服务,提升用户体验。其二是节省了成本,包括资源成本和人力成本。在资源调配上,AWS提供的AWS Auto Scaling、Amazon EC2 Spot实例等功能大幅度降低了资源占用成本,特别是在使用Amazon EMR之后,数据的处理速度、处理量大幅度提升,但因为可以设定在夜里采用低成本的实例进行数据处理,从而有效地降低成本。在人力成本上,AWS的自动化管理功能减少了系统运维的需求,节省了雇佣专职运维人员的成本。

流利说的目标是成为更好的人工智能驱动的教育科技公司,因此已经计划在未来采用更多的AWS产品,包括Amazon Machine Learning、GPU实例集群等,以提高数据分析速度、加快模型训练的迭代,为用户提供更好的个性化学习体验。

若要了解关于 AWS 如何帮助教育领域客户的详细信息,请访问教育行业信息页面

若要了解关于 AWS 如何帮助您满足数据需求的更多信息,请访问我们的大数据详细信息页面