跳至主要内容
Heywhale logo featuring blue Chinese text and a whale icon on a white background.

APN 合作伙伴案例:和鲸科技

客户引言

我们选择与AWS合作,加入AWS合作伙伴网络,能够把业界先进的云技术和数据科学工具引入到高校教育和科研中,让师生可以直接在真实的环境中借助AWS云服务所提供的强大计算能力进行实训,使高校培养出的人才能够直接与就业市场和企业需求对接,以丰富的产学研创新合作生态培养更多的数据科学的人才。

范向伟和鲸科技 CEO/创始人

关于和鲸科技

和鲸科技heywhale.com)隶属于上海和今信息科技有限公司,2015年创始于上海,是中国先进的数据科学协同创新平台,为企业的数据智能化转型、升级提供解决方案。旗下拥有聚集了超过50,000+数据智能人才的专业第三方数据科学社区——和鲸社区(原Kesci科赛社区)、具备国际先进水平的数据分析及AI开发协作平台——KesciLab(简称“K-Lab”)以及企业数据智能化发展联盟——数据商业家。

业务需求与挑战

伴随着中国经济转型步伐的加速,促进经济增长的动能正从传统的大型基础设施建设、城乡房地产开发转向智能制造、大数据、人工智能等新的领域,国家战略也不断为经济的转型升级提供支持。新技术、新业态和新模式的引入正在推动全行业的变革和发展,数字化转型为经济发展所带来的收益正在不断的显现。

然而在实现从传统经济到数字化智能化经济转型升级的过程中依然面临着多方面的挑战。首先是专业人才的缺乏。大数据、人工智能、机器学习等新兴领域需要具有高度专业化的人才,而人才的培养必须要依赖高校。大学和高等职业教育机构需要在更短的时间内为国家输送人才。其次,无论是大数据分析、机器学习,还是人工智能应用,都需要强大的运算能力进行支持。但对于高校来说,为了教学、科研应用场景自行部署强大的运算平台不仅会给教育机构带来高昂的资金负担,同时也缺乏成本效益。另一方面,创新的加速对产学研融合也提出了更高的要求,高等院校的科研成果进入市场的时间不断缩短,学校和企业需要不断深化合作,才能迅速完成科研到产品的转化。学校不仅需要借鉴来自于企业和市场的经验来提升学生专业水平和科研方法,同时也需要为学生提供符合市场场景的实训环境。

云计算技术的成熟为数据科学提供了新的途径,大数据处理与分析、机器学习、人工智能的发展都可以借助强大的云计算平台来实现,通过使用海量的资源进行高性能的运算,让人们能够充分的利用数据的价值。云的出现也为教育科研提供了新的途径,用按需和更加快捷的方式获得运算能力,并取得结果。在这样的技术趋势下,和鲸科技以“connect people with data 数据与人的高价值链接”为使命,专注于挖掘商业数据和数据人才的价值,通过数据化及AI转型咨询、算法业务咨询、数据人才招聘与实训、算法任务众包、算法竞赛、技术(雇主)品牌塑造,为数据科学家、人工智能工程师、商业分析师等数据工作者在线完成分类、建模、分析、可视化、结果输出等任务,并支持私有化部署和云端协同,帮助企业、高校、科研机构开展工业级数据科学应用与人工智能研发。

为何选择 Amazon Web Services (AWS)

如何最大化数据团队的工作效率,实现数据协作平台的应用是和鲸科技首要考虑的问题,找到一个可靠的云服务和鲸科技需要考虑众多的因素。经过对市场上各个品牌的云服务细致对比,和鲸科技最终选择了AWS,并加入AWS合作伙伴网络(APN),以借助AWS的托管数据服务和强大的运算能力构建自己的数据协同创新平台。

“我们之所以会选择AWS,正是看中了AWS作为一个全球先进的云服务品牌,能够提供丰富的托管服务让我们快速的构建起自己的数据科学协同平台。AWS有很多数据相关的服务,和鲸的技术团队可以更加专注于算法,并且AWS也是业内首批提供GPU运算实例的,让我们可以借助更加强大的计算能力来实现机器学习、人工智能等场景的应用。“和鲸科技CEO/创始人范向伟说。

可伸缩的强大计算能力

基于AWS云服务的优势和特点,和鲸科技采用了Amazon Elastic Compute Cloud (Amazon EC2)AWS LambdaAmazon Simple Storage Service (Amazon S3)Amazon EMRAWS Deep Learning AMI服务。其中,在Amazon EC2中还采用了AWS GPU实例,配合AWS Deep Learning AMI可以为机器学习从业人员和研究人员提供基础设施和各种工具,从而加快在云中进行不同规模的深度学习的速度。通过在AWS上构建K-Lab解决方案,和鲸科技可以更加关注上层的应用设计和算法整合,并以软件即服务(SaaS)的方式提供给高校用户使用。

可靠的SLA承诺

AWS提供了业界先进的服务水平协议(SLA)服务承诺,和鲸科技基于AWS的K-Lab教育版可以借助这样的SLA为众多高校的师生提供稳定的服务。致力于数据科学和人工智能专业共建,提供从基础到实战的一系列进阶课程内容,便于高校展开教学、科研、实战培训等多层次的递进课程,有效地结合了基础学科和校企合作项目各自的优势特点,打造更加丰富的产学研创新合作生态内容。使用该和鲸科技SaaS解决方案的高等教育机构用户可以实现统一化的环境管理,迅速完成教材管理、学生管理、数据管理和作业管理。为数据科学课程快速调配资源,并可在使用完成之后快速的完成资源的释放,让高校可以用更具成本效益的方式获得业界先进的数据科学工具。

丰富的数据科学资源

AWS在数据科学方面有着巨大的投入,提供了丰富的服务种类、文档、工具和示例。和鲸科技通过基于AWS的K-Lab教育版为数据科学和人工智能专业课程的创建提供了有力的技术支持,高校可以从K-Lab平台获得由基础到实战的一系列进阶课程内容,便于高校展开教学、科研、实战培训等多层次的递进课程,有效地结合了基础学科和校企合作项目各自的优势特点,从而打造更加丰富的产学研创新合作生态内容。

具有成本效益的服务

在国家政策的支持下,国内众多的大学和高等职业教育机构已经逐步建立起大数据与人工智能学院,开设数据科学相关的学科,这些院校都对和鲸科技基于AWS构建的K-Lab数据科学协同创新平台表现出了浓厚的兴趣和关注。在许多知名院校中,K-Lab也已经得到了广泛的应用。借助这样一个基于云的平台,学校可以无需自行部署昂贵的基础设施,就可以让教师和学生使用世界先进的强大算力和和鲸科技提供的算法平台进行符合真实场景要求的演练,并提升专业技能。

收益

作为APN Advanced Technology Partner(APN进阶级技术合作伙伴),和鲸科技得到了多方面的业务收益,这些收益包括:

首先,大幅缩短产品的研发周期,能够快速的将数据协同创新平台推向市场。通过使用AWS提供的托管云服务,和鲸科技无需投入巨额的成本自行构建基础设施,即可在云上以软件即服务的方式为全国各地的高校和成千上万名师生,以及众多来自海外高校如哈佛、哥大、约翰霍普金斯的个人用户提供服务。这不仅可以降低和鲸科技的运营成本,同时也帮助高校降低了构建数据科学实验室的成本,让学校和师生可以专注于学习,而不是平台的构建和维护。

其次,加速产学研融合的步伐,和鲸科技在K-Lab教育版受到广泛认可的基础上,推出了K-Lab科研版,基于量化的科研生产与协作需求,为科研机构及团队提供科研协作平台。依托AWS支持GPU、CPU算力升级调用,提供开箱即用的Python、R语言生态,具备完善的论文生产,以及便捷的团队协作分享机制和一体化代码文献管理功能。帮助导师精准把控项目细节,加快研究进度,让团队成员摆脱繁复的基础工作,迅速进入研究重要阶段,大幅提升科研探索效率和论文质量。“作为APN进阶级技术合作伙伴,我们也能够在产品和平台上引入更多业界创新技术以及AWS的前沿技术资源,让师生在教学中可以获得符合真实业务场景的资料,从而在未来的工作中更具竞争力。“和鲸科技CEO/创始人范向伟说。

目前,和鲸科技已经基于AWS构建了K-Lab教育版、K-Lab科研版在内的数据科学工具,并对外提供和鲸社区服务(原Kesci科赛社区),通过这样一个开放的数据科学社区,用户不仅可以获得高质量的数据集,分享精彩的开源数据项目,更可以在多元化的实训场景中提升数据科学水平,目前已经有超过50000名数据科学家加入这一社区。和鲸社区也汇集了来自高校、科研机构、企业的数据科学任务,成员可以自由申请参加,锻炼实战能力,并获得回报。

清华大学

2001年成立的清华大学软件学院,是全国示范性软件学院之一,以培养具有国际竞争力、高层次、创新性、应用型软件人才为使命。随着数据时代到来,清华大学软件学院越来越重视培养人才的AI能力、数据分析能力及综合实战能力,但在人工智能教学过程中,学生往往需要花费大量时间做各类软件的安装和计算环境部署,需要很强的工程能力,而原有的教学管理系统也无法适应新教学模式,如何提高教学效率,培养学生核心能力,成为清华选择K-Lab的动因。

“K-Lab产品整体体验非常不错,工具包直接调用能够为我们数据分析工作提供很多方便,数据集和项目很大程度上锻炼了我们实际解决问题的能力。新版运行池在原生Jupyter notebook上做了很大优化,界面也比原来友好。”


——学生评价

展望未来

随着更多的中国学子海外求学,学习先进的大数据、机器学习与人工智能技术,和鲸科技将凭借AWS自身全球化服务优势,持续的为年轻一代的创新专业技术人才输送先进的服务和支持,全面助力教育行业的经济发展与数字化转型。在未来的合作中,和鲸科技也可借助AWS将和鲸数据科学工具KesciLab推向全球,促进海内外该领域人才的交流合作,构建国际化的数据科学协同创新平台,让先进的大数据、人工智能科研成果和教育经验能够跨越国界,进行无缝链接和融合。