AWS案例研究: 维普资讯

2022

维普资讯主要从事数字出版、学术科研资源管理、学术诚信与伦理建设、教育教学辅助、学术大数据应用等业务,是一家服务于政府机构、高等院校、科研院所、大中型企业的大型高科技集团企业。在业务初次上云的尝试中,维普资讯采用了 AWS 中国区域的服务(北京区域由光环新网运营,宁夏区域由西云数据运营)来部署智慧图书馆业务,为业务提供容灾能力并大幅降低业务的总体成本。维普资讯所采用的 AWS 服务包括 Amazon EC2、Amazon S3、Amazon EMR、Amazon Lambda、Amazon RDS、Amazon DynamoDB、Amazon CloudWatch 等。

业务需求与挑战

重庆维普资讯有限公司(以下简称“维普资讯”),前身为中国科技情报研究所重庆分所数据库研究中心,是中国第一家进行中文期刊数据库研究机构。经过多年运营,维普资讯已经从信息内容服务提供商,发展成为以提供信息资源产品为主,同时,以提供信息内容管理及服务一体解决方案的综合信息服务提供商。针对全国高等院校、公共图书馆、情报研究机构、医院、政府机关、大中型企业等各类用户的需求,维普资讯陆续推出了《中文科技期刊数据库》、《中国科技经济新闻数据库》、《中文科技期刊数据库(引文版)》、《外文科技期刊数据库》、《中国科学指标数据库》、智立方文献资源发现平台、中文科技期刊评价报告、中国基础教育信息服务平台等系列产品,受到了用户的广泛赞誉。

自 1995 年成立至今,维普资讯经历了近 30 年的发展历程,在这一过程中各主要业务系统也分阶段逐步建立,系统主要部署在 6 个单线机房为全国用户提供服务。伴随着业务规模的不断扩大,基于机房托管模式运营的业务逐渐开始遇到新的挑战。目前维普资讯收录文章多达 7500 万篇,外加其他图片性质的文件,承载在维普资讯服务器上的文件使用存储约 200TB,文件数量超过 3 亿个,庞大数据量使得托管机房内的服务器扩容、数据同步以及日常的维护成为难题。“我们的业务对存储设备有着很大的依赖性,通常每 2-3 年就需要对存储进行扩容,这不仅涉及到复杂的采购和部署流程,也让我们的运维成本居高不下。” 维普资讯运维总监徐勇谈到。“为了满足业务的需求,我们需要构建分布式的存储,并且还需要考虑这些宝贵文档数据的副本与冗余,在业务连续性方面也需要关注服务的可靠性,假如托管机房因为网络故障、服务器损坏等发生中断,会影响到数百万的用户,然而这些技术措施既需要大量的人力资源投入,也需要资金投入,在云的时代,我们希望转变思路,借助云上的弹性资源更加灵活的应对业务的增长。”

上海探链科技有限公司
kr_quotemark

Amazon EMR以托管服务的方式让我们可以在几分钟内启动集群,快速的运行大数据和分析类的工作负载,替代我们传统的自建服务器方式,让技术团队可以专注在业务的需求上,而更快速的数据处理也意味着我们的用户能够获得更好的智慧图书与期刊检索体验。”

徐勇

维普资讯有限公司 运维总监

为什么选择 AWS

为了解决传统本地数据中心托管方式的不足,维普资讯开始评估将业务部署到云端的可行性。经过对几家主要云服务提供商的综合对比之后,维普资讯基于总体拥有成本、技术成熟度与服务支持等多方面考虑,最终选择将智慧图书馆业务迁移至 AWS 中国区域的服务(北京区域由光环新网运营,宁夏区域由西云数据运营)。在维普资讯看来,相比其他的云服务提供商,AWS 具备以下几方面的突出优势:

  • 功能齐全和应用广泛的云平台
  • AWS 已成为全球最全面、应用最广泛的云平台之一,全球数据中心提供超过 200 项功能齐全的服务。能够直接为维普资讯的智慧图书馆业务提供高性能的支持。例 Amazon DynamoDB 提供了快速且灵活的 NoSQL 数据库服务,可以为智慧图书馆场景提供自动化的多区域复制和毫秒级的性能。Amazon Simple Storage Service (Amazon S3) 对象存储服务也是众多云服务提供商所效仿的对象,在维普资讯看来,选择这样具备先进技术优势和丰富客户服务经验的云服务提供商,可以消除业务初次上云尝试中的各种不确定性,降低试错成本。

  • 提供可与开源框架完全兼容的托管服务
  • 在业务迁移上云的过程中,维普资讯的技术团队需要充分考虑云平台对既有业务系统和架构的兼容性,同时也希望技术团队已有的知识和技术经验能够在云上得到复用。AWS 众多服务提供了与开源框架完全兼容的能力,因此维普资讯的技术团队可以使用自己熟悉的开源工具、语言来操作诸如 Amazon EMRAmazon RDSAmazon DynamoDB 等 AWS 托管服务的 API,在短时间内即可熟悉云上的操作与管理,将迁移过程中的准备时间大幅缩短。

  • 专业架构师团队为迁移提供可靠保障
  • 在进行云评估的过程中,AWS 专业技术团队的支持也给维普资讯留下了深刻的印象。“从 AWS 101 到架构完善最佳实践,AWS 的架构师团队都是我们业务迁移上云过程中有力的技术保障力量。”徐勇说,“在专业架构师的建议下,我们尝试了 Amazon Lambda 无服务器计算服务来处理各应用之间的协调与衔接,从而消除了对服务器的依赖,并且我们也在评估的过程中测试了 Amazon CloudWatch,这一服务让我们可以直观的管理云上的资源,相比传统机房运维可以节约大量的人力。”

获得的成效

将智慧图书馆等业务迁移至 AWS 中国区域的服务(北京区域由光环新网运营,宁夏区域由西云数据运营),维普资讯不仅成功解决了过去长期基于机房托管模式运营业务所带来的多种挑战,同时也给业务带来了多方面的成效:

为业务提供容灾能力并大幅降低业务的总体成本。Amazon S3 对象存储服务为长期的文献存储提供了可扩展性、安全性和“ 1 1个 9 ”的数据持久性。相比于自行构建分布式文件系统,维普资讯采用 Amazon S3 后无需再预估未来业务的增量和定期扩充存储硬件,只需按实际占用的存储空间付费即可获得满足持续增长需求的数据存储能力。在成本管理方面,维普资讯采用 Amazon EC2 Spot 实例与预留实例分别解决短期突发数据处理需求和长期业务支撑资源之间的成本优化问题,帮助企业大幅降低了云上的成本支出。

通过引入 AWS 的多种托管服务与无服务器计算能力,维普资讯在降低了业务架构的复杂性的同时实现了性能上的优化。“无论是智慧图书馆还是期刊数据库或类似场景的应用,都离不开高效的检索支持,Amazon EMR 以托管服务的方式让我们可以在几分钟内启动集群,快速的运行大数据和分析类的工作负载,替代我们传统的自建服务器方式,让技术团队可以更专注在业务的需求上,而更快速的数据处理也意味着我们的用户能够获得更好的智慧图书与期刊检索体验。并且它能够直接与 Amazon S3等 AWS 的服务集成在一起,让我们的业务架构可以从云的规模和可扩展上获得更多的优势。”徐勇说。

此外,通过将 AWS 的服务带入到业务之中,也为维普科技的运维管理带来了更多灵活性。“AWS 相当于我们的‘特殊数据中心”,在我们需要它的时候,它可以随时为我们提供服务。例如我们在计划将天津机房搬迁至新的北京机房时,如果没有 AWS 的支持,我们的业务需要停机两周甚至更长的时间。”徐勇谈到,“现在,我们只需预先将业务部署到 AWS 的服务上,通过切换域名解析到云上的方式来保持业务的连续性,无需担心搬迁会导致业务的中断。”

未来,维普资讯将继续与 AWS 一同携手合作,共同创新,并计划引入更多的 AWS 的服务不断提升文献管理、知识服务与共享等多业务领域的功能,为使用者提供更加丰富的体验。


关于维普资讯

重庆维普资讯有限公司成立于 1995 年,前身为中国科学技术情报研究所重庆分所数据库研究中心,是中国学术数据库产业的开拓者和奠基人。公司主要从事数字出版、学术科研资源管理、学术诚信与伦理建设、教育教学辅助、学术大数据应用等业务,是一家服务于政府机构、高等院校、科研院所、大中型企业的大型高科技集团企业。

为什么使用 AWS

  • 功能齐全和应用广泛的云平台
  • 提供可与开源框架完全兼容的托管服务
  • 专业架构师团队为迁移提供可靠保障

使用的 AWS 服务

Amazon ECS

Amazon ECS 是一项完全托管式容器编排服务,您可以用它轻松部署、管理和扩展容器化的应用程序。

了解更多》

Amazon ElastiCache

Amazon ElastiCache 可使您在云中无缝设置、运行和扩展常见的开源兼容内存中数据存储。

了解更多》

Amazon EKS

Amazon Elastic Kubernetes Service (Amazon EKS) 是一项托管容器服务,可以在云中和本地运行和扩展 Kubernetes 应用程序。

了解更多》

Amazon RDS

Amazon Relational Database Service(RDS)是一个托管式服务的集合,可以简化在云中设置、运营和扩展数据库的过程。

了解更多》


开始使用

各行各业中所有规模的公司都在使用 AWS 对其日常业务进行转型。联系我们的专家,立即踏上您的 AWS 云之旅。