亚马逊AWS官方博客

易保云中台使用 AWS Backup 守护保险客户的云上数据

易保云中台简介

易保®云中台®(InsureMO®)是在全球范围内广受认可的保险中间件平台,致力于重塑数字保险版图及生态。平台已被各类保险生态企业采用,包括:保险公司、经代公司、车商/车企、保险科技公司、软件供应商等,是为全球保险行业现代化及简化保险运营的重要技术平台。

易保®云中台®目前为全球 40 多个国家的 300 多家保险公司、5,000 多个渠道以及保险科技创新公司提供技术赋能,每年通过该平台交易的保费超过 200 多亿美元。易保网络正在推动云中台成为全球保险业的中间件,将保险产品嵌入更多合作伙伴的业务中,并为他们创造更多价值,实现易保 “让保险变得容易” 的使命。更多详细信息请参观公司网站

数据备份和恢复的需求

保险数据的隐私和保护至关重要。保险数据包含了客户的个人信息、财务状况和健康记录等敏感内容,一旦泄露或被滥用,将给客户带来巨大的隐私和经济损失。保险公司有责任采取严格的技术和管理措施,确保数据的安全性、完整性和持久性,防止未经授权的访问、使用、披露或破坏。同时,还应当遵守相关的法律法规,尊重和保护客户的隐私权利。只有这样,才能赢得客户的信任,维护行业的良性发展。比如以下几个要求。

数据不能传输出境

保险数据作为敏感信息,其存储和使用必须严格遵守相关法律法规,确保数据安全和客户隐私保护。由于每个客户所属地区的合规要求不尽相同,易保云中台日常的数据备份工作需要覆盖 9 个区域,给数据管理带来了巨大挑战。为防止数据外泄和跨境违规,易保云中台必须采取严格的数据本地化策略,确保每个客户的数据都存储在其所属区域的本地数据中心,决不能擅自跨境传输或备份。这不仅需要建立完善的技术手段,还要制定明确的内部流程,对数据访问、使用、传输等环节进行全方位管控。AWS Backup 提供了跨多个区域统一管理的界面,并将各种资源备份到各自的本地区域。

定期的数据恢复测试

保险客户十分重视自身数据的安全性和可用性,因此会定期要求保险公司对备份数据进行恢复测试,并提供详细的测试报告,以确保数据在发生故障或灾难时能够及时恢复。这项要求不仅是对保险公司数据备份和灾备能力的检验,也是对数据合规性的有力监督。保险公司必须高度重视,制定完善的恢复测试计划和流程,模拟各种可能的故障场景,验证数据备份的完整性、一致性和可恢复性。恢复测试报告需要全面反映测试过程和结果,包括测试目的、范围、方法、环境、步骤、发现的问题及整改措施等内容。对于保险公司来说,及时通过恢复测试发现并解决数据备份和灾备中的漏洞,不仅可以提高自身的数据可靠性,也有利于树立良好的合规形象,赢得客户的信任。而对客户而言,定期审阅恢复测试报告,可以全面了解保险公司的数据安全和合规水平,从而选择最值得信赖的合作伙伴。AWS Backup 设计了定期自动化恢复测试和验证,自动产生恢复测试报告,帮助易保云中台完成这个流程。

客户和保单数据长期保存

在保险行业,数据合规性要求异常严格,尤其是对于数据保存期限的规定。即使客户已经不再使用易保云中台的服务,其历史数据也需要按照监管要求,相关数据在备份系统中需要保存 7 年之久。作为领先的保险科技公司,易保云中台高度重视数据合规,将 AWS Backup 视为确保数据长期保存的核心能力,Vault Lock 不仅能满足监管要求,其合规模式(compliance mode)也为客户提供了数据长期保存的而不会被删除的保障。客户可以在需要时随时申请恢复历史数据,方便查阅和使用。这种”暖备份”能力,为客户的业务连续性和合规经营提供了有力支撑。

以上都是一些来自客户和保险行业的合规要求,为了提升数据备份和恢复的工作效率和安全,易保云中台的 IT 运维团队也制定规范的内部要求:

  • 备份和恢复统一管理界面,在同一个界面中操作 RDS、EBS、EC2 等各种服务的备份和恢复。
  • 同时管理多个账号的备份和恢复,在一个管理员账号中管理其他 30 个账号资源的备份和恢复。
  • 系统管理和备份权限隔离,防止故意删除数据。系统管理员能够管理系统资源,但是没有权力删除备份数据。
  • 自动审计和报告功能,每天自动审计备份结果是否符合制定的合规要求,并生成审计报告。

AWS Backup 服务简介及使用

AWS Backup 是一项完全托管的免费 BaaS(Backup as a Service)服务,可以轻松地跨 AWS 服务、云端和本地自动执行数据保护。使用此服务,您可以一站式配置备份策略并监控资源备份活动。它允许您自动执行和整合以前执行的备份任务 service-by-service,并且无需创建自定义脚本和手动流程。只需在 AWS Backup 控制台中单击几下,即可自动执行数据保护策略和计划。目前 AWS Backup 已经支持各种存储、EC2、RDS 服务达到 22 种,针对上面提到的保险客户和 IT 运维团队的需求,AWS Backup 都提供了解决方法,下面我们来看看 AWS Backup 如何完美解决自动恢复测试和跨账号备份这两个问题。

自动恢复测试和验证

恢复测试是备份的一个重要步骤,主要用来验证备份数据在关键时候是不是真能够恢复成功、恢复流程是否正确、运维人员操作是否熟练、实际恢复时间(restore time actual)是符合设计要求。一般企业都有定期的恢复演练,来保证备份的有效性和运维人员操作流程的熟练程度。一般恢复演练都是手工操作,只有极少数企业能够达到自动编排测试流程,并且发送恢复测试结果。AWS Backup 作为一个托管备份服务,提供了一套完善服务和功能,能够自动化完成恢复测试和验证。主要步骤如下图 1 所示:

图 1 – 恢复测试流程

按照上面的流程图,我们解释每一个步骤的作用和需要注意的地方。

步骤 1:创建恢复测试计划

一个恢复测试包含 2 部分:计划和资源分配。计划是指恢复测试的周期和频率,比如是每周一次或者每月一次;资源分配是指对哪些备份资源进行恢复测试,例如 EC2 或者 RDS,默认情况下,恢复测试完成之后,会自动删除恢复的资源,避免资源继续运行产生额外成本。如果需要运行下面的步骤 3,则可以设置将恢复资源保留 1 小时或者更长时间(如下图 2),进行恢复验证,待验证完成之后,再删除资源。详细操作参考

图 2 – 恢复测试设置

步骤 2:恢复完成,将 COMPLETED event 发送到 event bus

设置好恢复测试之后,AWS Backup 会按照指定的频率和指定的资源进行恢复,等资源恢复完(restore)成以后,会发布一个 restore job COMPLETED event 到 AWS event bus。

步骤 3:设置 EventBridge 规则(rule),触发 Lambda 函数

在 EventBridge 的 console 界面创建一个规则,来捕捉步骤 2 产生的 event,根据这个 event 触发一个 Lambda 函数,对恢复出来的资源进行检查,例如检查一个对外提供 HTTP 服务的 EC2 实例是否能正常被访问。

图 3 – EventBridge rule 设置

步骤 4:Lambda 函数检查恢复资源是否符合要求,将验证结果更新到步骤 2 的恢复作业状态栏

EventBridge 会触发运行一个提前定义的 Lambda 函数,并将 restore job 的 event meta 传入 Lambda 函数。Lambda 函数获取恢复资源的 ARN,进行检查和验证,并最终将结果写回步骤 2 的作业。验证完成之后,恢复的资源会自动被删除。关于 Lambda 函数的功能实现,需要 IT 人员进行编程。AWS 提供了一个代码框架,可以通过使用 AWS Bedrock 服务,让 Bedrock 根据需求把代码框架扩充实现指定验证,IT 人员再进行细微调整即可使用。最终测试恢复及数据验证结果如下面图 4:

图 4 – 恢复测试验证结果

经过上面 4 个步骤设置,AWS Backup 将一个自动化恢复测试和验证流程完美实现。

跨账号备份和恢复

易保云中台科技的很多客户都有自己的独立账号,每次备份设置和变更的时候需要登陆独立账号进行操作,当独立账号多达几十个的时候,几十次的独立操作不但花费很大精力,而且非常容易出错,也不方便检查备份结果。AWS Backup 提供了跨多个账号备份的功能,可以定制一个共同的备份策略,通过 Organization 分发给指定的账户,同时在一个管理账号监控所有备份结果。主要功能和实现方法如下面图 5:

图 5 – 跨账号备份和恢复

下面是操作和配置的步骤:

  1. 创建 Organization 组织,委派 Organization 的管理员。根据不同的备份要求将账号加入 Organization Unit。参考操作
  2. 在 AWS Backup 的 Setting 里面分别启用“Cross Account Monitoring“ 和 “Backup Policies” 选项,支持跨账号备份和监控功能。
  3. 在 AWS Backup 的“Backup Policies”菜单创建一个备份 policy,并且 attach 到一个如图 5 的 OU。参考操作

按照上面 3 个步骤,我们可以实现一个账号统一配置备份策略,并分发到各个账号,这个账号也能够监控到所有账号的备份结果。

结语

保险行业是对数据保护最为严格的行业之一。易保云中台和亚马逊云科技共同合作,使用 AWS Backup 服务,确保了客户数据的不丢失、定期恢复测试验证、统一管理和备份策略和监控等需求。作为全球保险行业数字化转型的技术伙伴,易保云中台的经验可以为更多的同行提供借鉴。

本篇作者

吴盛峰

来自易保云中台的解决方案架构师,他为易保云中台的基础架构提供改进和优化建议,同时参与了平台安全策略、标准和最佳实践的制定工作,帮助客户构建他们的数据保护解决方案。工作之余,他喜欢与家人共度时光,一起旅行。

谢伟峰

亚马逊云科技存储和数据保护专家。擅长根据客户工作负载,对存储进行性能和成本优化;根据客户数据保护需求和合规要求,制定个性化的备份和恢复方案。工作之余,喜欢游泳、打羽毛球。

吴双

亚马逊云科技技术客户经理,负责企业级客户架构及成本优化、技术支持等工作,致力金融及制造等行业,在大数据、网络及容器等领域有较深入的理解。

琚小龙

亚马逊云科技解决方案架构师,负责基于亚马逊的云计算方案架构咨询和设计,对于微服务、DevOps 和容器领域有较深入的理解。曾任职于 HPE 以及互联网创业公司,拥有多年移动互联网、大型企业复杂应用的系统架构和设计经验。