亚马逊AWS官方博客

针对 AWS 弹性灾难恢复自动进行 AWS 内失效自动恢复

我在 2021 年的博客文章中首次介绍了 AWS 弹性灾难恢复(DRS)。在那篇文章中,我描述了 DRS 如何“使客户能够将 AWS 用作本地应用程序的弹性恢复站点,无需投资配置本地部署灾难恢复基础设施,除需要使用时,它们都处于闲置状态。启用后,DRS 将对您的操作系统、应用程序和数据库保持持续不断的复制状态。” 我很高兴地宣布,今天,DRS 还支持 AWS 内失效自动恢复,此外还支持原始版本中包含的对无中断恢复演练和本地失效自动恢复的现有支持。

我还在之前的文章中写道,演练是灾难恢复的重要组成部分,因为如果您不进行测试,就根本无法确定灾难恢复解决方案能否在需要时正常运行。但是,客户很少喜欢测试,因为这是一项耗时并具有破坏性的活动。自动化和简化便于您频繁地进行演练,甚至是大规模演练,能让您更好地为灾难做好准备,现在,无论您的应用程序是在本地还是 AWS 中,您都可以使用它们。无中断的恢复演练让您更有信心,在需要启动恢复或失效自动恢复时,您将实现恢复时间目标(RTO)和恢复点目标(RPO)。有关 RTO 和 RPO 及其定义重要性的更多信息,可以在恢复目标文档中找到。

有了新的自动支持,Amazon Elastic Compute Cloud(Amazon EC2)实例在出现故障时可简便快捷地自动恢复到原始区域,并且可以从 AWS 管理控制台方便地启动失效转移和失效自动恢复流程(用于本地或 AWS 内恢复)。此外,对于想要自定义构成恢复工作流程的精细步骤的客户,DRS 提供了三个新 API,链接见本文底部。

失效转移与失效自动恢复
失效转移是指在发生威胁应用程序可用性的中断或问题时,将正在运行的应用程序切换到其他可用区,甚至切换到其他区域。失效自动恢复是将应用程序返回到原始本地位置或区域的过程。要将应用程序失效转移到其他可用区,如果需要,与该区域无关的客户可以无限期地继续在新区域中运行应用程序。在这种情况下,它们将反向恢复复制,因此已恢复的实例将受到保护,以备将来恢复。但是,如果失效转移到其他区域,则当导致故障转移的问题得到解决后,客户很可能希望最终恢复并返回到原始区域。

下图说明了受 DRS 保护的 AWS 内应用程序的架构。下图中的架构适用于跨可用区场景。

DRS 的跨可用区架构

下图的架构图适用于跨区域场景。

DRS 的跨区域架构

假设一个 AWS 内应用程序发生了事故,因此我们启动了向其他 AWS 区域的失效转移。问题解决后,我们希望恢复到原始区域。以下动画说明了失效转移和失效自动恢复过程。

失效转移和失效自动恢复过程的图示

了解有关使用弹性灾难恢复在 AWS 内进行失效自动恢复的更多信息
正如我前面提到的,三个新的 API 也可供想要自定义所涉及的精细步骤的客户使用。使用下面的链接可以找到这些文档。

新的 AWS 内失效自动恢复支持适用于所有可用 AWS 弹性灾难恢复的区域。在用户指南中了解有关 AWS 弹性灾难恢复的更多信息。有关新的失效自动恢复支持的具体信息,建议查阅服务用户指南中的本主题

— Steve