如何为 Amazon ElastiCache Redis 集群实现灾难恢复或容错能力?

上次更新时间:2020 年 10 月 21 日

我需要为 Amazon ElastiCache Redis 集群数据实现灾难恢复或容错能力。提供了哪些选项?

解决方法

不同的容错能力解决方案在数据持久性、性能影响和成本方面有不同的平衡考虑。请根据您的使用案例选择最适合的方案:

多可用区

多可用区方案非常适合需要优先考虑数据保留、最短停机时间和应用程序性能的情形。

  • 数据丢失可能性 – 低。多可用区为所有场景提供容错能力,包括硬件相关问题。
  • 性能影响 - 低。由于实施过程后无需人工干预,在所有可用选项中,多可用区方案的恢复时间最短。
  • 成本 - 低到高。多可用区是成本最低的选项。如果您无法承受硬件故障导致数据丢失的风险,或无法忍受使用其他选项时响应中断所需的停机时间,则应使用多可用区方案。

有关多可用区方案的更多信息,请参阅利用多可用区最大限度地减少 ElastiCache for Redis 停机时间

每日自动备份

当您预计集群的资源利用率较低时,可以计划每日自动备份。ElastiCache 创建一个群集备份,然后将所有数据从缓存写入 Redis RDB 文件。Redis 2.8.22 及更高版本实现了无分支备份,有助于提高性能

注意:对于集群模式已禁用的集群,cache.t1.micro 节点不支持 Redis 备份和还原。

  • 数据丢失可能性 - 高 (最多丢失一天的数据)。每日自动备份最长可保留 35 天。
  • 性能影响 - 中到高。一天运行多次文件备份会影响性能。要提高性能,可考虑在指定的仅持久性辅助节点上启用 RDB 快照。然后在主节点及所有其他辅助节点上同时禁用 RDB 快照和 Redis 仅附加文件 (AOF)。
  • 成本 - 低到中。存储成本随备份数量和数据保留期限的增加而增加。

在实施备份和还原前,请考虑备份约束导致的限制。有关为运行 Redis 的 ElastiCache 集群实施备份的完整信息,请参阅 ElastiCache for Redis 的备份与还原。有关更多信息,请参阅进行手动备份