亚马逊AWS官方博客

Tag: Aurora failover

居安思危 —— Amazon Aurora 故障恢复之降低DNS切换对应用影响篇

在提升单计算节点故障恢复的速度以外,Aurora在写节点发生故障时,会通过failover的机制提升集群中的一个读节点来作为新的主节点对外提供服务,再去同步地恢复故障的主节点。通过使用健康的读节点进行替换,能够进一步提升Aurora集群的可用性,进而使对应用程序的影响在30到60秒左右。那么,是否还能进一步降低节点切换对应用程序的影响呢?本篇博客会从这个角度进行相应探讨,涵盖故障切换的过程、花费时间的分析排查以及减少对应用程序影响的几种方案。