白皮书

韧性生命周期框架

本白皮书分享了您可以纳入到您的组织和开发流程,以提高持续韧性的服务、策略、最佳实践和机制。

了解更多 »

多区域基础知识

本白皮书适用于在 AWS 上构建工作负载,且有兴趣使用多区域架构来提高工作负载韧性的云架构师和高级领导者。

了解更多 »

高级多可用区韧性模式

本白皮书提供关于如何检测工作负载的指导,以发现隔离在单个可用区中的灰色故障所产生的影响,然后采取行动降低其对可用区的冲击。

了解更多 »

使用 AWS 故障隔离边界

本白皮书详细介绍了 AWS 如何利用其故障隔离边界(包括可用区(AZ)、区域、控制面板和数据面板)来创建区域、地区和全球服务。 

了解更多 »

AWS 上的工作负载灾难恢复

本白皮书概括介绍了为部署到 AWS 的任何工作负载计划和测试灾难恢复的最佳实践,并提供了不同的方法来降低风险和满足该工作负载的恢复目标。

了解更多 »

韧性分析框架

本白皮书介绍了一种韧性分析框架,该框架提供了一种一致的方法来分析故障模式及其可能对您的工作负载造成的影响。

了解更多 »

博客

韧性最佳实践

每个人都应了解的关于韧性的四个概念 
还不了解韧性? 阅读此博客,了解四个最重要的概念,帮助您踏上在云端构建韧性应用程序的旅程。 
使用 AWS 韧性监测中心构建韧性 Well-Architected 工作负载
了解如何根据韧性监测中心的建议,使用韧性监测中心来评测和提高单可用区(AZ)架构的韧性。

高可用性模式

系列:使用 AWS 服务创建多区域应用程序
了解 AWS 为帮助您构建韧性多区域架构而提供的具体服务和功能。 
从单个可用区的应用程序故障中快速恢复
使用 Amazon Route 53 应用程序恢复控制器执行可用区转移使您能够从单个可用区(AZ)的应用程序故障中快速恢复。
自动实现无需干预的安全部署
了解 Amazon 如何自动验证任何类型的源更改并将其安全地部署到生产环境,以及如何将此策略应用到您的工作中。 
可靠性、持续工作和一杯美味的咖啡
学习如何运用巧妙的咖啡类比以及 Amazon Route 53 和 S3 等 AWS 服务来构建简单、可扩展的韧性系统。 
使用幂等 API 确保重试安全
了解使用幂等 API 来降低复杂性和管理重试的策略。
选择具有弹性负载均衡和 EC2 自动扩缩的正确运行状况检查
客户经常使用弹性负载均衡(ELB)负载均衡器和 Amazon EC2 Auto Scaling 组(ASG)来构建可扩展的韧性工作负载。

灾难恢复

系列:AWS 上的灾难恢复(DR)架构
本系列由四个部分组成,分享了以下四种策略下的灾难恢复最佳实践:备份与还原、指示灯(Pilot Light)、暖待机(Warm Standby)和多站点主动/主动。 
使用 Amazon Route 53 创建灾难恢复机制
现代 DNS 服务(如 Amazon Route 53)提供了运行状况检查和失效转移记录,您可以使用这些记录来简化和加强灾难恢复计划。 

混沌工程

任何一天都可以是 Prime Day:Amazon.com Search 如何使用混沌工程每秒处理超过 8.4 万个请求
了解 Amazon Search 如何将技术和文化相结合,为其构建者团队赋能,通过混沌工程确保平台韧性。
查看更多博客 »

视频

Itau Unibanco 利用 AWS 提高应用程序韧性(1:29)
Vanguard 使用 AWS Well-Architected 增强了韧性,加强了交流(1:19)
Broadridge 借助 AWS 提高其关键系统的韧性(1:05)
多区域设计模式和最佳实践(ARC306)(58:05)
缩小冲击范围,在逆境中求生存(ARC305)(49:03)
可靠的可扩展性:Amazon.com 如何在云端实现扩张(ARC206)(57:37)