AWS Resilience Hub

애플리케이션을 장애로부터 보호하기 위한 준비

AWS Resilience Hub의 이점

애플리케이션 복원성을 지속적으로 검증하고 추적해 중단을 줄입니다.
복원성 목표(복구 시간 목표 및 복구 시점 목표)를 평가합니다.
문제가 프로덕션에서 발생하기 전에 문제를 식별하고 해결합니다.
비즈니스 지속성을 최적화하고 복구 비용은 절감합니다.

작동 방식

AWS Resilience Hub는 AWS 기반 애플리케이션의 복원력 상태를 관리하고 개선할 수 있는 AWS Console 내 중앙 위치입니다. AWS Resilience Hub를 사용하면 복원력 목표를 정의하고, 해당 목표를 기준으로 복원력 상태를 평가하고, AWS Well-Architected Framework를 기반으로 권장되는 개선 사항을 구현할 수 있습니다. 또한 AWS Resilience Hub에서 애플리케이션의 실제 장애를 모방하여 종속성을 더 잘 이해하고 잠재적 약점을 찾아내는 데 도움이 되는 AWS Fault Injection Service(AWS FIS) 실험을 생성하고 실행할 수 있습니다.

AWS Resilience Hub는 복원력 상태를 지속적으로 강화하는 데 필요한 서비스와 도구를 한 곳에서 모두 제공합니다.

기능

애플리케이션을 CloudFormation 스택, Terraform 상태 파일, AppRegistry 애플리케이션 또는 리소스 그룹과 같은 리소스 모음으로 설명하거나 Amazon EKS에서 관리되는 Kubernetes 워크로드용 애플리케이션을 정의합니다. 리소스 모음과 Amazon EKS 클러스터를 모두 사용하여 애플리케이션을 설명할 수도 있습니다.
애플리케이션의 복원성 정책을 정의합니다. 이러한 정책은 애플리케이션, 인프라, 가용 영역, 리전 장애에 대한 RTO 및 RPO 목표를 포함합니다.

AWS Resilience Hub의 평가는 AWS Well-Architected Framework의 모범 사례를 사용하여 애플리케이션의 구성 요소를 분석해서 잠재적인 복원성 약점을 찾아냅니다. 이런 약점은 불완전한 인프라 설정, 잘못된 구성 또는 추가 구성 개선이 필요한 상황에 의해 발생할 수 있습니다.

AWS Resilience Hub는 복원성을 개선하기 위해 실행 가능한 권장 사항을 제공합니다. 또한 복원성 평가는 애플리케이션에 대한 복구 절차를 AWS Systems Manager 문서(표준 운영 절차(SOP)라고 함)로 생성하는 데 도움이 되는 코드 조각을 생성합니다. AWS Resilience Hub는 권장되는 Amazon CloudWatch 모니터링 및 경보 목록을 생성하여 운영자가 배포된 애플리케이션의 복원성 태세에 변경 사항이 있는지를 빠르게 식별하도록 도와줍니다.

애플리케이션 및 SOP가 복원성 평가의 권장 사항을 통합하도록 업데이트된 후에는 애플리케이션을 프로덕션으로 릴리스하기 전에 AWS Resilience Hub를 사용해 애플리케이션이 복원성 목표를 충족하는지 테스트 및 검증할 수 있습니다. AWS Resilience Hub는 카오스 엔지니어링(chaos engineering) 서비스인 AWS Fault Injection Simulator(FIS)와 통합되어 오류 주입을 통해 실제 오류를 시뮬레이션해 애플리케이션이 정의된 복원성 목표 내에 복구되는지 검증합니다. 네트워크 오류나 데이터베이스에 대한 너무 많은 연결 등이 이에 해당될 수 있습니다. 또한 AWS Resilience Hub는 지속적인 복원성 검증을 위해 복원성 평가 및 테스트를 CI/CD 파이프라인에 통합할 수 있도록 다양한 API를 제공합니다. 복원성 검증을 CI/CD 파이프라인에 통합하면 애플리케이션의 기본 인프라에 대한 변경이 복원성을 손상하지 않도록 하는 데 도움이 됩니다.

사용 사례

오류 주입을 통해 실제 오류를 시뮬레이션하면 복구 표준 운영 절차(SOP) 및 경보의 효과를 검증하는 데 도움이 됩니다.

실행 가능한 권장 사항을 제공하여 복원성을 개선하고 복구 절차 생성을 돕습니다.

계획된 중단 및 비계획된 중단 동안 이벤트 감사 추적을 유지하여 규정 준수 및 규제 요구 사항을 충족하도록 돕습니다.

고객

Pearson 로고

“AWS Resilience Hub를 사용하면 애플리케이션의 기능을 살펴보고... '이것이 미션 크리티컬 애플리케이션인지, 잠시 중단되어도 운영에 영향을 미치지 않을 수 있는지'라고 자문해 볼 수 있습니다. AWS Resilience Hub는 값을 입력하고 Pearson에 실제로 어떤 애플리케이션이 중요한지 매우 빠르게 이해할 수 있었기 때문에 중요했습니다.”


-Ronnie Kendrick, Pearson Infrastructure and Operations 부문 Senior SRE Manager

Pearson, AWS Resilience Hub를 활용하여 애플리케이션 복원력 향상

“ADL Digital Labs(ADL)는 2017년에 탄생했으며 오늘날 라틴 아메리카 내 금융 서비스 산업을 위한 디지털 제품을 촉진하는 데 가장 적합한 플랫폼 중 하나입니다. 고객에게 매우 안정적인 솔루션을 제공하는 것이 중요하다는 점을 인식한 ADL은 정책 규정 준수와 가용성 목표에 대한 가시성을 유지하면서 애플리케이션의 복원력 상태를 확인하고 추적하기 위해 AWS Resilience Hub를 통합했습니다. AWS Resilience Hub를 ADL의 비즈니스 연속성 프레임워크에 통합한 결과 콜롬비아의 주요 금융 기관 네 곳에서 약 400만 명의 고객에게 서비스를 제공하는 트랜잭션 채널 8개의 복원력과 비즈니스 연속성 상태를 검증할 수 있었습니다.“ - Avaler Chaparro, Aval Digital Labs Architecture 부문 Head


AWS 자세히 살펴보기