- AWS 홈›
- AWS 클라우드 복원력
비즈니스 연속성을 위한 빌드
사람의 실수, 네트워크 문제 또는 로드 급증으로 인한 서비스 중단은 비용이 많이 드는 가동 중지 시간, 규정 위반, 브랜드 신뢰 손상으로 이어질 수 있습니다. AWS는 비즈니스 연속성을 지원하는 고가용성 애플리케이션을 구축하고 운영할 수 있도록 서비스, 자동 복구 기능 및 전문가 지침을 제공합니다. AWS에 구축하면 최대 규모의 프라이빗 글로벌 네트워크에서 업계 최고 수준의 가용성과 다른 어떤 클라우드 공급자보다 뛰어난 운영 경험을 바탕으로 한 지원을 받을 수 있습니다. 수백만 명의 고객이 가장 비즈니스 크리티컬한 애플리케이션에 있어 AWS를 신뢰합니다.
장점
AWS는 모든 클라우드 공급자 중 최고의 네트워크 가용성을 제공하므로 안심하고 애플리케이션을 구축하고 실행할 수 있습니다. 각 AWS 리전은 독립적인 전력 인프라, 냉각 시스템, 네트워크 연결과 함께, AZ 근처에서 재해가 발생하더라도 워크로드를 안전하게 보호하는 보안 시스템을 갖춘 물리적으로 분리된 3개 이상의 가용 영역(AZ)으로 구성됩니다.
AWS는 매년 수백만 건의 봇넷 기반 분산 서비스 거부(DDoS) 공격이 비즈니스 운영을 방해하기 전에 몇 분, 심지어 몇 초 안에 자동으로 차단하며, 고도로 훈련된 대응 팀을 배치하여 자동으로 탐지 및 완화되지 않은 DDoS 공격을 해결합니다. 또한 AWS는 매일 1억 건 이상의 상호 작용을 분석하고 고유한 글로벌 센서 네트워크의 데이터를 사용하여 위협을 자동으로 완화합니다.
AWS는 하드웨어 성능 저하를 자동으로 감지, 장애가 발생하기 전에 구성 요소를 사전에 교체하고 전체 네트워크 이벤트의 96%를 자동으로 해결 또는 완화하여 사람의 개입 없이 처리할 수 있는 거의 모든 이벤트를 자동으로 해결합니다.
AWS Resilience Hub는 애플리케이션 복원력을 평가하고 권장 개선 사항을 구현하는 데 도움이 됩니다. AWS Fault Injection Service(FIS)를 사용하면 애플리케이션이 실제 장애와 수요 급증을 어떻게 처리하는지 쉽게 테스트할 수 있으므로 고객에게 영향을 미치기 전에 문제를 해결할 수 있습니다. Amazon Application Recovery Controller를 사용하면 수동 스크립팅 없이 가용 영역(AZ) 간에 트래픽을 이동하고 리전 간의 복잡한 장애 조치를 조정할 수 있습니다.
2006년부터 AWS는 전 세계 수백만 고객에게 클라우드 서비스를 제공하여 다른 어떤 클라우드 공급자보다 많은 대규모 운영 경험을 보유하고 있습니다. AWS Well-Architected Framework의 운영 우수성 원칙에 있는 검증된 모범 사례를 사용하고 복원력 수명 주기 프레임워크를 따라 가동 중지 시간의 위험을 최소화하여 잠재적 장애로 인한 영향을 줄이세요.
사용 사례
AWS 장애 격리 경계를 활용하고 AWS Well-Architected Framework 신뢰성 원칙에 따라 복원력을 설계합니다. Amazon Application Recovery Controller를 사용하여 가용 영역(AZ) 간에 트래픽을 이동하고 리전 간의 장애 조치를 조정하는 자동화된 작업을 설정합니다.
애플리케이션, 인프라, 가용 영역 및 리전 중단에 관해 RTO 및 RPO 목표를 정의하고, AWS Resilience Hub를 사용하여 해당 대상에 대한 복원력을 추적합니다.
AWS Fault Injection Service(FIS)를 사용해 실제 장애와 수요 급증을 테스트하여 고객에게 영향을 미치기 전에 문제를 식별하고 해결할 수 있습니다.
리전 스위치를 사용하여 AWS 리전 전반의 복구를 조정하고, 규정 준수 보고에 필요한 전체 리소스와 계정에서 복구 프로세스 관련 데이터를 수집할 수 있습니다. AWS Fault Injection Service(FIS) 실험 보고서를 사용해 복원력을 입증하고 규제 기관에 재해 복구 테스트의 문서화된 증거를 제공합니다.
AWS Backup을 사용하여 AWS 서비스 전반에서 데이터를 자동으로 보호하고 중요한 비즈니스 데이터를 안정적이고 안전하게 백업할 수 있습니다. AWS Elastic Disaster Recovery를 사용하면 비즈니스 크리티컬 애플리케이션을 모든 소스 인프라에서 AWS로 지속적으로 복제하여 가동 중지 시간과 데이터 손실을 최소화할 수 있습니다. 이를 통해 분 단위로 측정된 1초 미만의 RPO 및 RTO로 신속하게 복구할 수 있습니다.
추천 서비스 및 솔루션
Broadridge
“Broadridge에는 중단돼서는 안 되는 중요한 시스템이 있습니다. 저희는 복구 시간 목표와 복구 시점 목표가 거의 0에 가까워질 수 있도록 AWS 서비스를 사용하여 '상시 가동' 프로그램을 개발했습니다.”
Todd Peterson, Broadridge Vice President
Ikano Bank
“Ikano Bank에서는 특히 재해 복구 역량 측면에서 클라우드의 이점을 온전히 실현하고자 했지만, 그럴 만한 사내 역량이 없었습니다. AWS Resilience Hub에서 AWS Well-Architected Framework에 기반한 맞춤형 권장 사항을 제시해 구현이 운영 우수성과 신뢰성 모범 사례와 일치하도록 해주었습니다. 저희는 금융 기관이기 때문에 시스템에 복원성이 기본 내장되어 있다는 사실에 안심이 됩니다.”
Carl Lundquist, Ikano Bank Head of IT Operations and Services
Ally Financial
“AWS를 사용하면 민첩하고 복원력과 안정성이 뛰어난 내결함성 시스템을 신속하게 제공할 수 있으므로 고객에게 치명적인 장애 지점이 발생하는 것을 거의 0에 가깝게 방지할 수 있습니다. AWS와의 협업은 혁신의 한계를 넓히고 규제가 심한 산업인 금융 서비스의 제공 범위를 넓히는 데 큰 도움이 되었습니다. 이는 지속적인 혁신은 물론, 고객에게 계속해서 완전히 새로운 제품을 제공하는 데 도움이 되며, AWS가 우리에게 하는 것처럼 고객의 요구 사항에 집중하고 이를 최우선 순위에 두는 데 도움이 됩니다.”
Sada Rajagopalan, Senior Director Lead Cloud Engineering, Ally Financial
주요 내용
복원력 수명 주기 프레임워크
복원력 개선을 위한 지속적인 접근
애플리케이션의 복원력 상태를 개선하는 것은 일회성에 그치는 게 아니라, 애플리케이션을 구축하고 운영하는 방식에 통합해야 하는 지속적인 프로세스입니다. 이 백서에서는 조직의 지속적인 복원력 촉진에 사용할 수 있는 전략, 서비스, 메커니즘을 공유합니다.