재해 복구란 무엇인가요?

재해 복구는 조직이 기술 관련 재해를 예측하고 해결하는 과정입니다. 정전, 자연 재해, 보안 문제 등 워크로드나 시스템이 기본 배포 위치에서 비즈니스 목표를 달성하지 못하게 하는 모든 이벤트에 대비하고 복구하는 프로세스입니다. 재해 복구 목표는 Recovery Point Objective(RPO) 및 Recovery Time Objective(RTO)로 측정됩니다. 재해 복구로 처리되는 장애는 고가용성으로 처리되는 장애보다 드문 경향이 있으며 대규모 재해 이벤트입니다. 재해 복구는 이런 상황에서 빠르게 복구하기 위한 조직의 절차 및 정책을 포함합니다.

재해 복구가 중요한 이유는 무엇인가요?

재해는 IT 시스템의 속도 저하, 중단 또는 네트워크 중단으로 인해 발생하는 예기치 못한 문제입니다. 중단은 다음과 같이 여러 형태로 나타납니다.

  • 지진 또는 화재
  • 기술 장애
  • 시스템 비호환성
  • 인간의 단순한 실수 
  • 타사의 고의적인 무단 액세스

이러한 재해로 인해 비즈니스 운영이 중단되고, 고객 서비스 문제가 발생하며, 매출 손실을 초래할 수 있습니다. 재해 복구 계획은 조직이 중단 이벤트에 신속하게 대응하도록 하며 다음과 같은 주요 이점을 제공합니다.

비즈니스 연속성 보장

재해가 발생하면 모든 측면에서 비즈니스에 해가 될 수 있으며 종종 비용이 많이 듭니다. 또한 작업에 필요한 도구에 대한 액세스가 제한되어 팀의 생산성을 저하시켜 정상적인 비즈니스 운영이 중단됩니다. 재해 복구 계획은 백업 시스템 및 데이터를 신속하게 다시 시작하여 예약된 대로 운영을 계속할 수 있도록 합니다. 

시스템 보안 개선

데이터 보호, 백업, 복원 절차를 재해 복구 계획에 통합하면 랜섬웨어, 멀웨어 또는 다른 보안 위험이 비즈니스에 미치는 영향이 제한됩니다. 예를 들어, 클라우드로의 데이터 백업에는 비즈니스에 영향을 주기 전에 의심스러운 활동을 제한하는 다양한 보안 기능이 내장되어 있습니다. 

고객 유지 개선

재해가 발생할 경우 고객은 조직의 보안 관행 및 서비스의 신뢰성에 의문을 제기합니다. 재해가 비즈니스에 영향을 주는 시간이 길어질수록 고객의 불만도 커집니다. 훌륭한 재해 복구 계획은 고객 문의에 대처하도록 직원을 교육해 이러한 위험을 완화합니다. 고객은 비즈니스가 모든 재해에 대처할 준비가 잘 되어 있다는 것을 알게 되면 신뢰를 갖습니다. 

복구 비용 절감

재해는 그 심각성에 따라 매출 및 생산성 모두에서 손실을 초래합니다. 강력한 재해 복구 계획은 인시던트 발생 후 바로 시스템을 정상으로 돌려놓아 불필요한 손실을 방지합니다. 예를 들어 클라우드 스토리지 솔루션은 비용 효율적인 데이터 백업 방법입니다. 비즈니스가 정상 운영되는 동안 데이터를 관리, 모니터링, 유지 관리할 수 있습니다. 

재해 복구는 어떻게 작동하나요?

재해 복구는 중단 발생 후 몇 분 이내에 애플리케이션을 재가동하는 데 중점을 둡니다. 조직에서는 다음의 3가지 구성 요소를 다룹니다.

예방

기술 관련 재해 발생 가능성을 줄이려면 비즈니스는 모든 주요 시스템이 최대한 안정적이고 안전하도록 보장하는 계획이 필요합니다. 인간은 자연 재해를 통제할 수 없기 때문에 예방은 네트워크 문제, 보안 위험, 인간의 실수에만 적용됩니다. 적절한 도구 및 기술을 설정해 재해를 예방해야 합니다. 예를 들어 모든 새 구성 파일을 적용하기 전에 자동으로 검사하는 시스템 테스트 소프트웨어를 통해 구성 오류 및 장애를 예방할 수 있습니다. 

예측

예측에는 미래에 발생 가능한 재해를 예상하고, 결과를 파악하고, 적절한 재해 복구 절차를 계획하는 것이 포함됩니다. 무슨 일이 발생할지 예측하는 것은 어렵지만 이전 상황과 분석으로부터 얻은 지식을 바탕으로 재해 복구 솔루션을 찾아낼 수 있습니다. 예를 들어, 미래에 발생할 수 있는 온프레미스 디바이스의 하드웨어 장애를 예측하여 중요한 모든 비즈니스 데이터를 클라우드에 백업하는 것은 데이터 관리에 대한 실용적인 접근 방식입니다.

완화

완화란 재해 시나리오가 발생한 후 비즈니스가 대응하는 방법입니다. 완화 전략은 정상적인 비즈니스 절차에 미치는 부정적인 영향을 줄이는 것을 목표로 합니다. 모든 주요 이해 관계자는 다음 단계를 포함하여 재해 발생 시 해야 할 일을 숙지합니다.

  • 설명서 업데이트
  • 정기적인 재해 복구 테스트 수행
  • 중단 발생 시 수동 운영 절차 식별
  • 재해 복구 전략을 해당 인력과 조율

재해 복구 계획의 핵심 요소는 무엇인가요?

효과적인 재해 복구 계획에는 다음 핵심 요소가 포함됩니다. 

내부 및 외부 의사소통

재해 복구 계획의 생성, 구현, 관리를 담당하는 팀은 반드시 각자의 역할 및 책임에 대해 서로 의사소통해야 합니다. 재해가 발생한 경우 해당 팀은 누가 무엇을 담당하는지 알고 있어야 하며 직원, 고객 및 서로와의 의사소통하는 방법을 알고 있어야 합니다. 

복구 타임라인

재해 복구 팀은 재해 발생 후 시스템이 정상 운영되도록 복구하기까지 걸리는 시간의 목표 및 기간을 정해야 합니다. 어떤 산업의 타임라인은 다른 곳보다 더 길 수도 있지만, 몇 분 이내에 정상적으로 복구되어야 하는 산업도 있습니다. 

타임라인은 다음의 2가지 목표를 다뤄야 합니다.

복구 시간 목표

Recovery Time Objective(RTO)는 재해 복구를 완료할 때까지의 최대 시간을 결정하는 지표입니다. RTO는 영향을 받는 IT 인프라 및 시스템에 따라 달라질 수 있습니다.

복구 시점 목표

Recovery Point Objective(RPO)는 재해 발생 후 데이터 손실에 대해 허용되는 최대 시간입니다. 예를 들어, RPO가 몇 분 또는 몇 시간인 경우 하루가 끝날 때 한 번만 백업하는 것이 아니라 미러 사이트에 데이터를 지속적으로 백업해야 합니다.

데이터 백업

재해 복구 계획은 데이터를 백업하는 방법을 결정합니다. 옵션에는 클라우드 스토리지, 공급업체 지원 백업, 내부 오프사이트 데이터 백업이 포함됩니다. 자연 재해 발생을 고려하면 백업은 온사이트에 있어서는 안 됩니다. 팀은 누가 데이터를 백업할 것인지, 어떤 정보를 백업할 것인지, 시스템을 어떻게 구현할 것인지 결정해야 합니다.

테스트 및 최적화 

재해 복구 계획은 매년 한두 번 이상 테스트해야 합니다. 이러한 테스트에서 식별한 격차를 문서화하고 수정할 수 있습니다. 마찬가지로, 우발적인 무단 액세스를 방지하기 위해 모든 보안 및 데이터 보호 전략을 자주 업데이트해야 합니다.

재해 복구 팀을 생성하는 방법은 무엇인가요?

재해 복구 팀에는 IT 전문가 및 리더십 역할 담당자와 같은 전문가로 이루어진 협업 팀이 포함되어 있으며, 이들은 팀에서 매우 중요합니다. 팀에는 다음과 같은 핵심 영역을 맡을 사람이 있어야 합니다.

위기 관리

위기 관리 담당자는 재해 복구 계획을 즉시 구현합니다. 다른 팀원 및 고객과 의사소통하여 재해 복구 프로세스를 조율합니다. 

비즈니스 연속성

비즈니스 연속성 관리자는 재해 복구 계획이 비즈니스 영향 분석 결과와 일치하도록 보장합니다. 재해 복구 전략에 비즈니스 연속성 계획을 포함합니다. 

영향 복구 및 평가

영향 평가 관리자는 IT 인프라 및 비즈니스 애플리케이션의 전문가입니다. 네트워크 인프라, 서버, 데이터베이스를 평가하고 수정합니다. 또한 다음 예와 같은 기타 재해 복구 태스크도 관리합니다.

  • 애플리케이션 통합
  • 데이터 일관성 유지 관리
  • 애플리케이션 설정 및 구성

가장 좋은 재해 복구 방법은 무엇인가요?

재해 복구를 계획할 때, 비즈니스는 다음 방법 중 하나 또는 여러 항목을 구현합니다.

백업

데이터 백업은 모든 비즈니스가 구현하는 가장 쉬운 재해 복구 방법 중 하나입니다. 중요한 데이터를 백업하려면 데이터를 오프사이트, 클라우드 또는 이동식 드라이브에 저장해야 합니다. 데이터를 최신 상태로 유지하려면 자주 백업해야 합니다. 예를 들어 AWS에 백업함으로써, 비즈니스는 모든 데이터 유형을 보호하는 유연하고 확장 가능한 인프라를 확보합니다. 

데이터 센터 재해 복구

특정 유형의 자연 재해 발생 시 적절한 장비를 통해 데이터 센터를 보호하여 신속한 재해 복구에 기여할 수 있습니다. 예를 들어, 화재 진압 도구는 장비 및 데이터가 화재에서도 무사하도록 하며, 백업 전원은 정전 시에 비즈니스 연속성을 지원합니다. 마찬가지로, AWS 데이터 센터는 인간에 의한 위험 및 자연적 위험으로부터 보호하는 혁신적인 시스템을 지녔습니다.

가상화 

비즈니스는 물리적 재해에 영향을 받지 않는 오프사이트 가상 머신(VM)을 이용하여 데이터 및 운영을 백업합니다. 가상화를 재해 복구 계획의 일부로 사용하여 비즈니스는 일부 프로세스를 자동화하여 자연 재해로부터 더 빠르게 복구합니다. 효과적인 가상화를 위해서는 반드시 데이터 및 워크로드를 Amazon Elastic Compute Cloud(Amazon EC2)와 같은 VM에 지속적으로 전송해야 합니다. 

서비스형 재해 복구

AWS Elastic Disaster Recovery와 같은 재해 복구 서비스는 재해 발생 시 기업의 컴퓨터 처리 및 중요한 비즈니스 운영을 자체 클라우드 서비스로 이전할 수 있습니다. 따라서 온프레미스 서버가 가동 중지되더라도 제공업체의 위치에서 정상적인 운영을 계속할 수 있습니다. 또한 Elastic Disaster Recovery는 클라우드의 리전이 가동 중지되지 않도록 보호합니다. 

콜드 사이트

자연 재해 발생 시 기업은 거의 사용되지 않는 다른 물리적 위치(콜드 사이트)로 운영을 이전합니다. 이러한 방법으로 직원들의 작업 장소가 확보되어 비즈니스 기능이 정상적으로 지속될 수 있습니다. 이 재해 복구 유형은 중요한 데이터를 보호하거나 복구하지 않으므로 다른 재해 복구 방법과 병행되어야 합니다.    

AWS는 재해 복구에 어떤 도움을 줄 수 있나요?

Elastic Disaster Recovery는 온프레미스 및 클라우드 기반 애플리케이션에서 신속하고 신뢰할 수 있는 복구를 통해 가동 중지 및 데이터 손실을 줄이는 재해 복구 서비스입니다. RPO를 몇 초로, RTO를 단 몇 분으로 단축할 수 있습니다. 소프트웨어 문제 또는 데이터 센터 하드웨어 장애와 같이 예기치 않은 이벤트 이후에 운영을 빠르게 복구할 수 있습니다. 또한 유연한 솔루션이기 때문에 전문 기술 없이도 복제 서버를 추가하거나 제거하고 다양한 애플리케이션을 테스트할 수 있습니다.

Elastic Disaster Recovery에는 다음과 같은 이점이 있습니다.

  • 유휴 복구 사이트 리소스를 제거하여 비용을 절약하고 필요한 경우에만 전체 재해 복구 사이트에 대해 지불합니다.
  • AWS에서 기본적으로 실행하도록 클라우드 기반 애플리케이션을 변환합니다.
  • 보안 인시던트 발생 시 애플리케이션을 몇 분 만에 가장 최신 상태 또는 이전 특정 시점으로 복구합니다.

지금 AWS 계정을 생성하여 AWS에서 재해 복구를 시작하세요. 

AWS의 다음 단계

무료 계정 가입

AWS 프리 티어에 즉시 액세스할 수 있습니다. 

가입 
콘솔에서 구축 시작하기

AWS 관리 콘솔에서 구축을 시작하세요.

로그인