Amazon.com은 세계 최대의 온라인 소매점입니다. 2011년 Amazon.com은 자사에서 사용하는 Oracle 데이터베이스의 대부분을 백업하기 위해 테이프 백업에서 Amazon Simple Storage Service(Amazon S3)로 전환했습니다. 이 전략으로 복잡성과 자본 지출을 줄이고 더 신속한 백업 및 복구 성능을 제공하며 백업 및 보관에 배정된 테이프 용량을 없애 관리 직원은 더 가치 있는 작업을 할 수 있게 되었습니다. Amazon.com은 자사의 백업 테이프 인프라를 클라우드 기반 Amazon S3 스토리지로 대체하고 백업 소프트웨어를 없앨 수 있었으며, 일부 시나리오에서는 복구 시간이 15시간에서 2.5시간으로 줄어드는 12배의 성능 향상을 경험했습니다.

Amazon.com의 규모가 증가함에 따라 Oracle 데이터베이스의 규모는 물론 유지해야 하는 데이터베이스의 수 또한 증가했습니다. 이로 인해 기존 Oracle 데이터베이스를 테이프로 백업하는 것과 관련된 문제점이 발생했으며 결국 Amazon.com에서는 자회사인 Amazon Web Services(AWS)의 클라우드 서비스 사용과 같은 대체 전략을 구상하기에 이르렀습니다. Amazon.com이 대면하게 된 비즈니스 관련 문제는 다음과 같습니다.

  • 활용 및 용량 계획은 복잡하며 시간이 많이 들고 자본 지출 예산이 증가합니다. 지난 몇 년간 테이프 하드웨어와 해당 하드웨어의 데이터 센터 공간 및 테이프 소프트웨어에 대한 엔터프라이즈 라이선스 요금으로 막대한 자본 지출이 발생했습니다. 또한, 테이프 인프라를 관리하기 위해 고도로 숙련된 직원이 필요했는데 이 직원은 보다 가치가 높은 프로젝트를 처리하기보다는 설정, 인증 및 엔지니어링 보관 계획에 더 많은 시간을 소요해야 했습니다. 매 회계 연도가 끝날 무렵 이후 용량 요구 사항을 예상할 때도 감사, 예측 및 예산 측정으로 인한 시간 소모가 컸습니다.
  • 여러 테이프 디바이스를 지원하기 위한 백업 소프트웨어 비용이 점점 증가했습니다. 테이프 로봇은 기본적인 읽기/쓰기 기능을 제공하지만 이를 완전히 활용하기 위해서는 전용 테이프 백업 소프트웨어에 투자를 해야 합니다. Amazon.com의 경우 소프트웨어 비용이 높아짐에 따라 전체적인 백업 비용 또한 크게 증가했습니다. 예산을 측정할 때 이 소프트웨어의 비용이 계속하여 문제가 되어 왔지만, 백업을 쓰는 데 테이프 디바이스가 필요한 이상 이를 해결하기란 어려웠습니다.
  • 안정적으로 백업을 유지하고 신속하고 효율적으로 데이터를 검색하기 위해 테이프에 많은 시간과 노력을 쏟아야 합니다. 데이터를 테이프에 지속적으로 저장하려면 사본이 여러 개 필요합니다. 아무런 문제 없이 작동하며 테이프 리소스에 대한 경합이 최소일 경우에는 테이프 로봇과 백업 소프트웨어를 사용해 필요한 데이터를 쉽게 찾을 수 있지만 하드웨어 장애가 발생한 경우에는 반드시 사람의 개입이 있어야만 테이프에서 복원할 수 있습니다. 여러 명의 사용자가 테이프를 요청함에 따라 발생하는 테이프 드라이브의 경합은 복원 프로세스의 속도를 더욱 느리게 하여 완료되기까지 시간이 더 오래 걸리기 때문에 클라우드 스토리지에 백업하는 것에 비해 RTO(복구 목표 시간)를 달성하기가 어렵습니다.

Amazon.com에서는 Amazon S3 백업의 보안, 가용성 및 성능 측면을 고려하여 Amazon S3를 데이터 백업에 사용했을 경우의 경제적, 성능적 개선점에 대한 평가에 착수했으며 Amazon S3로의 마이그레이션이 경제적으로 가치가 있음을 보장하는 비용 편익 분석도 수행했습니다. 비용 편익 분석에는 다음과 같은 요소가 포함되어 있습니다.

  • 성능 이점 및 비용 경쟁력. 백업의 전체 비용이 증가하지 않는다는 점이 중요한 고려 사항이었으며 동시에 Amazon.com에서는 더욱 신속한 백업 및 복구 성능이 필요했습니다. 또한, 테이프를 사용할 때보다 백업 및 복구 작업에 필요한 시간과 노력이 크게 절감된다는 점이 입증되었습니다. Amazon S3에서 실행되는 복원 작업이 테이프에서 실행되는 유사한 복원 작업보다 2배에서 12배 신속하게 완료되었기 때문입니다. Amazon.com에서는 전체 비용을 유지 또는 절감하면서도 성능은 향상할 수 있는 새로운 백업 미디어를 필요로 했습니다. 온 프레미스 디스크 기반 스토리지로의 백업은 성능은 향상되었지만 비용 면에서 경쟁력이 떨어졌습니다. 하지만 Amazon S3 클라우드 기반 스토리지는 두 기준을 모두 충족했습니다.
  • 강력한 지속성 및 가용성. Amazon S3는 연간 99.999999999%의 객체 지속성과 99.99%의 가용성을 제공하도록 설계되었습니다. Amazon.com에서는 기존 테이프 인프라와 Amazon S3의 해당 수치를 비교한 결과, Amazon S3가 확실히 우위에 있음을 확인할 수 있었습니다.
  • 운영 시 충돌 감소. Amazon.com의 DBA는 Amazon S3 백업을 기존 데이터베이스 백업과 함께 사용할 수 있는지 평가해야 했습니다. Amazon S3를 백업에 사용한 결과, Oracle RMAN과 원활하게 작동하기 때문에 구현하기도 용이하다는 점을 확인할 수 있었습니다.
  • 강력한 데이터 보안. Amazon.com에서는 AWS가 물리적 보안, 보안 승인, 보안 프로세스, 무선 데이터 보호, 비활성 데이터 및 적절한 암호화 표준 활용 등 모든 요구 사항을 충족한다는 점을 확인했습니다.

아무런 문제 없이 Amazon S3로의 마이그레이션을 완료하고 난 후, Amazon.com은 다음과 같은 혜택을 확인할 수 있었습니다.

  • 복잡하고 시간 소모가 큰 테이프 용량 계획의 필요성 제거. Amazon.com은 해마다 인수가 이루어지기 때문에 역동적으로 그 규모가 커지고 있습니다. Amazon.com에서는 AWS를 사용해 이러한 신속한 확장에 발맞춰 작업을 원활하게 수행할 수 있습니다. 이전에 Amazon.com의 비즈니스 그룹에서는 한 해에 사용할 예정인 테이프 스토리지의 양과 테이프 리소스의 사용 빈도를 미리 예측하여 연간 백업 계획을 작성해야 했습니다. 이러한 계획은 각 조직의 테이프 사용량에 대해 여러 팀으로 비용을 분산하여 청구하는 데 사용되었습니다. 그러나 Amazon S3를 사용하면서부터 팀에서 사용한 양에 대해서만 청구되었으며 그에 따른 비용을 지불하는 간편한 방식으로 바뀌었습니다. 실질적으로 Amazon S3에 저장할 수 있는 데이터의 양에 제한이 없기 때문에 리소스 고갈에 대한 걱정은 하지 않아도 됩니다. Amazon S3 백업을 채택한 팀에서는 형식적인 계획에 대한 필요성이 거의 제거되었습니다.
  • 자본 지출 절감. Amazon.com에서는 테이프 로봇, 테이프 드라이브, 테이프 인벤토리, 데이터 센터 공간, 네트워크 장비, 엔터프라이즈 백업 소프트웨어는 물론 이후 테이프 사용에 대한 예측이 필요하지 않게 되었습니다. 이로 인해 자본 설비를 미리 구축하는 데 드는 예산 및 자본 지출에 대한 관리 부담이 제거됩니다.
  • 복원 시 데이터를 즉각적으로 사용할 수 있어 물리적 테이프를 찾거나 검색할 필요성이 없어짐. DBA는 테이프에서 데이터를 복원하려 할 때마다 지연을 겪습니다. 테이프 백업 소프트웨어는 복원할 올바른 파일과 올바른 테이프의 위치를 찾고, 해당 테이프를 마운트하여 데이터를 읽기 위해 테이프 카탈로그를 읽어야 합니다. 데이터는 여러 테이프에 분산되어 있는 경우가 많기 때문에 지연 시간은 더욱 길어지며 여러 사용자의 테이프 요청으로 인한 테이프 드라이브 경합으로 프로세스는 더욱 느려집니다. 데이터 센터 정전과 같이 수많은 데이터베이스가 가능한 한 신속하게 동시에 복원되어야 하는 경우가 생기면 상황은 더욱 심각해집니다. 그러나 Amazon S3를 사용하면 이러한 문제는 발생하지 않습니다. 대기 또는 테이프 대기 없이 데이터 복원을 즉각적으로 시작할 수 있기 때문에 데이터베이스 또한 신속하게 복구할 수 있습니다.
  • Amazon S3에 데이터 백업 시 테이프 드라이브 백업보다 2배~12배 신속하게 완료 가능. 예를 하나 들자면, 검증 시험에서 DBA는 기가비트 이더넷을 통해 3.8TB의 데이터를 2.5시간 만에 복원할 수 있었습니다. 이는 분당 25GB 또는 초당 422MB의 데이터를 복원했다는 것을 의미합니다. 이뿐만 아니라 Amazon.com에서 RMAN 데이터 압축을 사용한 이후로 유효 복원율은 초당 3.37GB에 달하게 되었습니다. Amazon S3에서 2.5시간이 소요되는 복원 작업은 테이프에서 복원할 경우 10~15시간이 소요됩니다.
  • Amazon S3에 Oracle RMAN 백업 구현이 용이함. DBA는 Amazon S3에 기존 데이터베이스의 백업을 쉽게 시작할 수 있었습니다. Oracle RMAN 백업을 Amazon S3로 보내려면 Oracle Secure Backup Cloud(SBC) 모듈을 구성하기만 하면 됩니다. Oracle SBC 모듈의 구성에는 데이터베이스당 1시간 미만이 소요됩니다. 이렇게 설정을 한 번 한 후에는 Amazon S3로 데이터베이스 백업이 투명하게 리디렉션됩니다.
  • Amazon S3의 데이터 스토리지는 99.999999999%의 지속성을 제공하도록 설계되었습니다. Amazon.com에서 테이프 인프라를 사용할 때는 테이프 고장, 테이프 드라이브 장애 및 로봇 구성 요소의 장애와 같은 하드웨어 장애를 겪기도 했습니다. DBA가 데이터베이스를 복원하려 할 때 이런 경우가 발생하기도 했는데, 이렇게 되면 MTTR(평균 복구 시간)이 급격히 증가합니다. 그러나 이제는 Amazon S3의 지속성과 가용성 덕분에 더는 이러한 문제를 걱정하지 않아도 됩니다.
  • 인력을 중요한 작업에 투입할 수 있음. 테이프 인프라를 사용하는 동안 Amazon.com은 매우 큰 규모의 백업 설비를 잘 다룰 수 있는 숙련된 엔지니어를 찾아야 했습니다. 하지만 공급업체별 전문 기술에 익숙한 인력을 찾기란 어려운 일이었습니다. 이뿐만 아니라 드라이브 교체, 테이프 정리 및 이동, 추적 등 하드웨어 문제 해결을 전담할 데이터 센터 기술자도 고용해야 했습니다. Amazon S3는 일상적인 작업을 대신하여 처리해 주기 때문에 전문가는 보다 중요하고 비즈니스에 중요한 엔지니어링 작업에 더욱 집중할 수 있습니다.
  • 물리적 테이프를 외부 위치로 이동할 필요성 제거. Oracle 백업 데이터를 외부에 저장하는 모든 기업은 외부 테이프의 이동, 보존 및 보관과 관련한 비용을 면밀히 따져 보아야 합니다. Amazon S3에 데이터를 보관하면 이러한 비용을 절감하거나 잠재적으로 배제할 수도 있습니다.

세계 최대의 온라인 소매점인 Amazon.com은 고객 경험을 개선하고 고객에게 가능한 한 가장 낮은 가격으로 제품을 제공하기 위해 혁신을 계속하고 있습니다. 이러한 노력의 일환으로 데이터베이스 백업에 테이프를 사용하는 대신 Amazon S3 스토리지로 대체했습니다. 이는 Oracle 데이터베이스를 테이프로 백업하는 다른 조직에서도 쉽게 모방할 수 있는 혁신적인 방법입니다.

AWS에서의 백업 및 스토리지에 대해 자세히 알아보려면 http://aws.amazon.com/backup-storage/를 방문하십시오.