Amazon Web Services 한국 블로그

Amazon S3 Glacier 출시 10주년 – 클라우드에서의 아카이빙 스토리지 10년의 여정

10년 전인 2012년 8월 20일, AWS는 데이터 아카이브 및 백업을 위해 설계된 안전하고 신뢰할 수 있으며 매우 저렴한 스토리지인 Amazon Glacier의 정식 출시를 발표했습니다. 당시 AWS 고객으로 일하던 저로서는, 매우 저렴한 비용으로 대량의 데이터를 아카이브할 수 있는 장기적이고 안전하며 내구성이 뛰어난 클라우드 스토리지를 제공한다는 건 만우절의 농담처럼 느껴졌습니다.

이번 출시에 대해 Jeff는 자신의 원래 블로그 게시물에서 다음과 같이 언급했습니다.

Glacier는 매월 기가바이트당 0.01 USD(1페니, 100분의 1달러)의 저렴한 비용으로 매우 저렴한 아카이브 스토리지를 제공합니다. 저장은 소량 또는 대량(테라바이트, 페타바이트 등)으로 할 수 있습니다. 선결제 금액은 없으며 사용한 스토리지에 대해서만 비용을 지불하면 됩니다. 용량 계획에 대해 걱정할 필요가 없으며 스토리지 공간이 부족할 일이 없습니다.

10년 후, Amazon S3 Glacier는 아카이브 데이터를 저장할 수 있는 세계 최고의 장소로 발전했습니다. Amazon S3 Glacier 스토리지 클래스는 데이터 아카이빙을 위해 특별히 제작되어 클라우드에서 최고의 성능, 최고의 검색 유연성 및 최저 비용의 아카이브 스토리지를 제공합니다.

이제 서로 다른 액세스 패턴과 스토리지 기간에 최적화된 세 가지 아카이브 스토리지 클래스(Amazon S3 Glacier Instant Retrieval, Amazon S3 Glacier Flexible Retrieval(Amazon S3 Glacier 후속), Amazon S3 Glacier Deep Archive) 중에서 선택할 수 있습니다. 각 스토리지 클래스에 대해 좀 더 자세히 살펴보겠습니다.

Amazon S3 Glacier에서의 10년간의 혁신
우리가 어떻게 여기에 도달했는지 이해하기 위해 지난 10년을 살펴보고 아카이브 스토리지를 근본적으로 바꾼 가장 중요한 Amazon S3 Glacier 출시 몇 가지를 다시 살펴볼 것입니다.

2012년 8월 – Amazon Glacier: 매월 1GB당 1페니로 사용하는 아카이브 스토리지
원하는 양의 데이터를 높은 내구성과 저렴한 비용으로 저장할 수 있으므로 테이프 라이브러리는 물론 수십 년 동안 데이터 아카이빙의 일부였던 모든 운영 복잡성 및 오버헤드를 제거할 수 있는 Amazon Glacier를 출시했습니다. Amazon Glacier는 S3의 내구성과 신뢰성을 기반으로 모델링되었지만 처음부터 매우 저렴한 비용으로 아카이브 스토리지를 제공하도록 설계 및 구축되었습니다. 당시 Glacier는 아카이브 데이터를 저장하기 위한 ‘볼트(vault)’라는 개념을 도입했습니다. 요청을 시작하여 아카이브 데이터를 쉽게 검색한 다음 3~5시간 내에 데이터를 다운로드할 수 있게 되었습니다.

2012년 11월 – Amazon S3 데이터를 Glacier에 아카이브
Glacier는 처음부터 아카이브 데이터를 위해 특별히 제작되었지만 많은 고객은 S3의 적당히 자주 사용되는 스토리지에서 가져온 객체 데이터를 가지고 있었기 때문에 결국에는 자주 사용되지 않는 스토리지로 이동하는 것이 필요했습니다. 고객이 쉽게 사용할 수 있도록 Amazon S3의 수명 주기 관리(수명 주기 규칙이라고도 함)는 S3와 Glacier를 통합하고 각 객체의 스토리지 클래스를 통해 세부 정보를 볼 수 있도록 했습니다. 수명 주기 관리에서는 전환(S3 스토리지 클래스를 Glacier로 변경) 및 만료(객체 삭제)를 시작할 수 있는 시간 기반 규칙을 정의할 수 있습니다. 2014년에는 S3 버전 지정 객체의 유연성을 Glacier와 결합하여 전체 스토리지 비용을 더욱 절감할 수 있도록 지원했습니다.

2016년 11월 – Glacier 요금 인하 및 Glacier에 대한 추가 검색 옵션
비용 절감을 통해 그 절감 혜택을 고객에게 전달하려는 AWS의 장기적인 노력의 일환으로 미국 동부(버지니아 북부) 리전의 경우 매월 1GB당 Glacier 스토리지 요금을 2015년의 0.007 USD(2012년에는 0.010 USD)에서 0.004 USD(1센트의 절반 미만)로 인하했습니다. 매우 저렴한 비용으로 데이터를 저장하면서도 데이터 검색 속도를 유연하게 조정할 수 있도록 Glacier에 저장한 데이터 양과 데이터 검색 속도에 따라 두 가지 데이터 검색 옵션을 추가로 도입했습니다. 빠른 검색(일반적으로 1~5분 소요), 대량 검색(5~12시간) 또는 기존 표준 검색 방법(3~5시간)을 선택할 수 있습니다.

2018년 11월 – Amazon S3 Glacier 스토리지 클래스에서 S3 기능 사용 가능
Glacier 고객은 S3 수명 주기 관리를 통해 데이터를 S3에서 Glacier로 쉽게 이동할 수 있다는 점을 높이 평가했으며, 이 기능에 더하여 가장 일반적인 S3 API를 사용하여 S3 Glacier 객체에서 직접 작업할 수 있는 기능을 원했습니다. 이에 따라 표준 S3 PUT API를 사용하여 S3 Glacier 등의 모든 스토리지 클래스를 선택해서 데이터를 저장할 수 있는 S3 PUT API가 S3 Glacier에 추가되었습니다. 데이터를 S3 Glacier에 직접 저장할 수 있으므로 S3 Standard에 업로드할 필요가 없고 제로 데이 수명 주기 정책을 통해 즉시 S3 Glacier로 전환할 수 있습니다. 따라서 다른 S3 스토리지 클래스와 마찬가지로 S3 Glacier에 PUT을 적용할 수 있습니다.

2019년 3월 – Amazon S3 Glacier Deep Archive – 클라우드에서 가장 저렴한 스토리지
원래의 Glacier 서비스도 아카이브 스토리지에 대해 매우 저렴한 요금을 제공했지만, 우리는 사용 빈도가 매우 적은 데이터에 대해 훨씬 저렴한 스토리지 오퍼링을 제시할 방법을 모색했습니다. Amazon S3 Glacier Deep Archive 스토리지 클래스는 1년에 한 번 미만으로 액세스되고 비동기적으로 검색되는 장기 저장 아카이브 데이터에 대해 S3 Glacier Flexible Retrieval에 비해 최대 75% 저렴한 비용으로 가장 저렴한 스토리지를 제공합니다. S3 Glacier Deep Archive는 온프레미스 테이프에 데이터를 저장 및 유지 관리하거나 오프사이트에 데이터를 아카이브하는 것보다 훨씬 저렴한 요금인 매월 GB당 0.00099 USD(또는 매월 TB당 1 USD)로 클라우드에서 가장 저렴한 스토리지를 제공합니다.

2020년 11월 – Amazon S3 Intelligent Tiering에 Archive Access 및 Deep Archive Access 계층 추가
2018년 11월에 출시된 Amazon S3 Intelligent Tiering은 데이터 액세스 패턴이 변경될 때 성능 영향 또는 운영 오버헤드 없이 자동으로 스토리지 비용을 최대 95%까지 절감할 수 있는 유일한 클라우드 스토리지 클래스입니다. 고객에게 S3 Intelligent-Tiering의 단순함과 유연성 및 아카이브 데이터의 저렴한 스토리지 비용을 제공하기 위해 S3 Glacier 스토리지 클래스와 동일한 성능 및 요금을 제공하는 Archive Access 계층과, S3 Glacier Deep Archive 스토리지 클래스와 동일한 성능 및 요금을 제공하는 Deep Archive Access 계층을 추가했습니다.

2021년 11월 – Amazon S3 Glacier Flexible Retrieval 및 S3 Glacier Instant Retrieval
Amazon S3 Glacier 스토리지 클래스는 Amazon S3 Glacier Flexible Retrieval로 이름이 변경되었으며 이제 무료 대량 검색과 함께 모든 리전에서 10%의 추가 요금 인하가 포함되어 백업 및 재해 복구와 같은 사용 사례에 최적화되었습니다.

또한 고객은 Glacier의 저렴한 비용과 더불어 데이터가 매우 신속하게 필요할 때 빠르게 액세스할 수 있는 스토리지 솔루션을 요청했습니다. 그래서 거의 액세스되지 않고 밀리초 단위의 검색이 필요한 장기 저장 데이터에 대해 가장 저렴한 스토리지를 제공하는 새로운 아카이브 스토리지 클래스인 Amazon S3 Glacier Instant Retrieval을 도입했습니다. 분기당 한 번 데이터에 액세스하는 경우 S3 Standard-Infrequent Access(S3 Standard-IA) 스토리지 클래스를 사용하는 것에 비해 스토리지 비용을 최대 68%까지 절약할 수 있습니다.

또한 Amazon S3 Intelligent Tiering 스토리지 클래스는 최근에 S3 Glacier Instant Retrieval 스토리지 클래스와 동일한 성능 및 요금을 제공하는 새로운 Archive Instant Access 계층을 추가했습니다. 이 계층은 장기 저장 데이터에 S3 Intelligent Tiering를 사용하는 고객에게 자동으로 68%의 비용 절감 효과를 제공합니다.

과거와 현재
모든 산업과 업종의 고객이 상상할 수 있는 모든 아카이브 워크로드에 S3 Glacier 스토리지 클래스를 사용합니다. S3 API 및 S3 콘솔을 통해 S3 Glacier 스토리지 클래스를 액세스 및 사용하면 데이터 관리 및 비용 최적화를 위한 향상된 기능이 제공됩니다.

위에서 설명한 것처럼 이제 서로 다른 액세스 패턴과 스토리지 기간에 최적화된 세 가지 아카이브 스토리지 클래스 중에서 선택할 수 있습니다.

  • S3 Glacier Instant Retrieval – 의료 이미지, 뉴스 미디어 자산 또는 유전체학 데이터와 같이 즉각적인 액세스가 필요한 아카이브 데이터의 경우 밀리초 검색과 함께 가장 저렴한 스토리지를 제공하는 아카이브 스토리지 클래스인 S3 Glacier Instant Retrieval 스토리지 클래스를 선택합니다.
  • S3 Glacier Flexible Retrieval – 즉각적인 액세스는 필요하지 않지만 백업 또는 재해 복구 사용 사례와 같이 대량의 데이터 세트를 무료로 검색할 수 있는 유연성이 필요한 아카이브 데이터의 경우 몇 분 안에 검색 또는 12시간 내에 무료 대량 검색이 가능한 S3 Glacier Flexible Retrieval 스토리지 클래스를 선택합니다.
  • S3 Glacier Deep Archive – 금융 서비스, 의료, 미디어 및 엔터테인먼트, 공공 부문과 같은 고객의 요구 사항과 규정 준수 요구 사항을 충족하기 위해 데이터를 7~10년 이상 보존하려면 12~48시간 내에 데이터를 검색할 수 있는 클라우드에서 가장 저렴한 스토리지인 S3 Glacier Deep Archive 스토리지 클래스를 선택합니다.

S3 Glacier 스토리지 클래스에 대한 개요를 보려면 간략한 소개 비디오를 시청하세요.

모든 S3 Glacier 스토리지 클래스는 객체에 대해 99.999999999%(9가 11개)의 내구성을 제공하도록 설계되었습니다. 데이터는 AWS 리전 내에서 물리적으로 분리된 3개 이상의 가용 영역에 중복으로 저장됩니다. 다음에서 S3 Glacier 스토리지 클래스에 대한 몇 가지 비교를 한 눈에 볼 수 있습니다.

성능 S3 Glacier
Instant Retrieval
S3 Glacier
Flexible Retrieval
S3 Glacier
Deep Archive
가용성 99.9% 99.99% 99.99%
가용성 SLA 99% 99.9% 99.9%
객체당 최소 용량 요금 128KB 40KB 40KB
최소 스토리지 기간 요금 90일 90일 180일
검색 요금 GB당 GB당 GB당
검색 시간 밀리초 긴급(1~5분),
표준(3~5시간),
대량(5~12시간) 무료
표준(12시간 이내),
대량(48시간 이내)

액세스 패턴 변경 시 해당 데이터의 마지막 액세스를 기반으로 자동으로 아카이브하려는 데이터의 경우 S3 Intelligent-Tiering 스토리지 클래스를 선택합니다. 이렇게 하면 액세스 패턴이 변경될 때 가장 비용 효율적인 액세스 계층으로 데이터를 자동으로 이동하여 스토리지 비용을 최적화할 수 있습니다. Archive Instant Access, Archive Access, Deep Archive Access 계층은 각각 S3 Glacier Instant Retrieval, S3 Glacier Flexible Retrieval, S3 Glacier Deep Archive와 동일한 성능을 가집니다. 자세한 내용은 블로그 게시물 Amazon S3 Intelligent Tiering를 사용하여 데이터를 자동으로 아카이브 및 복원을 참조하세요.

S3 Glacier를 시작하려면 블로그 게시물 AWS를 사용한 대량 데이터 세트 아카이빙 모범 사례에서 콜드 데이터 스토리지 패턴을 계획할 때 고려해야 할 주요 고려 사항 및 작업을 참조하세요. 또한 20분 만에 S3 Glacier 스토리지 클래스를 시작하고 S3 콘솔의 S3 Glacier 스토리지 클래스에 데이터를 아카이브하는 데 도움이 되는 실습 자습서를 사용할 수도 있습니다.

Amazon S3 Glacier의 생일을 축하합니다!
지난 2022년 AWS Storage Day 동안 Amazon S3의 부사장 겸 GM인 Kevin Miller는 theCube와의 인터뷰에서 S3 Glacier 10주년과, 많은 고객 사용 사례에서의 혁신 속도에 대해 언급했습니다.

이렇게 데이터가 급증하는 시대에는 아카이빙 전략이 있어야 합니다. 모든 회사, 모든 업종, 모든 산업에서 모든 사람이 아카이브 데이터를 가지고 있습니다. 오래된 회사뿐만 아니라 디지털 네이티브 비즈니스에도 아카이빙이 필요합니다.

Nasdaq, Electronic Arts, NASCAR와 같은 많은 AWS 고객이 백업 및 아카이빙 워크로드에 S3 Glacier 스토리지 클래스를 사용했습니다. 다음은 금융, 미디어, 게임 및 소프트웨어 산업 고객의 AWS 아카이빙 모범 사례를 중심으로 최근에 고객이 작성한 추가 블로그입니다.

전 세계의 모든 S3 Glacier 고객에게 큰 감사를 표합니다! S3 로드맵의 90% 이상이 여러분과 같은 고객의 피드백에서 직접 나온 것입니다. 귀하의 의견과 아이디어는 서비스 개선에 필수적이므로 귀하의 의견을 계속 경청할 것입니다. 당사에 대한 신뢰에 감사드리며 비용 절감, 스토리지 단순화, 민첩성 상승, 혁신 가속화에 도움이 되도록 지도편달해 주셔서 고맙습니다.

Amazon 리더십 원칙 중 하나인 고객 집착에 따라 여러분의 피드백을 언제나 환영합니다! S3 Glacier의 새로운 기능을 보려면 S3 Glacier용 AWS re:Post 또는 평소에 이용하는 AWS Support 연락처를 통해 피드백을 보내주세요.

– Channy