Amazon Redshift Spectrum을 사용하면 Amazon S3에 있는 엑사바이트 규모의 데이터에 Amazon Redshift SQL 쿼리를 수행할 수 있습니다. Redshift Spectrum에서는 데이터를 로드하거나 변환할 필요 없이 데이터 웨어하우스의 로컬 디스크에 저장된 데이터를 넘어 Amazon S3 "데이터 레이크"에 저장된 방대한 비정형 데이터를 쿼리할 수 있도록 Amazon Redshift의 분석 역량을 확장할 수 있습니다. Redshift Spectrum은 정교한 쿼리 최적화 기능을 적용하여 수천 개의 노드로 처리를 확장하므로, 대규모 데이터 세트와 복잡한 쿼리에서도 빠른 결과를 얻을 수 있습니다.

Redshift Spectrum은 Avro, CSV, Grok, ORC, Parquet, RCFile, RegexSerDe, SequenceFile, TextFile 및 TSV를 비롯하여 기존에 사용하고 있는 오픈 데이터 형식을 사용해 Amazon S3에 있는 데이터를 직접 쿼리합니다. Redshift Spectrum에서 Amazon Redshift에서와 동일한 SQL 구문을 지원하므로, 지금 사용하는 것과 같은 비즈니스 인텔리전스(BI) 도구를 사용하여 정교한 쿼리를 실행할 수 있습니다. 또한, Amazon Redshift에 로컬로 저장된 자주 액세스하는 데이터와 Amazon S3에 저장된 비용 효율적인 전체 데이터 세트 모두에 대해 쿼리를 실행할 수 있습니다.

Redshift Spectrum은 원하는 장소에 원하는 형식으로 데이터를 저장하고 필요할 때 이를 처리할 수 있는 자유를 제공합니다. Redshift Spectrum에는 선결제 금액이나 사전 약정이 없으며 실행한 쿼리에 대해서만 비용을 지불하면 됩니다.

쿼리를 시작할 준비가 되셨습니까?

Amazon Redshift 시작

개념 증명이 필요하십니까?

개념 증명 또는 평가를 위한 지원 요청 >>
Dory_Feature_Start_Querying_Instantly

Amazon Redshift Spectrum에서는 로딩이나 변환을 할 필요 없이 즉시 Amazon S3에 있는 데이터를 쿼리하기 시작할 수 있습니다. Amazon Athena, AWS Glue 데이터 카탈로그 또는 Hive Metastore를 외부 스키마로 등록하기만 하면 됩니다. 현재 Amazon Redshift 테이블을 쿼리하는 데 사용하는 것과 같은 SQL과 Redshift를 지원하는 모든 BI 도구를 사용할 수 있습니다.

Dory_Feature_Fast_Performance

Amazon Redshift는 Amazon S3에 있는 대규모 비정형 데이터 세트에 대해 임시 분석을 수행하든 Redshift 테이블에 있는 정형 데이터에 대한 분석을 자주 수행하든 아주 빠른 성능을 제공합니다. Amazon Redshift 클러스터에 핫 데이터를 유지하여 로컬 디스크의 성능을 확보하고, Amazon Redshift Spectrum을 사용하여 쿼리를 Amazon S3에 저장된 콜드 데이터까지 확장함으로써 무제한의 확장성과 저렴한 비용을 확보할 수 있습니다. Amazon Redshift 쿼리 최적화 프로그램은 Amazon S3에서 스캔되는 데이터와 쿼리에 사용되는 Redshift Spectrum 노드 수를 최소화하는 방법을 자동으로 결정합니다.

Dory_Feature_Scalable

Amazon Redshift Spectrum에서는 클러스터 확장에 대해 걱정할 필요가 없습니다. 스토리지와 컴퓨팅을 분리할 수 있으므로 개별적으로 확장이 가능합니다. 같은 Amazon S3 데이터 레이크에 대해 여러 Amazon Redshift 클러스터를 실행할 수도 있으므로 무제한으로 동시성을 지원할 수 있습니다. Redshift Spectrum은 필요에 따라 수천 개의 인스턴스로 자동으로 확장되므로 테라바이트, 페타바이트 또는 엑사바이트를 처리하더라도 쿼리가 신속하게 실행됩니다.

Dory_Feature_Pay_per_query

Amazon Redshift Spectrum에서는 실행한 쿼리에 대한 비용만 지불합니다. 쿼리를 실행하기 위해 처리된 데이터 1테라바이트당 5 USD가 부과됩니다. Redshift Spectrum은 압축된 데이터를 쿼리할 수 있습니다. 데이터를 열 형식으로 압축, 파티셔닝 및 변환함으로써 쿼리당 30%에서 90%까지 비용을 절약하고 성능을 개선할 수 있습니다. 쿼리를 실행하지 않을 때는 Redshift Spectrum에 대한 비용이 부과되지 않습니다. 데이터 스토리지에 대해서는 표준 Amazon S3 요금을 그리고 사용된 클러스터에 대해서는 Amazon Redshift 인스턴스 요금을 지불합니다.