AWS 클라우드
AWS 클라우드
무료 평가판 시작하기

Amazon Redshift는 속도가 빠른 완전관리형 데이터 웨어하우스로, 모든 데이터를 표준 SQL 및 기존 BI(비즈니스 인텔리전스) 도구를 사용하여 간편하고 비용 효율적으로 분석할 수 있게 해줍니다. Amazon Redshift를 사용하면 정교한 쿼리 최적화, 고성능 로컬 디스크의 컬럼 방식 스토리지, 대량 병렬 쿼리 실행 기능을 사용하여 페타바이트 규모의 정형 데이터에 복잡한 분석 쿼리를 실행할 수 있습니다. 대부분 결과가 몇 초 내에 반환됩니다. Amazon Redshift에서는 약정 없이 시간당 0.25 USD의 작은 규모로 시작하여 기존 솔루션 대비 10%도 안 되는 연간 테라바이트당 1,000 USD의 비용에 페타바이트 규모로 확장할 수 있습니다.

또한, Amazon Redshift에는 Redshift Spectrum이 포함되어 있어 Amazon S3에 있는 엑사바이트 규모의 비정형 데이터에 대해 SQL 쿼리를 직접 실행할 수 있습니다. 로드하거나 변환할 필요 없으며, Avro, CSV, Grok, ORC, Parquet, RCFile, RegexSerDe, SequenceFile, TextFile 및 TSV를 비롯한 오픈 데이터 형식을 사용할 수 있습니다. Redshift Spectrum은 검색하는 데이터에 따라 쿼리 컴퓨팅 파워를 자동으로 확장하므로, 데이터 세트의 규모와 관계없이 Amazon S3에 대한 쿼리가 빠르게 실행됩니다. Redshift Spectrum에 대해 자세히 알아보기 »

빠르고 일관된 성능

신속함

Amazon Redshift는 I/O 효율성을 개선하기 위해 컬럼 방식 스토리지 기술을 사용하고 여러 노드에서 쿼리를 병렬로 처리하여 빠른 쿼리 성능을 제공합니다. 데이터 로드 속도는 Amazon S3, Amazon DynamoDB, Amazon EMR, Amazon Kinesis 및 모든 SSH 사용 호스트를 통합하여 클러스터 크기에 따라 선형적으로 증가합니다.

뛰어난 확장성

저렴한 비용

사용한 만큼만 지불하면 됩니다. 기존 데이터 웨어하우스 솔루션 비용의 1/10 수준인 연간 테라바이트당 1,000 USD의 비용으로 모든 데이터에 대해 사용자 수 제한 없이 무제한으로 분석을 수행할 수 있습니다. 대부분 고객의 경우 압축 후에 데이터 크기가 3~4배 감소하므로 압축되지 않은 테라바이트당 연간 250~333 USD로 비용이 낮아집니다.

빠르고 일관된 성능

확장 가능

Redshift Spectrum에서는 Amazon Redshift에서 로컬 디스크에 저장된 페타바이트 규모의 데이터에 대해 쿼리를 실행하는 것과 마찬가지로, 현재 사용하는 SQL 구문 및 BI 도구를 사용하여 손쉽게 Amazon S3에 있는 엑사바이트 규모의 데이터에 대해 쿼리를 실행할 수 있습니다. 고도로 정형화되고 자주 액세스하는 데이터는 Redshift 로컬 디스크에 저장하고, 대규모의 비정형 데이터는 Amazon S3 "데이터 레이크"에 유지하면서 양쪽에서 원활하게 쿼리를 실행할 수 있습니다.

유연성

간편성

Amazon Redshift를 사용하면 데이터 웨어하우스를 관리, 모니터링 및 확장하는 일반적인 관리 작업 대부분을 손쉽게 자동화할 수 있습니다. Amazon Redshift에서 시간이 많이 소비되고 노동 집약적인 작업을 모두 처리함으로써 사용자는 데이터와 비즈니스에 집중할 수 있게 됩니다.

뛰어난 확장성

확장성

성능과 용량에 대한 요구 사항이 변함에 따라 간단한 API 호출이나 콘솔에서 클릭 몇 번으로 클러스터 크기를 손쉽게 확장하거나 축소할 수 있습니다.

유연성

보안

보안 기능이 내장되어 있습니다. 하드웨어 가속 AES-256 및 SSL을 사용하여 저장 데이터 및 전송 데이터를 암호화하고, Amazon VPC를 사용하여 클러스터를 격리하며, AWS Key Management Service(KMS)하드웨어 보안 모듈(HSM)을 사용하여 키를 관리할 수도 있습니다.

이벤트 중심의 프로그래밍

호환성

Amazon Redshift는 표준 SQL을 지원하고 콘솔에서 다운로드할 수 있는 사용자 정의 JDBC 및 ODBC 드라이버를 제공하므로 다양한 종류의 익숙한 SQL 클라이언트를 사용할 수 있습니다. 또한, 표준 PostgreSQL JDBC 및 ODBC 드라이버도 사용할 수 있습니다.

데이터 웨어하우징에 최적화

Amazon Redshift는 다양한 혁신을 통해 100기가바이트부터 엑사바이트에 이르는 규모의 데이터 세트에 대해 매우 뛰어난 쿼리 성능을 제공합니다. 페타바이트 규모의 로컬 데이터의 경우 Amazon Redshift는 컬럼 방식 스토리지, 데이터 압축 및 영역 매핑을 사용하여 쿼리 수행에 필요한 I/O 수를 줄입니다. Amazon Redshift는 대량 병렬 처리(MPP) 데이터 웨어하우스 아키텍처를 사용하므로 SQL 작업을 병렬 처리하고 분산하여 사용 가능한 리소스를 모두 활용할 수 있습니다. 기본 하드웨어는 고성능 데이터 프로세싱을 수행하도록 설계되어 있습니다. CPU와 드라이브 간 처리량을 극대화하기 위해 로컬 연결 스토리지를 사용하고, 노드 간 처리량을 극대화하기 위해 10GigE 메시 네트워크를 사용합니다. Amazon S3에 있는 엑사바이트 규모의 데이터의 경우, Amazon Redshift에서는 쿼리 실행을 자동으로 확장되는 Redshift Spectrum 인스턴스 풀에 위임하며 스캔된 데이터 양을 최소화하는 최적화된 쿼리 플랜을 생성하므로, 데이터 크기와 관계없이 쿼리가 신속하게 실행됩니다.

페타바이트 규모

콘솔에서 클릭 몇 번이나 간단한 API 호출로 손쉽게 데이터 웨어하우스의 노드 수 또는 유형을 변경하고 압축된 사용자 데이터를 페타바이트 규모로 확장할 수 있습니다. 고밀도 스토리지(DS) 노드를 사용하면 매우 저렴한 가격에 하드 디스크 드라이브(HDD)를 사용하는 매우 큰 규모의 데이터 웨어하우스를 생성할 수 있습니다. 고밀도 컴퓨팅(DC) 노드를 사용하면 고속 CPU, 대량의 RAM 및 솔리드 스테이트 디스크(SSD)를 사용하는 매우 높은 성능의 데이터 웨어하우스를 생성할 수 있습니다. Amazon Redshift에서는 새로운 클러스터가 완전히 프로비저닝되고 사용할 준비가 될 때까지 규모를 조정하는 동안 데이터 웨어하우스를 읽기 전용 모드로 계속 쿼리할 수 있습니다.

Amazon S3 "데이터 레이크"를 쿼리

Redshift Spectrum을 사용하면 로딩이나 ETIL 필요 없이 Amazon S3에 있는 엑사바이트 규모의 비정형 데이터에 대해 쿼리를 실행할 수 있습니다. 쿼리를 발행하면, Amazon Redshift SQL 엔드포인트로 전달되고 여기에서 쿼리 플랜을 생성하고 최적화합니다. Amazon Redshift는 로컬에 있는 데이터와 Amazon S3에 있는 데이터가 무엇인지 파악하고, 읽어와야 하는 Amazon S3 데이터 양을 최소화하기 위한 플랜을 생성하고, 공유 리소스 풀의 Amazon Redshift Spectrum 작업자에 Amazon S3에서 데이터를 읽고 처리하도록 요청한 후, 결과를 Amazon Redshift 클러스터로 가져와서 나머지 작업을 처리합니다.

선결제 비용이 없음

프로비저닝한 리소스에 대해서만 지불하면 됩니다. 선결제 비용 및 장기 계약이 없는 온 디맨드 요금을 선택하거나 예약 인스턴스 요금으로 상당히 할인된 요금을 선택할 수 있습니다. 온 디맨드 요금은 160GB DC1.Large 노드에 대해 시간당 0.25 USD 또는 2TB DS2.XLarge 노드에 대해 시간당 0.85 USD에서 시작합니다. 부분 선결제 예약 인스턴스를 사용하면 실질 요금을 DC1.Large 노드에 대해 시간당 0.10 USD(연간 5,500 USD/TB) 또는 DS2.XLarge 노드에 대해 시간당 0.228 USD(연간 999 USD/TB)로 낮출 수 있습니다. Redshift Spectrum 쿼리 요금은 S3에서 스캔된 테라바이트당 5 USD입니다. 자세한 내용은 Amazon Redshift 요금 페이지를 참조하십시오.

내결함성

Amazon Redshift에는 데이터 웨어하우스 클러스터의 안정성을 향상시키는 여러 기능이 있습니다. 클러스터의 노드에 쓰이는 모든 데이터는 해당 클러스터 내의 다른 노드에 자동 복제되며 모든 데이터는 Amazon S3에 계속 백업됩니다. Amazon Redshift는 클러스터 상태를 계속해서 모니터링하고, 실패한 드라이브의 데이터를 자동으로 다시 복제하며, 필요에 따라 노드를 교체합니다.

자동 백업

Amazon Redshift는 새로운 데이터를 Amazon S3로 계속해서 자동 백업하고, 1일에서 최대 35일까지 사용자가 정의한 기간 동안 스냅샷을 저장합니다. 사용자는 언제든 자체 스냅샷을 생성할 수 있고 생성된 스냅샷은 명시적으로 이를 삭제할 때까지 보관됩니다. 또한, Amazon Redshift는 재해 복구를 위해 스냅샷을 다른 리전의 S3에 비동기적으로 복제할 수 있습니다. 클러스터를 삭제하면 시스템 스냅샷은 삭제되지만, 사용자 스냅샷은 이를 명시적으로 삭제할 때까지는 사용할 수 있습니다.

빠른 복원

AWS Management Console 또는 Amazon Redshift API를 사용하여 원하는 시스템 또는 사용자 스냅샷으로 클러스터를 복원할 수 있습니다. 클러스터는 시스템 메타데이터가 복원되는 대로 사용이 가능하며 사용자 데이터가 백그라운드에서 스풀링되는 동안 쿼리 실행을 시작할 수 있습니다.

암호화

몇몇 매개 변수 설정만으로 전송 중인 데이터를 보호하기 위해 SSL을 사용하고 저장된 데이터를 보호하기 위해 하드웨어 가속 AES-256 암호화를 사용하도록 Amazon Redshift를 설정할 수 있습니다. 저장된 데이터에 암호화를 사용하도록 선택하면 백업 및 디스크에 작성된 모든 데이터가 암호화됩니다. 기본적으로 Amazon Redshift에서 키를 관리하지만, 사용자는 자체 하드웨어 보안 모듈(HSM), AWS CloudHSM 또는 AWS Key Management Service를 사용하여 키를 관리하도록 선택할 수 있습니다.

네트워크 격리

Amazon Redshift를 사용하면 방화벽 규칙을 구성하여 데이터 웨어하우스 클러스터에 대한 네트워크 액세스를 제어할 수 있습니다. Amazon VPC 내에서 Amazon Redshift를 실행하여 자체 가상 네트워크에 있는 데이터 웨어하우스 클러스터를 격리하고 업계 표준의 암호화된 IPSec VPN을 사용하여 기존 IT 인프라에 연결할 수 있습니다.

감사 및 규정 준수

Amazon Redshift는 AWS CloudTrail과 통합되어 모든 Redshift API 호출을 감사할 수 있습니다. 또한 Amazon Redshift는 데이터베이스에 대한 연결 시도, 쿼리 및 변경을 비롯한 모든 SQL 작업을 로그에 기록합니다. 사용자는 시스템 테이블에 대한 SQL 쿼리를 사용하여 이러한 로그에 액세스하거나 로그를 Amazon S3의 안전한 위치로 다운로드하도록 선택할 수 있습니다. Amazon Redshift는 SOC1, SOC2, SOC3 및 PCI DSS Level 1 요구 사항을 준수합니다. 자세한 내용은 AWS 클라우드 규정 준수를 참조하십시오.

440x220_APN-Blog

Amazon Redshift Spectrum에서는 데이터를 로드하거나 변환할 필요 없이 데이터 웨어하우스의 로컬 디스크에 저장된 데이터를 넘어 Amazon S3 '데이터 레이크'에 저장된 방대한 데이터를 쿼리할 수 있도록 Amazon Redshift의 분석 역량을 확장할 수 있습니다. 이 블로그 게시물에서는 Amazon Redshift Spectrum의 10가지 중요 모범 사례를 수집하고 이를 여러 기능 그룹으로 나누었습니다.

전체 게시물 읽기 »

Amazon Redshift Spectrum을 사용하면 Amazon Redshift 고객이 Amazon S3에 있는 데이터를 손쉽게 쿼리할 수 있습니다. Redshift Spectrum은 기본 형식(Avro, CSV, Grok, ORC, Parquet, RCFile, RegexSerDe, SequenceFile, TextFile 및 TSV 포함) 그대로 소스 데이터에서 직접 동작합니다. 즉, 데이터를 로드하거나 변환할 필요가 없습니다.

전체 게시물 읽기 »

Amazon Redshift의 기능과 유연성을 활용하면서 데이터가 있는 장소에서 있는 그대로 처리할 수 있도록 AWS에서 Amazon Redshift Spectrum을 출시했습니다. Spectrum을 사용하면 데이터를 로딩하거나 다른 준비 작업 없이 Amazon Simple Storage Service(S3)에 저장된 데이터에 대해 복잡한 쿼리를 실행할 수 있습니다.

전체 게시물 읽기 »

Amazon Redshift에서 컬럼 방식 압축은 중요한 기술입니다. 이 기술은 노드의 스토리지 용량 효율성을 개선하여 고객 비용을 줄이고 SQL 요청을 처리하는 데 필요한 I/O를 줄여 성능을 개선합니다. I/O 효율성 개선은 데이터 웨어하우징에 매우 중요합니다. 지난해에는 AWS I/O 개선으로 쿼리 처리량이 두 배로 증가했습니다. 최근에 Amazon Redshift에 추가된 새로운 압축 개선 사항 중 일부를 살펴보겠습니다.

전체 게시물 읽기 »

Amazon Redshift에 관한 블로그 게시물의 전체 목록은 블로그 게시물 페이지 참조 »

Amazon Redshift의 모든 새로운 기능에 관한 정보는 새로운 소식 페이지 참조 »

Amazon Redshift를 무료로 사용해 보십시오. 2개월 동안 DC1.Large를 매월 750시간 동안 무료로 사용할 수 있습니다. 무료 평가판을 시작하려면 AWS 계정을 생성하고 Amazon Redshift 콘솔에 로그인합니다. 그런 다음 Amazon Redshift 클러스터를 시작하고 노드 유형으로 DC1.Large를 선택합니다. 개념 증명 또는 평가를 위한 지원을 요청하려면 여기를 클릭하십시오.

 

지금 시작