Amazon Redshift는 로딩 필요 없이 데이터 웨어하우스 쿼리를 데이터 레이크로 확장합니다. Redshift에 저장된 페타바이트 규모의 데이터에 대해 분석 쿼리를 실행하고 Amazon S3에 저장된 엑사바이트 규모의 데이터에 대해 직접 분석 쿼리를 실행할 수 있습니다. 설정이 간단하고, 관리 작업 대부분을 자동화하며, 규모와 관계없이 빠른 성능을 제공합니다.

주요 기능

더 빠른 성능

대량 병렬: Amazon Redshift는 기가바이트에서 엑사바이트까지 다양한 크기의 데이터 세트에 대해 빠른 쿼리 성능을 제공합니다. Redshift는 열 기반 스토리지, 데이터 압축 및 영역 매핑을 사용하여 쿼리 수행에 필요한 I/O 수를 줄입니다. 대량 병렬 처리(MPP) 데이터 웨어하우스 아키텍처를 사용하여 SQL 작업을 병렬화 및 분산함으로써 모든 가용 리소스를 활용합니다. 기본 하드웨어는 고성능 데이터 처리를 위해 설계되어, 로컬 연결 스토리지를 사용하여 CPU와 드라이브 간 처리량을 극대화하고 고대역폭 메시 네트워크를 사용하여 노드 간 처리량을 극대화합니다.

기계 학습: Amazon Redshift는 기계 학습을 사용하여 워크로드를 기반으로 높은 처리량을 제공합니다. Redshift는 정교한 알고리즘을 사용하여 수신되는 쿼리 런타임을 예측하고, 빠른 처리를 위해 이를 최적의 대기열에 할당합니다. 예를 들어 동시 요구 사항이 많은 대시보드 및 보고서와 같은 쿼리는 즉시 처리를 위해 빠른 대기열로 라우팅됩니다.

결과 캐싱: Amazon Redshift에서는 결과 캐싱을 사용하여 반복 쿼리에 대해 1초 미만의 응답 시간을 제공합니다. 반복 쿼리를 실행하는 대시보드, 시각화 및 비즈니스 인텔리전스 도구에서 상당한 성능 향상을 경험합니다. 쿼리가 실행될 때, Redshift는 캐시를 검색하여 이전 실행으로부터 캐시된 결과가 있는지 확인합니다. 캐시된 결과가 발견되고 데이터가 변경되지 않은 경우 쿼리를 재실행하는 대신 캐시된 결과가 즉시 반환됩니다.

간편한 설정, 배포 및 관리

자동화된 프로비저닝: Amazon Redshift는 설정 및 운영이 간단합니다. AWS 콘솔에서 클릭 몇 번으로 새로운 데이터 웨어하우스를 배포할 수 있으며 Redshift가 사용자 대신 자동으로 인프라를 프로비저닝합니다. 백업 및 복제와 같은 관리 작업 대부분이 자동화되므로, 사용자는 관리가 아니라 데이터에 집중할 수 있습니다. 제어 기능을 원하는 경우 Redshift에서는 특정 워크로드에 맞춰 조정할 수 있도록 옵션을 제공합니다. 새로운 기능은 투명하게 릴리스되므로 업그레이드와 패치 일정을 예약하고 적용할 필요가 없습니다.

자동 백업: Amazon Redshift는 새로운 데이터를 Amazon S3로 계속해서 자동 백업합니다. Redshift는 재해 복구를 위해 스냅샷을 다른 리전의 S3에 비동기식으로 복제할 수 있습니다. AWS Management Console 또는 Redshift API를 사용하여 원하는 시스템 또는 사용자 스냅샷으로 클러스터를 복원할 수 있습니다. 클러스터는 시스템 메타데이터가 복원되는 대로 사용이 가능하며 사용자 데이터가 백그라운드에서 스풀링되는 동안 쿼리 실행을 시작할 수 있습니다.

내결함성: Amazon Redshift에는 데이터 웨어하우스 클러스터의 안정성을 향상하는 여러 기능이 있습니다. Redshift는 내결함성을 위해 클러스터 상태를 계속해서 모니터링하고, 장애가 발생한 드라이브의 데이터를 자동으로 다시 복제하며, 필요에 따라 노드를 교체합니다.

타사 도구와 통합: 업계 최고의 데이터 로딩, 변환 및 시각화 도구 및 전문가와 협력하여 Amazon Redshift를 향상하십시오. 수많은 파트너가 Amazon Redshift와 연동되도록 자사의 솔루션을 인증했습니다. 

비용 효율성

선결제 금액 없이 사용량에 따라 지불: Amazon Redshift는 가장 비용 효율적인 데이터 웨어하우스로서, 프로비저닝한 리소스에 대해서만 비용을 지불합니다. 약정 없이 시간당 0.25 USD로 작게 시작하여 연간 테라바이트당 250 USD로 확장할 수 있습니다. Redshift는 선결제 금액 없는 온디맨드 요금, 1년 또는 3년 약정으로 최대 75%를 절감할 수 있는 예약 인스턴스 요금, Amazon S3 데이터 레이크에서 스캔된 데이터 양을 기반으로 한 쿼리당 요금을 제공하는 유일한 클라우드 데이터 웨어하우스입니다. 자세한 내용은 Amazon Redshift 요금 페이지를 참조하십시오.

노드 유형 선택: 데이터 웨어하우징 요구 사항에 따라 두 가지 노드 유형 중에 선택하여 Redshift를 최적화할 수 있습니다. 고밀도 컴퓨팅(DC) 노드를 사용하면 고속 CPU, 대용량 RAM, SSD(Solid-State Disk)를 사용하는 매우 뛰어난 성능의 데이터 웨어하우스를 생성할 수 있습니다. 추가로 확장하거나 비용을 줄이려는 경우, 매우 저렴한 가격의 대용량 하드 디스크 드라이브를 사용하는 가장 비용 효율적인 고밀도 스토리지(DS) 노드 유형으로 전환할 수 있습니다. 단일 API 호출이나 AWS 콘솔에서 클릭 몇 번으로 클러스터 규모를 확장 및 축소하거나 노드 유형을 변경할 수 있습니다.

요구 사항에 맞춰 신속하게 확장

페타바이트 규모의 데이터 웨어하우징: Amazon Redshift는 간단하며 요구 사항의 변화에 따라 신속하게 확장할 수 있습니다. 요구 사항의 변화에 따라 콘솔에서 클릭 몇 번 또는 간단한 API 호출을 통해 데이터 웨어하우스의 노드 유형 또는 노드 수를 변경하고 확장하거나 축소할 수 있습니다.

엑사바이트 규모의 데이터 레이크 분석: Redshift의 기능인 Redshift Spectrum을 사용하면 데이터를 로드하거나 변환할 필요 없이 Amazon S3에 있는 엑사바이트 규모의 데이터에 대해 쿼리를 실행할 수 있습니다. 오픈 데이터 형식으로 무제한의 데이터를 저장하는 가용성, 보안 및 비용 효율성이 뛰어난 데이터 레이크로서 S3를 사용할 수 있습니다.

제한 없는 동시성: Redshift Spectrum은 여러 쿼리가 Amazon S3에 있는 동일한 데이터에 동시에 액세스하도록 지원하여 제한 없는 동시성을 제공합니다. Redshift Spectrum은 수천 개의 병렬화된 노드 전체에서 쿼리를 실행하여 쿼리의 복잡성 또는 데이터 양과 관계없이 빠른 결과를 제공합니다.

데이터 레이크를 쿼리

Amazon S3 데이터 레이크: Amazon Redshift는 데이터를 로딩하지 않고 쿼리를 Amazon S3로 확장하는 유일한 데이터 웨어하우스입니다. Avro, CSV, Grok, JSON, ORC, Parquet 등과 같이 이미 사용하는 오픈 파일 형식을 S3에서 직접 쿼리할 수 있습니다. 이를 통해 Redshift 로컬 디스크에 고도로 정형화되고 자주 액세스하는 데이터를 저장하고, S3에 엑사바이트 규모의 정형 및 비정형 데이터를 유지하며, 정형과 비정형 데이터를 모두 원활하게 쿼리하여 개별적인 데이터 세트를 쿼리해서는 얻을 수 없는 고유한 통찰력을 제공할 수 있습니다.

AWS 분석 에코시스템: Amazon Redshift는 AWS 분석 에코시스템과 기본적으로 통합됩니다. AWS Glue는 데이터를 추출하고 변환하여 Redshift로 로드(ETL)할 수 있습니다. Amazon Kinesis Data Firehose는 거의 실시간 분석을 위해 스트리밍 데이터를 캡처하고 변환하여 Redshift로 로드할 수 있는 가장 쉬운 방법입니다. Amazon QuickSight를 사용하여 보고서, 시각화 및 대시보드를 생성할 수 있습니다. 6개월 동안 무료로 AWS Database Migration Service(DMS)를 사용하여 Amazon Redshift로의 마이그레이션을 가속화할 수 있습니다. 자세히 알아보기 »

보안

엔드 투 엔드 암호화: 몇몇 파라미터 설정만으로 SSL을 사용하여 전송 데이터를 보호하고 하드웨어 가속 AES-256 암호화를 사용하여 저장 데이터를 보호하도록 Amazon Redshift를 설정할 수 있습니다. 저장 데이터에 대한 암호화를 활성화하도록 선택하면 백업과 더불어 디스크에 작성된 모든 데이터가 암호화됩니다. 기본적으로 Amazon Redshift에서 키 관리를 담당합니다.

네트워크 격리: Amazon Redshift를 사용하면 데이터 웨어하우스 클러스터에 대한 네트워크 액세스를 제어하도록 방화벽 규칙을 구성할 수 있습니다. Amazon VPC 내에서 Amazon Redshift를 실행하여 자체 가상 네트워크에 있는 데이터 웨어하우스 클러스터를 격리하고 업계 표준의 암호화된 IPSec VPN을 사용하여 기존 IT 인프라에 연결할 수 있습니다.

감사 및 규정 준수: Amazon Redshift는 AWS CloudTrail과 통합되어 모든 Redshift API 호출을 감사할 수 있습니다. Redshift는 데이터베이스에 대한 연결 시도, 쿼리 및 변경 사항을 비롯하여 모든 SQL 작업을 기록합니다. 시스템 테이블에 대한 SQL 쿼리를 사용하여 이러한 로그에 액세스하거나 로그를 Amazon S3의 안전한 위치로 다운로드하도록 선택할 수 있습니다. Amazon Redshift는 SOC1, SOC2, SOC3 및 PCI DSS 레벨 1 요구 사항을 준수합니다. 자세한 내용은 AWS 클라우드 규정 준수 페이지를 참조하십시오.

Amazon Redshift 요금에 대해 자세히 알아보십시오

요금 페이지로 이동
구축할 준비가 되셨습니까?
Amazon Redshift 시작하기
질문이 있으십니까?
문의하기