Amazon Redshift는 가장 널리 사용되고 가장 빠른 속도를 자랑하는 클라우드 데이터 웨어하우스입니다. Redshift는 현재 사용 중인 데이터 레이크와 통합되며, 다른 데이터 웨어하우스보다 최대 3배 빠르고 다른 클라우드 데이터 웨어하우스보다 비용이 최대 75% 저렴합니다.

기능 및 장점

Amazon은 고객 사용 사례 및 피드백을 토대로 매년 수백 개의 기능과 제품 개선 사항을 릴리스합니다. 새로운 기능에 대해 자세히 알아보기

데이터 레이크 및 AWS 서비스와의 완벽한 통합

Amazon Redshift는 오픈 형식으로 데이터 작업을 빠르고 간단하게 수행하고 AWS 에코시스템에 손쉽게 연결할 수 있도록 해 줍니다.

데이터 레이크에서 또는 데이터 레이크로 데이터를 쿼리하거나 내보내기: 오픈 형식으로 데이터를 쿼리하고, 데이터를 다시 데이터 레이크에 쓰는 것이 다른 어떤 클라우드 데이터 웨어하우스보다도 간편합니다. 익숙한 ANSI SQL을 사용하여 Parquet, ORC, JSON, Avro, CSV 등과 같은 다양한 오픈 파일 형식을 S3에서 직접 쿼리할 수 있습니다. 데이터 레이크로 데이터를 내보낼 때는 SQL 코드에서 Redshift UNLOAD 명령을 사용하고 Parquet를 파일 형식으로 지정하기만 하면 Redshift가 데이터의 형식 지정 및 S3로의 데이터 이동을 자동으로 처리합니다. 이와 같은 기능은 자주 액세스하는 고도의 정형 데이터를 Redshift 데이터 웨어하우스에 저장하면서도, 최대 엑사바이트에 달하는 정형 데이터, 반정형 데이터 및 비정형 데이터를 S3에 보관할 수 있는 유연성을 제공합니다. 데이터를 Redshift에서 데이터 레이크로 다시 내보내면 Amazon Athena, Amazon EMRAmazon SageMaker와 같은 AWS 서비스를 활용해 데이터를 보다 면밀하게 분석할 수 있습니다. 

연합 쿼리: Redshift의 새로운 연합 쿼리 기능을 사용하면 관계형 데이터베이스에 도달할 수 있습니다. Amazon RDS 및 Aurora PostgreSQL 데이터베이스 하나 이상에 라이브 데이터를 쿼리하면 데이터를 이동할 필요 없이 비즈니스 운영에 대한 포괄적인 가시성을 즉각적으로 얻을 수 있습니다. Redshift 데이터 웨어하우스의 데이터, 데이터 레이크의 데이터는 물론, 이제 운영 데이터 저장소의 데이터까지 결합하여 더 나은 의사 결정을 내릴 수 있습니다. Redshift는 네트워크를 통해 이동하는 데이터를 줄일 수 있도록 정교한 최적화를 제공하고 고성능 쿼리를 위해 대규모 병렬 데이터 처리로 이를 보완합니다. 자세히 알아보기

AWS 분석 에코시스템: AWS 분석 에코시스템과의 네이티브 통합으로, 분석 워크플로를 마찰 없이 완벽히 처리할 수 있으며, 워크플로가 한층 간편해졌습니다. 예를 들어, AWS Lake Formation은 안전한 데이터 레이크를 며칠 만에 손쉽게 설정할 수 있도록 지원하는 서비스입니다. AWS Glue는 데이터를 추출하고 변환하여 Redshift에 로드(ETL)할 수 있습니다. Amazon Kinesis Data Firehose는 거의 실시간에 가까운 분석을 위해 스트리밍 데이터를 캡처하고 변환하여 Redshift에 로드할 수 있는 가장 쉬운 방법입니다. Amazon EMR을 사용하면 Hadoop/Spark를 사용하여 데이터를 처리하고 BI 및 분석을 위해 출력을 Amazon Redshift에 로드할 수 있습니다. Amazon QuickSight는 Redshift 데이터에 대한 보고서, 시각화 및 대시보드를 생성하는 데 사용할 수 있는 첫 번째 BI 서비스로, 세션당 요금제로 이용 가능합니다. Redshift를 사용하여 Amazon SageMaker로 기계 학습 워크로드를 실행할 데이터를 준비할 수 있습니다. AWS Schema Conversion ToolAWS Database Migration Service(DMS)를 사용하여 Amazon Redshift로의 마이그레이션을 가속화할 수 있습니다. Amazon Redshift는 또한 보안, 모니터링 및 규정 준수를 위한 Amazon Key Management Service(KMS)Amazon Cloudwatch와도 긴밀히 통합됩니다.

최고의 성능

Amazon Redshift는 빠른 속도와 유연성이 더해진 업계 최고 수준의 성능을 제공합니다.

RA3 인스턴스: RA3 인스턴스는 다른 클라우드 데이터 웨어하우스 서비스보다 3배 우수한 성능을 제공합니다. 이러한 Amazon Redshift 인스턴스는 대량의 컴퓨팅 용량이 요구되는 성능 집약적인 워크로드의 속도를 극대화하며, 필요에 따라 인스턴스의 수를 지정하여 스토리지와 관계없이 컴퓨팅 비용을 별도로 지불할 수 있는 유연성을 제공합니다. 자세히 알아보기

효율적인 스토리지 및 고성능 쿼리 처리: Amazon Redshift는 기가바이트부터 페터바이트까지 다양한 크기의 데이터 세트에 대해 빠른 쿼리 성능을 제공합니다. 열 기반 스토리지, 데이터 압축 및 영역 매핑은 쿼리 수행에 필요한 I/O 수를 줄여 줍니다. Amazon Redshift는 LZO 및 Zstandard와 같은 업계 표준과 함께, 숫자 및 날짜/시간 유형을 위해 특별히 고안된 압축 인코딩 AZ64도 제공하여 스토리지를 절약하고 쿼리 성능을 최적화할 수 있도록 해 줍니다.

구체화 보기: Amazon Redshift의 구체화 보기를 사용하면 대시보드, 비즈니스 인텔리전스(BI) 도구의 쿼리 및 추출, 로드, 변환(ELT) 데이터 처리 작업과 같은 분석 워크로드에 대해 훨씬 빠른 쿼리 성능을 얻을 수 있습니다. 느리게 실행되는 쿼리를 가속하기 위해 구체화 보기를 사용하여 중간 결과를 캐시할 수 있습니다. Amazon Redshift는 구체화 보기(증분적)를 효율적으로 유지하여 지연 시간이 짧은 성능 이점을 지속해서 제공할 수 있습니다. 자세히 알아보기

기계 학습을 통해 처리량 및 성능 극대화: Amazon Redshift의 고급 기계 학습 기능은 높은 처리량과 성능을 제공할 뿐만 아니라 다양한 워크로드 또는 동시 사용자 활동도 지원합니다. Amazon Redshift는 정교한 알고리즘을 활용하여 런타임 및 리소스 요구 사항에 따라 수신 쿼리를 예측 및 분류하여 성능 및 동시성을 동적으로 관리하고 비즈니스 크리티컬 워크로드의 우선순위를 지정합니다. 단기 쿼리 가속화(SQA)는 대량 대시보드와 같은 애플리케이션의 단기 쿼리가 대량 쿼리 뒤에 남아 있게 하는 대신, 단기 쿼리를 빠른 대기열로 보내 중간에 처리되도록 합니다. 자동 워크로드 관리(WLM)는 기계 학습을 사용하여 메모리 및 동시성을 동적으로 관리함으로써 쿼리 처리량을 극대화합니다. 또한 제출하는 쿼리가 수백 개에 달하더라도, 이제는 그중에서 가장 중요한 쿼리의 우선순위를 손쉽게 지정할 수 있습니다. Amazon Redshift는 또한 사용자 워크로드를 지속적으로 관찰하여 증가하는 사용량에 따라 성능을 개선할 수 있는 기회를 파악하고, 최적화를 원활하게 적용하며, Amazon Redshift의 성능을 추가로 강화하기 위해 명백한 사용자 조치가 필요할 때 Redshift Advisor를 통해 권장 사항을 제시하는 자체 학습 시스템입니다. 

결과 캐싱: Amazon Redshift는 결과 캐싱을 사용하여 반복 쿼리에 대해 1초 미만의 응답 시간을 제공합니다. 반복 쿼리를 실행하는 대시보드, 시각화 및 비즈니스 인텔리전스 도구에서 상당한 성능 향상을 경험합니다. 쿼리가 실행될 때, Amazon Redshift는 캐시를 검색하여 이전 실행으로부터 캐시된 결과가 있는지 확인합니다. 캐시된 결과가 발견되고 데이터가 변경되지 않은 경우 쿼리를 재실행하는 대신 캐시된 결과가 즉시 반환됩니다.

뛰어난 확장성

Amazon Redshift는 데이터나 사용자를 확장하는 데 있어 사실상 제한이 없습니다. 

페타바이트 규모의 데이터 웨어하우징: Amazon Redshift는 간단하며 요구 사항의 변화에 따라 신속하게 확장할 수 있습니다. 요구 사항의 변화에 따라 콘솔에서 클릭 몇 번 또는 간단한 API 호출을 통해 데이터 웨어하우스의 노드 유형 또는 노드 수를 변경하고 확장하거나 축소할 수 있습니다. 관리형 스토리지는 최대 8PB의 압축 데이터 워크로드를 지원하기 위해 용량을 자동으로 추가합니다. 

페타바이트 규모의 데이터 레이크 분석Redshift Spectrum 기능을 사용하면 데이터를 로드하거나 변환하지 않고도 Amazon S3에 있는 페타바이트 규모의 데이터에 대해 쿼리를 실행할 수 있습니다. 오픈 데이터 형식으로 무제한의 데이터를 저장하는 가용성, 보안 및 비용 효율성이 뛰어난 데이터 레이크로서 S3를 사용할 수 있습니다. Amazon Redshift Spectrum은 수천 개의 병렬화된 노드 전체에서 쿼리를 실행하여 쿼리의 복잡성 또는 데이터 양과 관계없이 빠른 결과를 제공합니다.  

제한 없는 동시성: Amazon Redshift는 동시에 수천 개에 달하는 쿼리가 있더라도 빠른 성능을 일관되게 제공하며, 이는 Amazon Redshift 데이터 웨어하우스에서 데이터를 쿼리하든, Amazon S3 데이터 레이크에서 바로 데이터를 쿼리하든 관계가 없습니다. Amazon Redshift 동시성 확장은 동시 사용자 및 동시 쿼리를 사실상 무제한으로 지원하며, 증가하는 동시성에 맞춰 용량을 일시적으로 추가하여 일관된 서비스를 제공합니다. 

최상의 가격

Amazon Redshift를 클라우드 데이터 웨어하우스로 사용하면 컴퓨팅 및 스토리지 비용을 개별적으로 지불할 수 있고, 비용 예측으로 관리가 용이하며, 사용한 만큼 지불하는 요금제나 예약 인스턴스 약정으로 비용을 최대 75% 절약할 수 있습니다.

유연한 요금 옵션: Amazon Redshift는 데이터 웨어하우스 요금의 지불 방식을 최적화할 수 있는 가장 비용 효율적인 데이터 웨어하우스입니다. 약정 없이 시간당 0.25 USD의 비용으로 작게 시작하여 연간 테라바이트당 1,000 USD로 확장할 수 있습니다. Amazon Redshift는 선결제 요금이 없는 온디맨드 요금, 1년 또는 3년 약정으로 비용을 최대 75% 절감할 수 있는 예약 인스턴스 요금, Amazon S3 데이터 레이크에서 스캔된 데이터 양을 기반으로 한 쿼리당 요금을 제공하는 유일한 클라우드 데이터 웨어하우스입니다. Amazon Redshift의 요금에는 기본으로 제공되는 보안, 데이터 압축, 백업 스토리지 및 데이터 전송이 포함됩니다. 데이터 규모가 증가하면 RA3 인스턴스로 관리형 스토리지를 사용하여 월 기준 GB당 0.024 USD라는 비용 효율적인 가격으로 데이터를 저장할 수 있습니다.

워크로드를 예측할 수 없는 경우에도 비용 예측 가능: Amazon Redshift를 활용하면 각각의 클러스터가 매일 1시간 분량의 동시성 확장 크레딧을 무료로 획득하기 때문에 비용을 최소화하면서 확장할 수 있습니다. 이러한 무료 크레딧은 97%의 고객에게 발생하는 동시성 요구를 충족하는 데 충분한 수준입니다. 이를 통해 분석 수요의 변동성이 심한 경우에도 월간 비용을 예측할 수 있습니다. 

워크로드에 가장 적합한 노드 유형 선택: 세 가지 인스턴스 유형 중에서 선택하여 데이터 웨어하우징의 요구 사항에 맞게 Amazon Redshift를 최적화할 수 있습니다.

RA3 노드는 컴퓨팅 스토리지를 독립적으로 확장할 수 있도록 해 줍니다. RA3 노드를 선택하면 데이터를 별도의 스토리지 계층에 저장하는 고성능 데이터 웨어하우스를 사용할 수 있습니다. 필요한 쿼리 성능에 맞춰서 데이터 웨어하우스의 크기만 지정하면 됩니다.

고밀도 컴퓨팅(DC) 노드는 고속 CPU, 대용량 RAM 및 SSD(Solid-State-Disk)를 사용하여 고성능 데이터 웨어하우스를 생성할 수 있도록 해 주며, 데이터 크기가 500GB 미만인 경우 가장 적합한 옵션입니다.

DS2(고밀도 스토리지) 노드는 3년 예약 인스턴스를 구매할 경우 하드 디스크 드라이브(HDD)를 사용하여 대규모 데이터 웨어하우스를 저렴한 가격으로 생성할 수 있도록 해 줍니다. 이는 상당한 스토리지 워크로드가 요구되는 경우에 가장 비용 효율적인 노드 유형입니다. DS2 클러스터에서 실행하는 고객 대부분은 워크로드를 RA3 클러스터로 마이그레이션하고, 성능을 최대 2배 높이며, DS2와 같은 비용으로 더 많은 스토리지를 사용할 수 있습니다.
단일 API 호출이나 AWS 콘솔에서 클릭 몇 번으로 클러스터 규모를 확장 및 축소하거나 노드 유형을 변경할 수 있습니다. 자세한 내용은 요금 페이지를 참조하십시오.

간편한 관리

Amazon Redshift는 데이터 웨어하우스가 아닌 데이터 통찰력에 집중할 수 있도록 일반적인 유지관리 작업을 자동화합니다.

자동 프로비저닝: Amazon Redshift는 설정 및 운영이 간단합니다. AWS 콘솔에서 클릭 몇 번으로 새로운 데이터 웨어하우스를 배포할 수 있으며 Amazon Redshift가 사용자 대신 인프라를 자동으로 프로비저닝합니다. 백업 및 복제와 같은 관리 작업 대부분이 자동화됩니다. 제어 기능이 필요한 경우, 제공되는 옵션을 통해 특정 워크로드에 맞춰 제어 기능을 조정할 수 있습니다. 새로운 기능은 투명하게 릴리스되므로 업그레이드와 패치 일정을 예약하고 적용할 필요가 없습니다.

자동화된 백업: Amazon Redshift의 데이터는 Amazon S3에 자동으로 백업되며, Amazon Redshift가 재해 복구를 위해 스냅샷을 다른 리전의 S3에 비동기식으로 복제할 수 있습니다. AWS Management Console 또는 Redshift API를 사용하여 원하는 시스템 또는 사용자 스냅샷으로 클러스터를 복원할 수 있습니다. 클러스터는 시스템 메타데이터가 복원되는 대로 사용이 가능하며 사용자 데이터가 백그라운드에서 스풀링되는 동안 쿼리 실행을 시작할 수 있습니다.

내결함성: 데이터 웨어하우스 클러스터의 안정성을 강화하는 여러 기능이 있습니다. 예를 들어, Amazon Redshift는 내결함성을 위해 클러스터 상태를 계속해서 모니터링하고, 장애가 발생한 드라이브의 데이터를 자동으로 다시 복제하며, 필요에 따라 노드를 교체합니다.

유연한 쿼리: Amazon Redshift를 활용하면 유연하게 콘솔 내에서 쿼리를 실행하거나 SQL 클라이언트 도구, 라이브러리 또는 비즈니스 인텔리전스 도구에 연결할 수 있습니다. AWS 콘솔의 쿼리 편집기는 강력한 인터페이스를 통해 Amazon Redshift 클러스터에서 SQL 쿼리를 실행하고, 사용자의 쿼리와 인접한 쿼리 실행 계획 및 쿼리 결과(컴퓨팅 노드에서 실행되는 쿼리 대상)를 볼 수 있게 해 줍니다.

네이티브 공간 데이터 처리: Amazon Redshift는 네이티브 공간 데이터 처리 기능을 지원합니다. 이 기능은 고객이 공간 데이터를 저장, 검색 및 처리할 수 있도록 하므로 공간 데이터를 분석 쿼리에 통합하여 비즈니스 통찰력을 원활하게 높일 수 있습니다. Amazon Redshift는 Point, Linestring, Polygon 등의 여러 가지 기하학 도형을 지원하는 다형 데이터 형식인 GEOMETRY를 제공합니다. 또한 Redshift는 기하학 도형 구성, 공간 데이터에 대한 가져오기, 내보내기, 액세스 및 처리 작업을 수행할 수 있도록 공간 SQL 함수를 제공합니다. Redshift 테이블에 GEOMETRY 열을 추가하고 공간 데이터와 비공간 데이터를 대상으로 한 SQL 쿼리를 작성할 수 있습니다. Redshift는 데이터 레이크를 원활하게 쿼리할 수 있으므로, 외부 테이블을 공간 쿼리에 통합하여 공간 처리를 데이터 레이크로 쉽게 확장할 수도 있습니다.

타사 도구와 통합: 업계 최고의 데이터 로딩, 변환 및 시각화 도구를 활용하고 업계를 선도하는 전문가와 협력하여 Amazon Redshift를 강화할 수 있는 다양한 옵션이 있습니다. 수많은 파트너가 Amazon Redshift와 연동되도록 자사의 솔루션을 인증했습니다.

뛰어난 보안 및 규정 준수

AWS는 가장 까다로운 요구 사항을 충족하는 포괄적인 보안 기능을 갖추고 있으며, Amazon Redshift는 데이터 보안 기능을 추가 비용 없이 기본으로 제공합니다.

엔드 투 엔드 암호화: 몇몇 파라미터 설정만으로 SSL을 사용하여 전송 중인 데이터를 보호하고 하드웨어 가속 AES-256 암호화를 사용하여 유휴 데이터를 보호하도록 Amazon Redshift를 설정할 수 있습니다. 저장된 데이터에 암호화를 사용하도록 선택하면 백업 및 디스크에 작성된 모든 데이터가 암호화됩니다. Amazon Redshift는 기본적으로 키 관리를 담당합니다.

네트워크 격리: Amazon Redshift를 사용하면 데이터 웨어하우스 클러스터에 대한 네트워크 액세스를 제어하도록 방화벽 규칙을 구성할 수 있습니다. Amazon Virtual Private Cloud(VPC) 내에서 Redshift를 실행하여 자체 가상 네트워크에 있는 데이터 웨어하우스 클러스터를 격리하고 업계 표준의 암호화된 IPSec VPN을 사용하여 기존 IT 인프라에 연결할 수 있습니다.

감사 및 규정 준수: Amazon Redshift는 모든 Redshift API 호출을 감사할 수 있도록 AWS CloudTrail과 통합됩니다. Redshift는 데이터 웨어하우스에 대한 연결 시도, 쿼리 및 변경 사항을 비롯하여 모든 SQL 작업을 기록합니다. 시스템 테이블에 대한 SQL 쿼리를 사용하여 이러한 로그에 액세스하거나 로그를 Amazon S3의 안전한 위치에 저장하도록 선택할 수 있습니다. Amazon Redshift는 SOC1, SOC2, SOC3 및 PCI DSS 레벨 1 요구 사항을 준수합니다. 자세한 내용은 AWS 클라우드 규정 준수 페이지를 참조하십시오.

세분화된 액세스 제어: 행 및 열 수준으로 보안 제어를 세분화할 수 있으므로, 사용자에게는 액세스 권한이 있는 데이터만 표시됩니다. Amazon Redshift는 AWS Lake Formation과 통합되어 Lake Formation의 열 수준 액세스 제어가 데이터 레이크에 있는 데이터에 대한 Redshift 쿼리에도 적용되도록 합니다.

새로운 기능 자세히 알아보기.

자세한 제품 정보는 Amazon Redshift Documentation 페이지를 참조하십시오.

Amazon Redshift 요금에 대해 자세히 알아보십시오

요금 페이지로 이동하기
구축할 준비가 되셨습니까?
Amazon Redshift 시작하기
질문이 있으십니까?
문의처