Amazon Redshift 데이터 공유를 사용하면 Amazon Redshift가 제공하는 사용 편의성, 성능 및 비용 이점을 단일 클러스터에서 다중 클러스터 배포로 확장하는 동시에 데이터 공유 기능을 사용할 수 있습니다. 데이터 공유를 사용하면 데이터를 복사하거나 이동할 필요 없이 Amazon Redshift 클러스터 전체에서 즉각적이고 세분화된 빠른 데이터 액세스를 수행할 수 있습니다. 데이터 공유는 데이터에 대한 실시간 액세스를 제공하므로 데이터 웨어하우스에서 업데이트될 때마다 항상 일관된 최신 정보가 표시됩니다. 동일하거나 서로 다른 AWS 계정에서 Amazon Redshift 클러스터와 실시간 데이터를 안전하게 공유할 수 있습니다.

Amazon Redshift 데이터 공유는 다음을 제공합니다.

  1. Amazon Redshift 데이터 웨어하우스에서 데이터를 공유할 수 있는 단순하고 직접적인 방법
  2. 데이터 복사 및 데이터 이동 없이 즉각적이고 빠른 속도로 세분화된 데이터에 액세스 가능
  3. 모든 소비자에게 트랜잭션 일관성이 보장되는 실시간 데이터 보기 제공
  4. 전체 조직 및 외부 당사자와 안전하고 통제된 협업 보장
 
Amazon Redshift 교차 계정 데이터 공유 기능이 정식 출시되었습니다.
 
Amazon Redshift 클러스터에서 데이터 공유 기능을 사용할 때 추가 요금은 발생하지 않습니다.
Amazon Redshift Data Sharing workflow(8:53)
데이터 공유는 스토리지와 컴퓨팅이 분리되어 각각을 개별적으로 조정할 수 있는 Amazon Redshift RA3 관리형 스토리지에 구축됩니다. 데이터 공유를 사용하는 경우 공유 데이터에 액세스하는 워크로드는 서로 격리됩니다. 공유 데이터에 액세스하는 쿼리는 소비자 클러스터에서 실행되며 생산자 클러스터의 성능에 미치는 영향 없이 Amazon Redshift 관리형 스토리지 계층에서 직접 데이터를 읽습니다. 이제 리소스 경합에 대한 걱정 없이 데이터 액세스 패턴 및 SLA 요구 사항이 다양한 원하는 수의 워크로드를 빠르게 온보딩할 수 있습니다. 공유 데이터에 액세스하는 워크로드에 워크로드별 가성비 요구 사항을 충족하는 유연한 컴퓨팅 리소스를 프로비저닝할 수 있고 셀프 서비스 방식으로 필요에 따라 개별적으로 조정할 수 있습니다.

작동 방식

Redshift 데이터 공유 방식

사용 사례

  • 워크로드 격리 및 요금 부과
  • 그룹 간 협업
  • 서비스형 데이터 및 분석
  • 개발 민첩성
  • 워크로드 격리 및 요금 부과
  • 워크로드 격리 및 요금 부과

    ETL 클러스터의 데이터를 허브-스포크 아키텍처에 있는 다수의 격리된 BI 및 분석 클러스터와 공유하여 읽기 워크로드 격리와 선택적 요금 차지백을 제공할 수 있습니다. 각 분석 클러스터의 크기를 가성비 요구 사항에 따라 조정할 수 있고 새 워크로드를 손쉽게 온보딩할 수 있습니다.

    워크로드 격리 및 요금 부과
  • 그룹 간 협업
  • 그룹 간 협업

    개별 Amazon Redshift 클러스터를 유지 관리하는 여러 비즈니스 그룹 간에 데이터를 공유하여 더 넓은 범위의 분석 및 데이터 과학 작업에서 협업할 수 있습니다. 각 Amazon Redshift 클러스터를 일부 데이터의 생산자로 사용하고 다른 데이터 집합의 소비자로 사용할 수 있습니다.

    그룹 간 협업
  • 서비스형 데이터 및 분석
  • 서비스형 데이터 및 분석

    조직의 여러 그룹 및 조직 경계 외부의 외부 당사자와 데이터를 서비스 형태로 공유할 수 있습니다.

    서비스형 데이터 및 분석
  • 개발 민첩성
  • 개발 민첩성

    스냅샷을 생성하고 완전히 복원할 필요 없이 원하는 세분화 수준으로 개발, 테스트 및 프로덕션 환경 간에 데이터를 공유할 수 있습니다.

    개발 민첩성

고객 성공 사례

home24

FactSet

"많은 FactSet 고객이 비용을 줄이고 인프라 및 공급 업체와 통합하며 중복된 데이터를 없애기 위한 일환으로 클라우드 전환 및 기술 현대화 프로그램을 시작하고 있습니다. 고객의 진화하는 요구 사항을 충족하기 위해 FactSet은 AWS Redshift를 포함하여 선호하는 여러 워크플로 환경에 원활하게 통합할 수 있는 유연한 솔루션을 제공하여 자사 콘텐츠와 솔루션을 바로 이용할 수 있도록 지원합니다. FactSet의 표준 데이터 피드는 Redshift의 데이터 공유 기능을 활용하여 클라이언트의 Redshift 클러스터에서 바로 사용 가능합니다. 이를 기반으로 모든 ETL 프로세스를 FactSet에 아웃소싱할 수 있으므로, 데이터를 간소화하고 출시 시간을 단축하며 보다 효율적인 데이터 무결성과 데이터 검색, 연결 및 테스트를 위한 단순화된 프로세스를 이용할 수 있습니다.

Namita Jain, 클라우드 및 관리형 서비스 부문 제품 소유자

home24

Epsilon

"데이터를 공유하기 전에 Amazon Redshift를 사용하여 클라이언트와 데이터를 교환하는 프로세스는 생각보다 효율적이지 않았습니다. 보통 주당 2번 2개의 클러스터를 구동하고, 복원, 언로드, 복사, 스키마 삭제 및 권한 부여를 수행했습니다. 데이터 공유를 사용하면 가동 중단이 거의 또는 전혀 없이 클라이언트와 데이터를 공유할 수 있습니다. 훨씬 더 길었던 프로세스를 10개 미만의 SQL 문만으로 안전하게 아카이빙합니다. 이 기능은 더 많은 유연성을 지원하며 시간과 비용을 절감하고 클라이언트 만족도를 높여줍니다."

Samantha Corkery, Epsilon 수석 데이터베이스 관리자

Warner Bros.

Warner Bros.

“Warner Bros. Games에서는 단일 게임 클러스터와 비즈니스 기능을 위한 통합 클러스터에 걸친 데이터 이동을 관리하기 위해 복잡한 데이터 모빌리티 인프라를 구축하고 유지 관리합니다. 그러나 이 시스템을 개발하고 유지 관리하는 데 유용한 팀 리소스가 허비되는 탓에 지연이 발생하고 결국 빠르고 민첩하게 데이터를 처리할 수 없게 됩니다. Redshift 데이터 공유 기능을 사용하면 Redshift 클러스터 간의 데이터 복사, 이동 및 로드를 위해 구축한 전체 하위 시스템을 없앨 수 있습니다. 그러면 모든 비즈니스 팀에서 적절한 데이터 집합을 기반으로 빠르고 효율적으로 의사 결정을 내릴 수 있습니다. 뿐만 아니라 Redshift 데이터 공유를 사용하면 각 비즈니스 팀에서 SQL 워크로드를 실행하는 데 필요한 리소스에 맞춰 컴퓨팅 프로비저닝 아키텍처를 변경할 수 있으므로 결과적으로 인프라 운영이 간소화됩니다.”

Kurt Larson, Warner Bros. 분석 부문 기술 이사

Yelp

Yelp

“데이터 공유 기능을 사용하면 여러 Redshift 클러스터에서 RA3 클러스터와 관리형 스토리지에 위치한 데이터를 쿼리할 수 있습니다. 따라서 데이터가 지연 없이 팀에 제공되며 복제되는 데이터의 양과 이로 인한 백필 문제가 줄어듭니다. 이제 Redshift의 데이터를 활용하는 데 더 많은 시간을 집중하고 데이터 오케스트레이션이 아닌 협업을 개선하는 데 주력할 수 있습니다.”

Steven Moy, Yelp 엔지니어

Fannie Mae

Fannie Mae

“Fannie Mae는 많은 애플리케이션에 걸쳐 있는 수십 개의 Amazon Redshift 클러스터를 통해 데이터 웨어하우스를 분산식으로 관리합니다. 각 팀에서 자체 데이터 집합을 관리하지만 사용 사례에 따라 애플리케이션에서 다른 애플리케이션의 데이터 집합을 쿼리하고 로컬에 있는 데이터를 결합해야 할 수 있습니다. 현재는 데이터를 언로드하고 클러스터 간에 이동해야 하기 때문에 팀에서 적시에 데이터에 액세스하지 못합니다. 언로드 작업으로 인해 생산자 클러스터에서 리소스 소비가 급증하는 문제도 있었습니다. 데이터 공유를 사용하면 Amazon S3로 언로드하는 이 중간 과정을 생략하여 시간을 절약하고 소비를 낮출 수 있습니다. 많은 애플리케이션에서 현재 데이터 집합을 공유하기 위해 언로드를 수행하고 있는데 앞으로 새로운 데이터 공유 기능을 활용하는 쪽으로 이 모든 프로세스를 전환할 계획입니다. 데이터 공유를 사용하면 여러 애플리케이션 팀에서 데이터를 원활하게 공유하고 ETL 없이 공통된 보기에서 데이터를 볼 수 있습니다. 또한 사전 프로덕션, 연구 및 프로덕션 환경 간에 각 애플리케이션에 사용할 데이터를 복사하지 않아도 됩니다. 데이터 공유 기능을 사용한 후로 민첩성이 개선되었고 Fannie Mae와 같이 고도로 분산된 환경에서 분석을 유연하게 조정할 수 있게 되었습니다.”

Amy Tseng, Fannie Mae 엔터프라이즈 데이터베이스 관리자

home24

Home24

“공유 스토리지를 사용한 후로 최종 사용자에게 데이터를 제공하는 더 중요한 일에 집중할 수 있게 되었습니다. 이제 수많은 스토리지 미디어 또는 형식에 데이터가 갇히지 않습니다. 일부 API만 사용하여 액세스할 수 있었던 이전과 달리 이제는 단일 버전의 SQL에서 데이터에 액세스할 수 있습니다.”

Marco Couperus, home24 엔지니어링 관리자

리소스

블로그

Amazon Redshift 교차 계정 데이터 공유

블로그

Amazon Redshift 클러스터에서 Amazon Redshift 데이터를 안전하게 공유하여 워크로드를 격리

블로그

Amazon Redshift에서 데이터 공유를 사용하여 다중 테넌트 패턴 구현

동영상

Amazon Redshift Cross-Account Data Sharing

동영상

Amazon Redshift 데이터 공유 사용 사례

동영상

AWS on air: Amazon Redshift 데이터 공유 및 격리

동영상

Amazon Redshift 데이터 공유 다중 테넌트 패턴

Amazon Redshift 시작하기

Amazon Redshift 시작 안내서
시작 안내서 살펴보기

이러한 단계를 따라 샘플 데이터를 로드하고 Amazon Redshift로 분석을 시작합니다.

자세히 알아보기 
무료 AWS 계정에 가입
무료 계정에 가입

AWS 프리 티어에 즉시 액세스할 수 있습니다. 

가입하기 
Amazon Redshift 실습
실습을 통해 실제 경험 확보

Amazon Redshift를 통해 경험을 최대한 활용할 수 있는 팁과 기법을 배웁니다.

시작하기