Amazon Web Services 한국 블로그

Amazon Redshift를 위한 계정간 데이터 공유 기능 출시

 

오늘날 빠르게 변화하는 세상에서 성공을 거두려면 기업은 데이터를 신속하게 분석하고 의미 있는 작업을 시행해야 합니다. 많은 고객들이 데이터 중심 조직이 되기 위해 이러한 개념을 받아들이고 있습니다.

데이터 중심 조직은 데이터를 자산으로 취급하고 이를 사용하여 통찰력을 향상시키고 더 나은 의사 결정을 내립니다. 보안 시스템을 사용하여 데이터를 수집, 저장 및 처리하고 조직 내 사람들과 공유함으로써 데이터가 가진 힘을 최대한 활용할 수 있습니다. 일부는 데이터 및 분석을 고객, 파트너 및 외부 당사자에게 서비스로 제공하여 새로운 수익원을 창출합니다.

모든 이해 관계자는 정확한 동일 데이터를 단일 진실 공급원으로 공유하고 사용하기를 원합니다. 또한 성능 저하 없이 데이터의 실시간 뷰를 동시에 쿼리하고 필요할 때 정확한 정보에 액세스할 수 있기를 원합니다.

클라우드용으로 구축된 최초의 데이터 웨어하우스인 Amazon Redshift는 많은 고객 데이터 아키텍처의 데이터 웨어하우스 구성 요소로 널리 사용되고 있습니다.

Amazon Redshift 사용자는 AWS 계정 사용자와 데이터를 공유할 수 있지만, 다른 AWS 계정과 데이터를 공유하고 협업하려면 한 시스템에서 데이터를 추출하여 다른 시스템으로 로드해야 했습니다.

이 작업을 수행하는 데 필요한 다양한 추출, 변환 및 로드 작업을 구축하고 유지하는 데는 많은 수작업이 필요합니다. 데이터 공유가 확장되고 더 많은 이해 관계자가 데이터를 필요로 함에 따라 복잡성이 커집니다. 따라서 데이터를 안전하게 관리하는 데 필요한 모니터링, 규정 준수 및 보안 모범 사례를 유지하기가 어려워질 수 있습니다.

또한 이러한 공유 방식은 데이터에 대한 최신의 완전한 관점을 제공하지 못합니다. 수동 프로세스로 인해 지연과 데이터 불일치가 발생하여 오래된 데이터, 품질이 낮은 비즈니스 결과 및 고객에 대한 응답 속도가 느려지는 결과가 초래되기 때문입니다.

그래서 Amazon Redshift를 위한 교차 계정 데이터 공유를 개발하였습니다.

Amazon Redshift를 위한 계정간 데이터 공유 소개
이 새로운 기능을 사용하면 Amazon Redshift 데이터 웨어하우스의 새롭고 완전하며 일관된 데이터를 AWS 계정 전반에 원하는 수의 이해 관계자와 간단하고 안전하게 공유할 수 있습니다. 이를 통해 규정 준수 및 보안 요구 사항을 충족하면서 조직 간에 데이터를 공유하고 외부 당사자와 협업할 수 있습니다.

Amazon Redshift는 IAM 통합, 시스템 테이블 및AWS CloudTrail을 사용하여 포괄적인 보안 제어 및 감사 기능을 제공합니다. 이를 통해 고객은 소비자의 데이터 공유 권한 및 사용량을 제어 및 모니터링하고 필요할 때 즉시 액세스를 취소할 수 있습니다.

데이터베이스, 스키마, 테이블, 뷰, 열 및 사용자 정의 함수 등 여러 수준에서 데이터를 공유하여 Amazon Redshift 데이터에 액세스해야 하는 사용자와 비즈니스에 맞게 세분화된 액세스 제어를 제공할 수 있습니다.

교차 계정 데이터 공유의 작동 방식을 살펴보겠습니다.

두 계정에서 데이터 공유

교차 계정 데이터 공유는 2단계 프로세스입니다. 먼저 프로듀서 클러스터 관리자가 데이터 공유를 생성하고 객체를 추가하며 소비자 계정에 대한 액세스 권한을 부여합니다. 두 번째로 프로듀서 계정 관리자는 지정된 소비자에 대한 데이터 공유를 승인합니다. 이 작업은 Amazon Redshift 콘솔에서 수행할 수 있습니다.

시작하려면Amazon Redshift 콘솔에서 AmazonRedshift 클러스터를 생성한 다음 샘플 데이터를 가져옵니다. 클러스터를 사용할 수 있으면 클러스터 세부 정보 페이지로 이동하여 Datashares 탭을 선택한 다음 Create datashare를 선택합니다.

 

Create datashare 페이지에서 데이터 공유 이름을 입력한 다음 데이터베이스를 선택합니다. 공개적으로 액세스 가능한 클러스터와 데이터 공유를 원하기 때문에 공개 액세스 가능에서 Enable을 선택합니다.

그런 다음 데이터 공유에 포함시킬 데이터베이스의 객체를 선택합니다. 다른 사람들과 공유하기로 선택한 내용을 세밀하게 제어할 수 있습니다. 간단히 모든 테이블을 공유하도록 하겠습니다. 실제로는 하나 이상의 테이블, 뷰 또는 사용자 정의 함수를 선택할 수 있습니다.

마지막으로 해야 할 일은 데이터 공유에 AWS 계정을 추가하는 것입니다. 두 번째 AWS 계정 ID를 추가한 다음Create datashare를 선택합니다.

방금 만든 데이터 소비자에게 권한을 부여하려면 콘솔의 Datashares 섹션에서 Authorize를 선택합니다. Consumer statusPending authorization에서Authorized로 변경됩니다. 데이터 공유가 설정되었으므로 보조 계정으로 전환하여 소비자 AWS 계정에서 데이터 공유의 사용 방법을 보여 드리겠습니다. 교차 계정 데이터 공유가 리전 간에 작동하지 않으므로 보조 계정에서 동일한 리전을 사용해야 한다는 점에 유의해야 합니다.

프로듀서와 마찬가지로 데이터 소비 프로세스가 있습니다. 먼저 데이터 공유를 소비자 계정의 하나 이상의 클러스터와 연결해야 합니다. 또한 소비자 계정의 현재 및 향후 클러스터가 해당 공유에 액세스할 수 있도록 데이터 공유를 전체 소비자 계정에 연결할 수 있습니다.

보조 계정에 로그인하고 콘솔의 Datahares 섹션으로 이동합니다.  From other accounts 탭을 선택한 다음 프로듀서 AWS 계정에서 공유한 news_blog_datashare를 선택합니다. 그런 다음Associate를 선택하여 데이터 공유를 내 계정의 클러스터와 연결합니다.

클러스터의 세부 정보 페이지에서 Create database from datashare를 선택한 다음 새 데이터베이스의 이름을 입력합니다.

쿼리 편집기에서 데이터베이스를 선택하고 데이터 공유의 일부로 사용 가능한 모든 객체에 대해 쿼리를 실행합니다.

Run을 선택하면 쿼리에서 데이터가 반환됩니다. 기억해야 할 중요한 점은 이것이 데이터의 라이브 뷰라는 것입니다. 프로듀서 데이터베이스의 모든 변경 사항은 내 쿼리에 반영됩니다. 복사 또는 수동 전송이 필요하지 않습니다.

주요 사항

교차 계정 데이터 공유에 대한 몇 가지 흥미로운 사실은 다음과 같습니다.

보안 — 권한 부여 및 연결에 필요한 모든 권한은AWS Identity and Access Management(IAM)로 관리되므로 IAM 정책을 생성하여 각 사용자가 완료할 수 있는 작업을 제어할 수 있습니다. 보안 고려 사항은 Controlling access for cross-account datashares를 참조하십시오.

암호화 — 프로듀서와 소비자 클러스터는 모두 동일한 AWS 리전에 암호화되어야 합니다.

리전 – 교차 개정 데이터 공유는 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(캘리포니아 북부), 미국 서부(오레곤), 아시아 태평양(뭄바이), 아시아 태평양(서울), 아시아 태평양(싱가포르), 아시아 태평양(시드니), 아시아 태평양(도쿄), 캐나다(중부), 유럽(프랑크푸르트), 유럽(아일랜드), 유럽(런던), 유럽(파리) 및 남아메리카(상파울루)의 모든 Amazon Redshift RA3 노드 유형에 사용 가능합니다.

요금 — 교차 계정 데이터 공유는 동일한 리전에 있는 클러스터 전체에서 사용할 수 있습니다. 데이터를 공유하는 데 드는 비용은 없습니다. 고객은 공유에 참여하는 Redshift 클러스터에 대해서만 비용을 지불하면 됩니다.

지금Amazon Redshift를 위한 교차 계정 데이터 공유를 사용해 보세요.

이 새로운 기능은 지금 바로 사용할 수 있습니다. 클러스터를 만들고 교차 계정 데이터 공유를 시도해 보세요. 시작 방법에 대한 자세한 내용은Sharing data across AWS accounts를 참조하십시오. 진행 상황을 알려 주십시오.

행복한 공유 되십시오!

— Martin