AWS Clean Rooms FAQ

일반

AWS Clean Rooms는 고객과 파트너가 서로에게 기본 데이터를 공개하지 않고 더 간편하게 공동 데이터 세트를 분석하고 협업하여 새로운 인사이트를 얻을 수 있는 신규 서비스입니다. 파트너와 협력하여 몇 단계만에 고유 클린 룸을 생성하고 공동 데이터 세트 분석을 시작할 수 있습니다. AWS Clean Rooms에서는 데이터를 AWS 외부로 이동하거나 다른 플랫폼으로 로드할 필요 없이 이미 AWS를 사용하는 수십만 개의 회사와 간편하게 협업할 수 있습니다.

AWS Management Console에서 수행할 분석 유형, 협업할 파트너, 협업에 기여할 데이터 세트를 선택할 수 있습니다. AWS Clean Rooms를 사용하면 SQL 쿼리와 기계 학습이라는 두 가지 유형의 분석을 수행할 수 있습니다.

SQL 쿼리를 실행하면 AWS Clean Rooms가 데이터의 상주 위치에서 데이터를 읽고 기본 제공되는 유연한 분석 규칙을 적용하므로 데이터를 손쉽게 제어할 수 있습니다. AWS Clean Rooms는 개인 정보 보호를 개선하는 광범위한 SQL 제어 기능 세트를 제공합니다. 예를 들어 쿼리 제어, 쿼리 출력 제한 및 쿼리 로깅 등과 같은 제어 기능을 사용하여 각 클린 룸 참가자가 실행하는 쿼리에 대한 제한을 사용자 지정할 수 있습니다. 사용자 지정 분석 규칙을 선택한 다음 차등 개인정보보호 파라미터를 구성하여 AWS Clean Rooms Differential Privacy(평가판)를 사용할 수도 있습니다. Differential Privacy를 사용하면 클릭 몇 번으로 수학적으로 뒷받침되는 직관적인 제어를 통해 사용자의 개인 정보를 보호할 수 있습니다. 그리고 Cryptographic Computing for Clean Rooms(C3R)는 SQL 분석 중 민감한 데이터를 암호화하는 데 유용합니다.

고객과 파트너는 AWS Clean Rooms ML을 통해 개인 정보 보호 강화 기계 학습(ML)을 적용하여 원시 데이터를 서로 공유하지 않고도 예측 인사이트를 생성할 수 있습니다. AWS Clean Rooms ML 유사 모델링을 사용하면 데이터를 사용해 사용자 정의 모델을 훈련시키고, 파트너에게 소량의 레코드 샘플을 공동 작업에 가져오도록 초대하여 사용자와 파트너의 기본 데이터를 보호하는 동시에 유사한 레코드 세트를 확장 생성할 수 있습니다. 의료 서비스 모델링은 앞으로 몇 달 내에 출시될 예정입니다.

AWS Clean Rooms ML은 전자 상거래, 스트리밍 비디오 등 다양한 데이터 세트에서 구축 및 테스트되었으며, 대표적인 업계 기준과 비교할 때 고객이 유사 모델링의 정확도를 최대 36% 향상할 수 있도록 지원합니다. 신규 고객 발굴과 같은 실제 애플리케이션에서 이러한 정확도 향상은 수백만 USD의 비용 절감으로 이어질 수 있습니다.

AWS Clean Rooms 협업은 협업 구성원이 파트너와 원시 데이터를 공유하지 않고도, SQL 쿼리를 실행하고 ML 모델링을 수행할 수 있는 안전한 논리적 경계입니다. 협업에 초대된 기업만 협업에 참여할 수 있습니다. 여러 참가자가 협업에 데이터를 제공할 수 있고, 한 구성원이 결과를 얻을 수 있습니다. 초대받은 기업만 AWS Clean Rooms 협업에 참여할 수 있습니다.

AWS Management Console 또는 API 작업을 사용하여 클린 룸 협업을 생성하고, 협업할 회사를 초대하며, 협업 작업에서 각 참가자의 기능을 선택합니다. 그런 다음 참가자는 정형 데이터를 쿼리하는 방법에 대한 규칙을 설정하고 데이터에 대해 ML 모델을 훈련시킬 수 있습니다. 데이터 세트는 참가자 계정에서 복사되지 않으며 필요할 때만 액세스할 수 있습니다. AWS Clean Rooms를 사용하면 SQL 쿼리와 AWS Clean Rooms ML을 사용한 기계 학습 모델링 등 수행할 분석 유형을 선택할 수 있습니다. SQL 쿼리를 사용하는 경우에는 노코드 분석 빌더, AWS Clean Rooms Differential Privacy, 암호화 컴퓨팅과 같은 추가 기능도 사용할 수 있습니다. 협업 참여자가 데이터 또는 모델을 협업에 연결하고 분석을 실행하면 협업 결과는 지정된 Amazon Simple Storage Service(S3) 버킷에 저장됩니다.

AWS Clean Rooms는 협업당 최대 5명의 참가자를 지원합니다.

고객은 AWS Clean Rooms 협업에 참여할 수 있는 구성원을 제어하고 협업을 생성하거나 협업 초대에 참여할 수 있습니다. 참여는 협업의 각 당사자에게 투명하며 협업이 생성된 후에는 새 계정을 추가할 수 없습니다. 그러나 필요한 경우 다른 고객 또는 파트너와 새로운 협업을 설정할 수 있습니다. 귀하는 자신의 콘텐츠에 대한 액세스를 설정 및 관리하고 자신이 제어하는 사용자, 그룹, 권한 및 보안 인증을 통해 AWS 서비스 및 리소스에 대한 액세스도 관리합니다.

고객은 기본 데이터를 공유하거나 공개하지 않고도 파트너와 함께 협업 데이터 세트에서 SQL 또는 AWS Clean Rooms ML 모델링을 사용하여 인사이트를 얻을 수 있습니다.

SQL을 사용하면 여러 협업자가 데이터를 제공할 수 있지만 단 한 명의 협업자만 SQL 쿼리를 실행하고 결과를 얻을 수 있습니다. 협업에 참여할 때 공동 작업자는 쿼리를 실행할 대상, 결과를 받을 대상, 컴퓨팅 요금을 부담할 당사자에 대해 합의합니다. 협업에 초대한 사람만 설정한 분석 규칙에 따라 인사이트를 얻을 수 있습니다. AWS Clean Rooms 협업을 설정할 때 특정 사용 사례에 적합하도록 각 협업 구성원별로 다른 기능을 지정할 수 있습니다. 예를 들어, 쿼리 출력을 다른 구성원에게 보내려면 한 구성원을 쿼리를 작성할 수 있는 쿼리 실행자로 지정하고 다른 구성원을 결과를 수신할 수 있는 쿼리 결과 수신자로 지정하면 됩니다. 이를 통해 협업 생성자가 쿼리할 수 있는 구성원이 쿼리 결과에 접근하지 못하도록 할 수 있습니다.

AWS Clean Rooms ML을 사용하면 협업자가 파트너의 유사 세그먼트를 찾을 수 있는 샘플 레코드 세트를 제공하고, 상대방은 샘플 레코드와의 유사성을 기반으로 유사 세그먼트를 생성할 수 있는 더 큰 모집단 레코드 세트를 보유할 수 있습니다. AWS Clean Rooms ML은 유사 세그먼트의 시작점이 되는 더 큰 모집단 레코드 세트를 제공하는 당사가 지정한 대상으로 출력 유사 세그먼트를 보냅니다.

AWS Clean Rooms는 ID에 종속되지 않으며, 사용자가 선택한 공통 키(예: 가명화된 식별자)를 사용하여 자신의 데이터를 파트너의 데이터와 일치시킬 수 있습니다. SQL의 자체 매칭 로직을 구현하거나 파트너 솔루션 중 하나를 사용할 수 있습니다. AWS Entity Resolution을 사용하여 자체 데이터를 조정하여 AWS Clean Rooms 협업에서 매칭을 간소화할 수 있습니다.

AWS Clean Rooms는 미국 동부(오하이오), 미국 동부(버지니아 북부), 미국 서부(오레곤), 아시아 태평양(서울), 아시아 태평양(싱가포르), 아시아 태평양(시드니), 아시아 태평양(도쿄), 유럽(프랑크푸르트), 유럽(아일랜드), 유럽(런던) 및 유럽(스톡홀름)에서 사용할 수 있습니다.

AWS Clean Rooms를 사용하면 유연한 SQL 분석 규칙과 개인 정보 보호 강화 ML을 통해 비즈니스 요구 사항을 충족할 수 있습니다. SQL 분석을 사용하면 클린 룸 처리 단위(CRPU) 시간에 따라 협업에서 실행되는 SQL 쿼리의 컴퓨팅 용량에 대해 초당 기준(최소 60초 요금 부과)으로 지불할 협업자를 유연하게 선택할 수 있습니다. AWS Clean Rooms ML을 사용하는 경우 요청한 모델 훈련 및 생성한 유사 세그먼트에 대해서만 프로필 1,000개당 요금을 지불하면 됩니다. 자세한 내용은 AWS Clean Rooms 요금을 참조하세요.

AWS Clean Rooms ML

AWS Clean Rooms ML은 사용자와 파트너가 집단 데이터에 ML 모델을 적용하여 민감한 정보를 서로 공유하지 않고도 예측 인사이트를 얻을 수 있도록 지원합니다. AWS Clean Rooms 기능을 사용하면 파트너를 클린룸에 초대하고 각 협업에 즉시 사용이 가능한 훈련된 AWS 관리형 ML 모델을 적용하여 몇 단계만으로 유사 데이터 세트를 생성할 수 있으므로 자체 모델을 구축, 학습, 조정, 배포하는 데 소요되는 수개월의 개발 작업을 절약할 수 있습니다.

AWS Clean Rooms은 다양한 사용 사례를 가진 고객을 지원합니다. 예를 들어, 항공사는 고객에 대한 데이터를 활용하고 온라인 예약 서비스와 협업하여 유사한 특성을 가진 잠재 여행객을 파악할 수 있으며, 자동차 대출 기관과 보험사는 기존 리스 소유자와 특성이 유사한 잠재적인 보험 고객을 파악하고, 브랜드와 퍼블리셔는 서로의 기본 데이터를 공유하지 않고도 시장 내 고객의 유사 세그먼트를 모델링하고 관련성이 높은 광고 경험을 제공할 수 있습니다. 의료 서비스 모델링은 앞으로 몇 달 내에 출시될 예정입니다.

AWS Clean Rooms ML은 전자 상거래, 스트리밍 비디오 등 다양한 데이터 세트에서 구축 및 테스트되었으며, 대표적인 업계 기준과 비교할 때 고객이 유사 모델링의 정확도를 최대 36% 향상할 수 있도록 지원합니다. 신규 고객 발굴과 같은 실제 애플리케이션에서 이러한 정확도 향상은 수백만 USD의 비용 절감으로 이어질 수 있습니다.

AWS Clean Rooms ML 유사 모델링을 사용하면 데이터를 사용해 사용자 정의 모델을 훈련시키고, 파트너에게 소량의 레코드 샘플을 공동 작업에 가져오도록 초대하여 사용자와 파트너의 기본 데이터를 보호하는 동시에 유사한 레코드 세트를 확장 생성할 수 있습니다. AWS Clean Rooms ML은 한 협업자가 작은 레코드 샘플을 가져와서 다른 협업자의 데이터 세트에서 훨씬 더 큰 레코드 세트 또는 유사 세그먼트를 찾습니다. AWS Clean Rooms ML은 어느 협업자와도 데이터를 공유하지 않으며, 모든 협업자는 언제든지 데이터를 제거하거나 사용자 지정 모델을 삭제할 수 있습니다. 결과 유사 세그먼트에 원하는 크기를 지정하면 AWS Clean Rooms ML이 샘플 목록의 고유 프로필을 파트너 데이터 세트의 프로필과 비공개로 매칭한 다음 협력자의 데이터 세트에 있는 각 프로필이 내 샘플의 프로필과 얼마나 유사한지 예측하는 ML 모델을 훈련시킵니다. AWS Clean Rooms ML은 샘플 목록과 유사한 프로필을 자동으로 그룹화하고 이를 통해 생성된 유사 세그먼트를 출력합니다. AWS Clean Rooms ML을 사용하면 ML 모델을 구축, 훈련 및 배포하기 위해 파트너와 데이터를 공유할 필요가 없습니다. AWS Clean Rooms ML 사용 시 데이터는 모델의 훈련에만 사용되며 AWS 모델 훈련에는 사용되지 않습니다. 사용자와 파트너가 모델의 예측 결과를 조정하는 데 도움이 되는 직관적인 제어를 사용할 수 있습니다.

보안 및 데이터 보호

데이터 보호는 AWS의 보안 기반에서 시작되며, AWS Clean Rooms는 AWS Identity and Access Management(AWS IAM), AWS Key Management Service(AWS KMS), AWS CloudTrail 등 AWS 보안 서비스를 기반으로 구축됩니다. 이를 통해 기존 데이터 보호 전략을 데이터 협업 워크로드로 확장할 수 있습니다. AWS Clean Rooms를 사용하면 소비자 인사이트, 마케팅 측정, 예측 또는 위험 평가를 위한 분석을 수행하기 위해 더 이상 데이터 사본을 AWS 환경 외부에 저장 또는 유지하고 다른 당사자에게 전송할 필요가 없습니다.

AWS Clean Rooms 협업을 설정하고 SQL 분석을 사용할 때 특정 사용 사례에 적합하도록 각 협업 구성원별로 다른 기능을 지정할 수 있습니다. 예를 들어, 쿼리의 출력을 다른 구성원에게 보내려면 한 구성원을 쿼리를 작성할 수 있는 쿼리 실행자로 지정하고 다른 구성원을 결과를 수신할 수 있는 쿼리 결과 수신자로 지정하면 됩니다. 이를 통해 협업 생성자가 쿼리할 수 있는 구성원이 쿼리 결과에 접근하지 못하도록 할 수 있습니다.

AWS Clean Rooms는 SQL 쿼리 제어 기능도 제공하여 분석 규칙 구성을 통해 데이터 테이블에서 실행할 수 있는 쿼리의 종류나 특정 쿼리를 제한할 수 있습니다. AWS Clean Rooms는 세 가지 유형의 SQL 분석 규칙, 즉 집계, 목록 및 사용자 지정을 지원합니다. 집계 분석 규칙을 사용하면 집계 통계를 생성하는 쿼리(예: 캠페인 측정 또는 기여)만 허용하도록 테이블을 구성할 수 있습니다. 목록 분석 규칙을 사용하면 쿼리가 자신의 데이터 세트와 쿼리를 실행할 수 있는 구성원의 데이터 세트의 교집합만 분석할 수 있도록 제어를 구성할 수 있습니다. 사용자 지정 분석 규칙을 사용하면 데이터 세트에서 특정 계정이나 쿼리를 실행할 수 있도록 쿼리 수준 제어를 구성할 수 있습니다. 사용자 지정 분석 규칙을 사용할 때 Differential Privacy를 사용하도록 선택할 수 있습니다. AWS Clean Rooms Differential Privacy를 사용하면 몇 단계로 수학적으로 뒷받침되는 직관적인 제어를 통해 사용자의 개인 정보를 보호할 수 있습니다. AWS Clean Rooms은 완전관리형이므로 이전에 차등 개인정보보호를 적용해 본 적이 없더라도 사용자 재식별을 방지할 수 있습니다. 또 다른 제어 기능은 집계 임계값입니다. 집계 임계값은 쿼리가 잠재적으로 재식별이 가능한 작은 그룹으로 드릴다운하는 것을 방지합니다.

AWS Clean Rooms ML 사용 시 데이터는 모델의 훈련에만 사용되며 AWS 모델 훈련에는 사용되지 않습니다. AWS Clean Rooms ML은 한 회사의 훈련 또는 유사 세그먼트 데이터를 다른 회사와 공유하지 않으므로 언제든지 모델 및 훈련 데이터를 삭제할 수 있습니다.

아니요. 데이터 세트는 협력자의 AWS 계정에 저장됩니다. AWS Clean Rooms는 협업자 계정의 데이터를 임시로 읽어 쿼리를 실행하거나 ML 모델에 대한 훈련을 수행하거나 시드 세그먼트를 확장합니다. 분석 결과는 분석을 위해 설계된 S3 위치로 전송됩니다.

AWS Clean Rooms ML에서 생성한 모델은 서비스에 저장되고, 고객 관리형 AWS KMS 키로 암호화할 수 있으며, 고객이 언제든지 삭제할 수 있습니다.

AWS Clean Rooms 암호화 및 분석 규칙을 사용하면 공유하려는 정보의 유형을 세부적으로 제어할 수 있습니다. 데이터 협업자는 재식별 위험을 포함하여 각 협업의 위험을 평가하고 데이터 프라이버시 법규를 준수하기 위해 추가 실사를 실시할 책임이 있습니다. 공유하는 데이터가 민감하거나 규제 대상인 경우 적절한 법적 계약 및 감사 메커니즘을 사용하여 추가로 개인 정보 위험을 축소하는 것이 좋습니다.

예. AWS 서비스 약관에서는 AWS Clean Rooms 협업에 대한 특정 사용 사례를 제한합니다.

예. AWS HIPAA 규정 준수 프로그램에는 AWS Clean Rooms가 HIPAA 적격 서비스로 포함되어 있습니다. AWS와 BAA(Business Associate Addendum)가 체결되어 있다면 이제 AWS Clean Rooms를 사용하여 HIPAA 규정을 준수하는 협업을 생성할 수 있습니다. BAA가 없거나 HIPAA 규정 준수 애플리케이션에 AWS를 사용하는 방법에 대해 질문이 있는 경우 Amazon에 문의하여 자세히 알아보시기 바랍니다. 자세한 내용은 AWS HIPAA 규정 준수AWS for Healthcare and Life Sciences를 참조하세요.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

SQL 분석

SQL 분석 규칙에서는 쿼리에서 각 열을 사용하는 방법을 정의하는 데 도움이 되는 열 수준 제어를 구성합니다. 예를 들어, 집계 통계를 계산하기 위한 용도로 사용할 수 있는 열(예: SUM(price))과 다른 협업 구성원과 테이블의 조인을 수행하기 위한 용도로 사용할 수 있는 열을 지정할 수 있습니다. 집계 분석 규칙에서 각 출력 행이 충족해야 하는 최소 집계 임계값을 정의할 수도 있습니다. 최소 임곗값을 충족하지 않는 행은 AWS Clean Rooms가 자동으로 필터링합니다.

예. Amazon CloudWatch Logs에 쿼리 로그를 게시하도록 AWS Clean Rooms를 구성할 수 있습니다. 사용자 지정 분석 규칙을 사용하면 협업에서 실행되기 전에 쿼리(분석 템플릿에 저장됨)를 검토할 수도 있습니다. 

AWS Clean Rooms Differential Privacy

차등 개인정보보호는 데이터 프라이버시 보호를 지원하는 수학적으로 검증된 프레임워크입니다. 차등 개인정보보호의 주요 이점은 분석 중인 데이터 세트에서 특정 개인의 존재 여부를 가리기 위해 통제된 양의 무작위성(노이즈)을 추가하여 개인 수준에서 데이터를 보호하는 데 도움이 된다는 것입니다.

AWS Clean Rooms Differential Privacy를 사용하면 몇 단계로 수학적으로 뒷받침되는 직관적인 제어를 통해 사용자의 개인 정보를 보호할 수 있습니다. AWS Clean Rooms은 완전관리형이므로 이전에 차등 개인정보보호를 적용해 본 적이 없더라도 사용자 재식별을 방지할 수 있습니다. AWS Clean Rooms Differential Privacy는 협업에서 집계 인사이트를 생성하는 데 있어 개인 데이터의 기여도를 난독화하여, 다양한 SQL 쿼리를 실행해 광고 캠페인, 투자 결정, 임상 연구 등과 관련한 인사이트를 생성할 수 있도록 합니다.

데이터 제공 권한이 있는 구성원으로 AWS Clean Rooms 협업을 시작하거나 참여한 후 몇 단계만 거치면 AWS Clean Rooms Differential Privacy의 사용을 시작할 수 있습니다. AWS Glue 데이터 카탈로그의 테이블을 참조하는 구성 테이블을 생성한 다음 차등 개인정보보호를 활성화하고 구성된 테이블에 사용자 지정 분석 규칙을 추가하기만 하면 됩니다. 그런 다음 구성된 테이블을 AWS Clean Rooms 협업에 연결하고 협업에서 차등 개인정보보호 정책을 구성하여 테이블을 쿼리할 수 있도록 합니다. 기본 정책을 사용하여 설정을 빠르게 완료하거나 특정 요구 사항에 맞게 사용자 지정할 수 있습니다.

AWS Clean Rooms Differential Privacy가 설정되면 협업 파트너는 차등 개인정보보호 개념에 대한 전문 지식이나 파트너의 추가적인 설정 없이도 테이블에서 쿼리를 실행할 수 있습니다. AWS Clean Rooms Differential Privacy를 사용하면 쿼리 실행기가 공통 테이블 표현식(CTE) 및 일반적으로 사용되는 집계 함수(예: COUNT 및 SUM)를 사용하여 복잡한 쿼리 패턴 등 유연한 사용자 지정 분석을 실행할 수 있습니다.

암호화 컴퓨팅

암호화 컴퓨팅은 민감한 데이터를 사용 중에 보호하고 암호화하는 방법입니다. 데이터는 저장(미사용) 시, 전송(이동) 중 및 사용 중일 때 암호화될 수 있습니다. 암호화는 일반 텍스트 데이터를 특정 ‘키’가 없으면 해독할 수 없는 인코딩된 데이터로 변환하는 것을 의미합니다. Private Set Intersection(PSI)은 데이터 세트를 보유한 둘 이상의 당사자가 계산을 수행하기 위해 암호화된 버전을 비교할 수 있는 암호화 컴퓨팅의 한 유형입니다. 암호화는 공유 협업자의 비밀 키를 사용하여 온프레미스에서 실행됩니다.

AWS Clean Rooms에는 AWS Clean Rooms 협업의 다른 참가자와 공유하는 비밀 키를 사용하여 클라이언트측 암호화 도구(SDK 또는 명령줄 인터페이스(CLI))를 통해 데이터를 사전 암호화하는 옵션을 제공하는 C3R이 포함됩니다. 이 도구는 쿼리가 실행될 때 데이터를 암호화합니다.