- 분석›
- AWS Clean Rooms›
- 기능
AWS Clean Rooms 기능
몇 분 만에 클린 룸을 생성합니다. 원시 데이터를 공유하지 않고도 파트너와 협업할 수 있습니다.
AWS Clean Rooms를 사용해야 하는 이유는 무엇인가요?
몇 단계만으로 자체 클린 룸을 만들고 참가자를 추가하여 협업 시작
기본 데이터를 공유하거나 공개하지 않고 어느 회사와도 협업할 수 있습니다
클린 룸에 대한 광범위한 프라이버시 강화 제어를 통해 기본 데이터를 보호
고객 레코드 연결 및 매칭, 유연한 분석 도구 사용, 파트너를 통해 ML 모델 훈련 및 배포
페이지 주제
다자간
모두 열기데이터가 있는 곳에서 데이터로 협업
모두 열기완전 프로그래밍 방식 액세스
모두 열기역할 구성 가능
모두 열기AWS Clean Rooms의 AWS Entity Resolution
모두 열기PySpark
모두 열기유연한 SQL
모두 열기분석 규칙은 데이터 분석 방법을 기본적으로 제어할 수 있는 제한 사항입니다. 지정된 쿼리 실행자로 협업을 생성하거나 협업에 참여하는 협업 멤버는 사용자가 설정한 분석 규칙에 따라 데이터 테이블을 교차하고 분석하는 쿼리를 작성할 수 있습니다. AWS Clean Rooms는 세 가지 유형의 분석 규칙, 즉 집계, 목록 및 사용자 지정을 지원합니다.
집계 분석 규칙: 집계 분석 규칙을 사용하면 두 데이터세트의 교집합 크기와 같은 집계 통계를 생성하는 쿼리를 실행할 수 있습니다. 집계 분석 규칙을 사용할 때 데이터에 대해 집계 쿼리만 실행할 수 있도록 하고 블라인드 일치에서만 사용해야 하는 열과 합계, 개수, 평균 등의 집계에 사용할 수 있는 열과 같이 실행되는 쿼리의 특정 부분에 대한 제한 사항을 적용할 수 있습니다. 또한 출력의 최소 집계 제약 조건을 제어할 수도 있습니다. 출력 행 반환 조건을 설정할 수 있는 최소 집계 제약 조건을 설정할 수도 있습니다. 이러한 제약 조건은 COUNT DISTINCT (Column) >= Threshold 형식입니다. 쿼리 결과의 출력 행이 제약 조건을 충족하지 않는 경우 결과 집합에서 출력 행이 제거됩니다. 이를 통해 최소 집계 임계값이 자동으로 적용되도록 하는 동시에 데이터 협업자가 원하는 쿼리를 작성할 수 있는 유연성을 제공할 수 있습니다.
목록 분석 규칙: 목록 분석 규칙을 사용하면 두 데이터세트의 겹침과 같은 여러 데이터세트 교집합의 행 수준 목록을 추출하는 쿼리를 실행할 수 있습니다. 목록 분석 규칙을 사용할 때 데이터에 대해 목록 쿼리만 실행할 수 있도록 하고, 블라인드 매치에서만 사용해야 하는 열, 출력에서 목록으로 출력할 수 있는 열 등 실행되는 쿼리의 제한 사항을 적용할 수 있습니다.
사용자 지정 분석 규칙: 사용자 지정 분석 규칙을 사용하면 CTE(일반 테이블 표현식) 및 창 함수와 같은 대부분의 ANSI 표준 SQL을 사용하여 사용자 지정 쿼리를 만들 수 있습니다. 또한, 협업 파트너가 쿼리를 실행하기 전에 쿼리를 검토 및 허용하고, 다른 협업자의 쿼리를 테이블에서 실행하기 전에 검토할 수도 있습니다. 사용자 지정 분석 규칙을 사용할 때 기본 제공 제어로 사용하여 분석 완료 후 쿼리 로그에 의존할 필요 없이 기본 데이터를 분석할 수 있는 방법을 미리 결정하거나 제한할 수 있습니다. 사용자 지정 SQL 쿼리를 사용할 때 분석 템플릿을 생성하거나 사용하여 협업에 파라미터와 함께 사용자 지정 쿼리를 저장할 수도 있습니다. 고객은 이를 통해 협업에서 더 쉽게 서로 도울 수 있습니다. 예를 들어 SQL 경험이 많은 멤버는 다른 멤버가 검토하고 실행할 수 있도록 템플릿을 만들 수 있습니다. 또한, 협업에서 재사용 가능한 분석이 용이해집니다. 또한, 사용자 지정 분석 규칙을 선택한 다음 차등 프라이버시 파라미터를 구성하여 AWS Clean Rooms Differential Privacy를 사용할 수도 있습니다.
암호화로 보호된 데이터에 대해 AWS Clean Rooms 쿼리를 실행할 수 있습니다. 민감한 데이터를 암호화하도록 요구하는 데이터 취급 정책이 있는 경우 쿼리가 실행되는 경우에도 데이터가 암호화되도록 협업별로 공유 암호화 키를 사용하여 데이터를 사전 암호화할 수 있습니다. 암호화 컴퓨팅은 협업 계산에 사용되는 데이터가 저장 시, 전송 중 및 사용 중(처리되는 동안) 암호화된 상태로 유지되도록 합니다.
Cryptographic Computing for Clean Rooms(C3R)는 CLI가 포함된 오픈 소스 Java SDK로, GitHub에서 사용할 수 있습니다. 이 기능은 추가 요금 없이 사용할 수 있습니다. 빅 데이터가 있는 경우 설명서를 검토하여 C3R을 Apache Spark에 통합하는 방법을 확인할 수 있습니다.
이 기능은 보안 및 규정 준수 요구 사항을 달성하는 동시에 AWS가 제공하는 유연성, 확장성, 성능 및 사용 편의성을 손쉽게 활용할 수 있도록 하는 광범위한 AWS 암호화 컴퓨팅 도구에 포함된 최신 기능입니다.
프라이버시 강화 ML
모두 열기AWS Clean Rooms ML을 사용하면 원시 데이터를 서로 공유할 필요 없이 사용자와 파트너가 프라이버시 강화 기계 학습(ML)을 적용하여 예측 인사이트를 생성할 수 있도록 지원합니다. AWS Clean Rooms ML은 맞춤형 및 유사 기계 학습(ML) 모델링을 지원합니다. 맞춤형 모델링을 사용하면 협업자 간에 기본 데이터나 지적 재산을 공유하지 않고도 훈련을 위한 맞춤형 모델을 가져오고 공동 데이터세트에 대한 추론을 실행할 수 있습니다. 유사 모델링을 사용하면 AWS에서 제작한 모델을 사용하여 파트너가 협업에 가져오는 소수의 프로필 샘플을 기반으로 유사한 프로필의 확장된 세트를 생성할 수 있습니다.
AWS Clean Rooms ML은 다양한 사용 사례를 가진 고객을 지원합니다. 예를 들어 광고주는 전용 모델과 데이터를 Clean Rooms 협업에 가져와서 퍼블리셔를 초대하여 캠페인 효과를 높이는 데 도움이 되는 사용자 지정 ML 모델을 훈련 및 배포할 수 있습니다. 금융 기관은 과거 거래 기록을 사용하여 사용자 지정 ML 모델을 훈련하고 Clean Rooms 협업에 파트너를 초대하여 잠재적 사기 거래를 탐지할 수 있습니다. 연구 기관 및 병원 네트워크는 기존 임상 시험 참가자와 유사한 지원자를 찾아 임상 시험 기간을 단축하는 데 도움이 될 수 있습니다. 브랜드와 퍼블리셔는 어느 한 회사가 기본 데이터를 다른 회사와 공유하지 않고도 시장 내 고객의 유사 세그먼트를 모델링하고 관련성이 높은 광고 경험을 제공할 수 있습니다.
AWS 제작 모델을 사용하는 AWS Clean Rooms ML 유사 모델링은 전자상거래, 스트리밍 비디오 등 다양한 데이터세트로 구축 및 테스트되었으며, 대표적인 업계 기준에 비해 유사 모델링의 정확도를 최대 36% 향상할 수 있도록 지원합니다. 신규 고객 발굴과 같은 실제 애플리케이션에서 이러한 정확도 향상은 수백만 USD의 비용 절감으로 이어질 수 있습니다.
AWS Clean Rooms를 사용하면 파트너와 함께 공동 데이터로부터 합성 데이터세트를 생성하여 회귀 및 분류 기계 학습(ML) 모델을 훈련할 수 있습니다. AWS Clean Rooms ML은 프라이버시 강화 제어를 적용하여, 예측 인사이트를 생성하는 동시에 독점 데이터와 ML 모델을 보호하는 데 도움을 줍니다. 프라이버시 강화 제어 기능인 합성 데이터세트 생성을 통해, 고객과 파트너는 원본과 유사한 통계 속성을 가진 훈련 데이터세트를 만들 수 있습니다. 이를 통해 이전에는 데이터 프라이버시 문제로 인해 제한되었던 공동 데이터세트에 대한 새로운 ML 모델 훈련 사용 사례를 활용할 수 있습니다.
AWS Clean Rooms ML에서 사용자 지정 기계 학습을 위한 프라이버시 강화 합성 데이터세트 생성은 원본 데이터에서 주체(예: 데이터가 수집된 사람 또는 단체)의 식별 정보를 제거함으로써 모델이 데이터세트에 포함된 개인에 대한 정보를 기억하지 못하도록 하는 방식으로 작동합니다. 합성 데이터세트 생성 프로세스는 선택한 회귀 및 분류 알고리즘과 호환되는 데이터세트를 생성하도록 최적화되었습니다.