- 分析›
- AWS Clean Rooms›
- 功能
AWS Clean Rooms 功能
在幾分鐘之內建立無塵室。與您的合作夥伴協作,而無需共享原始資料
為何選擇 AWS Clean Rooms?
只需幾個步驟,即可建立您自己的無塵室、新增參與者並開始協作
與任何公司協作,而無需共享或揭露基礎資料集
利用針對無塵室提供一系列強化隱私權控制功能,保護基礎資料
連結和比對客戶記錄、使用靈活的分析工具,並與您的合作夥伴訓練和部署 ML 模型
頁面主題
多方
全部開啟在資料所在位置就資料進行協作
全部開啟完整的程式設計式存取
全部開啟可設定的角色
全部開啟AWS Clean Rooms 上的 AWS Entity Resolution
全部開啟PySpark
全部開啟靈活的 SQL
全部開啟分析規則是一些限制,能讓您透過內建控制來管理資料的分析方式。以指定的查詢執行者建立或加入協作的協作成員可撰寫查詢,以根據您設定的分析規則來交集和分析您的資料表。AWS Clean Rooms 支援三種類型的分析規則:彙總、清單和自訂。
彙總分析規則:彙總分析規則可讓您執行產生彙總統計資料的查詢,例如兩個資料集的交集大小。使用彙總分析規則時,您可以強制要求只能在資料上執行彙總查詢,並對所執行查詢的特定部分強制執行限制,例如彙總中的哪些資料欄必須僅用於盲比對,以及哪些資料欄可用於彙總 (例如總和、計數或平均值)。此外,您還可以控制輸出中的最小彙總限制。 您還可以設定最低彙總約束,該約束允許您設定輸出列傳回項目的條件。這些約束的形式為:COUNT DISTINCT (Column) >= Threshold。如果查詢結果中的輸出資料列不符合任何約束,則會從結果集中移除。這讓您可以為資料協作者 (他們能為自己的選擇撰寫查詢) 提供彈性,同時協助確保最低彙總閥值已自動實行。
清單分析規則:清單分析規則可讓您執行查詢,以擷取多個資料集交集的資料列層級清單,例如兩個資料集的重疊。使用清單分析規則時,您可以強制要求只能在資料上執行清單查詢,並對執行的查詢強制執行限制,例如哪些資料欄必須僅用於盲比對,以及哪些資料欄可在輸出時做為清單來輸出。
自訂分析規則:自訂分析規則可讓您使用大多數 ANSI 標準 SQL 建立自訂查詢,例如常見資料表運算式 (CTE) 和視窗函數。您也可以在協作合作夥伴執行之前檢閱並允許查詢,並在允許其他協作者於您的資料表上執行之前檢閱其他協作者的查詢。使用自訂分析規則時,您可以使用內建控制來預先判斷或限制基礎資料的分析方式,而不必在分析完成之後依賴查詢日誌。使用自訂 SQL 查詢時,您還可以建立或使用分析範本,以在協作中存放具有參數的自訂查詢。這可允許客戶更輕鬆地互相協作。例如,具有更多 SQL 經驗的成員可以建立範本供其他成員檢閱,還可能供其執行。此外還有助於在協作中進行可重複使用的分析。您還可以選取自訂分析規則,然後設定差異隱私權參數,從而使用 AWS Clean Rooms 差分隱私保護。
您可以對受密碼編譯保護的資料執行 AWS Clean Rooms 查詢。如果資料處理政策要求加密敏感資料,您可以使用協作專屬、共用的加密金鑰事先進行加密,即使在執行查詢,也可以對資料進行加密。加密運算能確保協作運算中使用的資料在靜態、傳輸中和使用中 (處理中) 都保持加密。
Cryptographic Computing for Clean Rooms (C3R) 是具有 CLI 的開放原始碼 Java SDK,可在 GitHub 上取得。使用此功能無須額外付費。如果您有巨量資料,則可以檢閱文件以了解如何將 C3R 整合到 Apache Spark 中。
此功能是各種 AWS 加密運算工具中的最新功能,旨在協助您滿足安全與合規需求,同時讓您能充分利用 AWS 提供的彈性、可擴展性、效能和易用性。
增強隱私的 ML
全部開啟AWS Clean Rooms ML 可協助您和合作夥伴套用增強隱私權的機器學習 (ML) 來產生預測性洞察,而無需彼此共用原始資料。AWS Clean Rooms ML 支援自訂和類似機器學習 (ML) 建模。藉助自訂建模,您可以帶入自訂模型進行訓練,並在集體資料集上執行推論,而無需在協作者之間共用基礎資料或智慧財產權。藉助類似建模,您可以使用 AWS 撰寫的模型,根據合作夥伴帶入協作的小型設定檔範例產生擴展的類似設定檔集。
AWS Clean Rooms ML 可透過多種使用案例協助客戶。例如,廣告商可將他們的專有模型和資料帶入 Clean Rooms 協作,並邀請發佈者加入他們的資料以訓練和部署自訂 ML 模型,該模型可協助他們提升行銷活動效率;金融機構可以使用歷史交易記錄來訓練自訂 ML 模型,並邀請合作夥伴加入 Clean Rooms 協作以偵測潛在詐騙型交易;研究機構和醫院網路可以尋找與現有臨床試驗參與者相似的候選患者,以協助加速臨床研究;品牌和發布者可以對市場內客戶的相似群體進行建模並提供高度相關的廣告體驗,而無需任何一家公司與另一家公司共用其基礎資料。
AWS Clean Rooms ML 類似建模在電子商務和串流影片等各種資料集上使用 AWS 撰寫的模型進行建置和測試,與代表性行業的基準相比,可以協助您將類似建模的準確性提高多達 36%。在尋找新客戶等真實應用中,這種精確度的提高可節省數百萬美元。
AWS Clean Rooms 可讓您和您的合作夥伴從集體資料產生綜合資料集,以訓練迴歸和分類機器學習 (ML) 模型。AWS Clean Rooms ML 會套用增強隱私的控制項,協助保護您的專屬資料和機器學習模型,同時產生預測性洞察。作為增強隱私的控制項,綜合資料集產生內容可讓您和您的合作夥伴建立具有與原始相似的統計資料屬性的訓練資料集,從而對之前受到資料隱私權問題限制的集體資料集解鎖新的 ML 模型訓練使用案例。
適用於 AWS Clean Rooms ML 之自訂機器學習的增強隱私綜合資料集產生內容,可透過去識別原始資料中的主體 (例如已收集其資料的人員或實體),從而減輕模型記住資料集中個人資訊的風險。綜合資料集產生過程經過最佳化,以建立與您選擇的迴歸和分類演算法相容的資料集。