AWS Clean Rooms 常見問答集

一般問題

AWS Clean Rooms 可讓您和您的合作夥伴更輕鬆地分析和協作處理您的集體資料集,從而在不向彼此透露基礎資料的情況下獲得新的洞察。您可以在短短幾分鐘內建立自己的無塵室,簡單幾個步驟就能與夥伴開始分析共同的資料集。透過 AWS Clean Rooms,您可以輕易地與正在使用 AWS 的上萬間公司合作,而無需將資料移出 AWS 或是將資料載入其他平台。

AWS Clean Rooms 協作是安全的邏輯邊界,允許協作成員執行 SQL 查詢和 ML 建模,而無需與其合作夥伴共用原始資料。唯有受邀參加協作的公司才可以加入協作。多名參與者可以貢獻資料給協作,然後由一名成員接收成果。只有受邀公司才能加入 AWS Clean Rooms 協作。

在 AWS 管理主控台中,您可以選擇要執行的分析類型、要與哪些合作夥伴進行協作,以及想為協作貢獻哪些資料集。使用 AWS Clean Rooms,您可以執行兩種類型的分析:SQL 查詢和機器學習。

當您執行 SQL 或 Spark SQL 查詢時,AWS Clean Rooms 會從資料所在處讀取資料,並套用內建、靈活的分析規則來協助您維護對資料的掌控權。AWS Clean Rooms 提供多種隱私權增強 SQL 控制,包括查詢控制、查詢輸出限制和查詢記錄,讓您可以針對無塵室參與者的查詢自訂限制。您可以使用 Spark 分析引擎,以在 AWS Clean Rooms 協作中使用 Spark SQL 方言來執行查詢。AWS Clean Rooms Spark SQL 提供可設定的運算大小,以便增強靈活性,進而根據您的效能、規模和成本需求自訂和分配資源來執行 SQL 查詢。AWS Clean Rooms Spark SQL 僅適用於自訂分析規則。只需點擊幾下,AWS Clean Rooms 差分隱私保護即可透過數學支援和直覺控制,協助您保護使用者的隱私。藉助 SQL 分析引擎,您可以選取 SQL 自訂分析規則,然後設定所需的差分隱私保護參數,從而使用 AWS Clean Rooms 差分隱私保護。此外,Cryptographic Computing for Clean Rooms (C3R) 可協助您在使用 Spark 分析引擎或 SQL 分析引擎執行查詢時,在 SQL 分析期間確保敏感資料已加密。若要在協作中套用 AWS Clean Rooms 差分隱私保護或使用彙總或清單分析規則,您必須使用 SQL 作為分析引擎。

AWS Clean Rooms ML 可協助您和合作夥伴套用增強隱私權的 ML 來產生預測性洞見,而無需彼此共用原始資料。AWS Clean Rooms ML 支援自訂和類似機器學習 (ML) 建模。藉助自訂建模,您可以帶入自訂模型進行訓練,並在集體資料集上執行推論,而無需在協作者之間共用基礎資料或智慧財產權。藉助類似建模,您可以使用 AWS 撰寫的模型,根據合作夥伴帶入協作的小型設定檔範例產生擴展的類似設定檔集。

AWS Clean Rooms ML 類似建模在電子商務和串流影片等各種資料集上使用 AWS 撰寫的模型進行建置和測試,與代表性行業的基準相比,可以協助客戶將類似建模的準確性提高多達 36%。在尋找新客戶等真實應用中,這種精確度的提高可節省數百萬美元。

您可使用 AWS 管理主控台或 API 操作建立無塵室協作、邀請要協作的公司,然後選擇每位參與者在協作中擁有的能力。接著,參與者可以設定如何查詢結構化資料的規則,並在其資料上訓練 ML 模型。資料集不會從參與者帳戶複製,並且僅在需要時才能存取。使用 AWS Clean Rooms,您可以選擇要執行的分析類型:使用 AWS Clean Rooms ML 進行 SQL 查詢和 ML 建模。使用 SQL 查詢時,您還可以使用其他功能,例如無程式碼分析建置器、AWS Clean Rooms Differential Privacy 和加密計算。協作參與者將資料或模型與協作關聯並執行分析後,協作輸出將儲存在指定的 Amazon Simple Storage Service (Amazon S3) 儲存貯體中。

AWS Clean Rooms 每次協作最多支援 5 名參與者。

由您控制誰可以參與您的 AWS Clean Rooms 協作,並且您可以建立協作或受邀加入協作。協作中每個人的參與都公開透明,但無法在建立協作後新增新帳戶。不過,您可以在必要時為不同客戶或合作夥伴設定新協作。由您建立和管理對您內容的存取,並透過您控管的使用者、群組、許可和憑證設定對 AWS 服務和資源的存取。

客戶可以使用 SQL 或 AWS Clean Rooms ML 建模對其合作夥伴的集體資料集產生洞察 — 無需共用或洩露底層資料。

藉助 SQL,多名協作者可以貢獻資料,但僅一名協作者可以執行 SQL 查詢,並且僅一名協作者可接收結果。加入協作時,協作者會同意哪一方將執行查詢、哪一方將收到結果,以及哪一方將負責計算費用。只有您邀請加入該協作的人才能根據您建立的分析規則獲得洞察。設定 AWS Clean Rooms 協作時,您可以為每名協作成員指定不同的能力,以滿足您的特定用例。例如,如果您希望將查詢輸出轉給不同的成員,可以將一個成員指定為可以編寫查詢的查詢執行者,將另一個成員指定為可以接收結果的查詢結果接收者。這使協作建立者能夠確保負責查詢的成員無法存取查詢結果。

藉助 AWS Clean Rooms ML,協作者可以提供範例記錄集,並希望據此從合作夥伴處找到相似的區隔; 另一方擁有較大的群體,我們根據它們與範例記錄的相似性,產生相似的區隔。AWS Clean Rooms ML 會將輸出類似區隔傳送到目的地,該目的地由從中派生類似區隔的較大群體的一方指定。

AWS Entity Resolution 原生整合到 AWS Clean Rooms 中。您可以使用您選擇的任何常用金鑰 (例如假名識別碼),在增強了隱私權的 AWS Clean Rooms 協作中使用以規則為基礎或以資料服務提供者為基礎的比對,以準備、比對和連結使用者資料與合作夥伴的資料。

AWS Clean Rooms 可在以下區域使用:美國東部 (俄亥俄)、美國東部 (維吉尼亞北部)、美國西部 (奧勒岡)、亞太區域 (首爾)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (東京)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦) 和歐洲 (斯德哥爾摩)。

藉助 AWS Clean Rooms,您可以使用彈性的 SQL 分析規則和增強隱私的 ML 來滿足業務需求。您使用 SQL 分析時,您可以靈活選擇哪個協作者為協作中執行的 SQL 查詢的計算能力付費,以無塵室處理單元 (CRPU) -小時為單位,按每秒計算(最低收費時間為 60 秒)。當您使用 AWS Clean Rooms ML 時,您只需按照每 1,000 個設定檔的價格,為您請求的模型訓練和建立的類似區段付費。如需詳細資訊,請參閱 AWS Clean Rooms 定價

有了 AWS Clean Rooms 的 AWS Entity Resolution,您可利用提供者資料集 (例如 LiveRamp),以使用以規則為基礎或以資料服務提供者為基礎的比對。

當您使用以規則為基礎的比對時,協作中至少需要一名成員在與合作夥伴的資料集比對之前準備資料,除非他們在建立或加入協作之前已使用 AWS Entity Resolution 準備資料。此成員僅在使用時才須支付資料準備費用。任何參與協作的成員都可以為資料比對支付費用。每次協作也需要為資料比對支付一次性費用,此費用將指派給為資料比對付費的任何協作者。

當您使用以資料服務提供者為基礎的比對時,所有協作成員都必須擁有提供者訂閱,才能使用提供者 ID 準備其資料。在與合作夥伴的資料集比對之前,所有協作成員都必須使用提供者 ID 準備資料,除非他們在建立或加入協作之前已使用 AWS Entity Resolution 準備資料。任何參與協作的成員都可以使用提供者的 ID 支付資料比對。此外,為資料比對付費的會員必須擁有提供者訂閱。您可以使用 AWS Data Exchange (ADX) 上列出的公共訂閱,也可以直接透過所選的資料服務提供者購買私有訂閱,然後使用 ADX 的自帶訂閱 (BYOS)

如需詳細資訊,請參閱 AWS Clean Rooms 上的 AWS Entity Resolution 定價

AWS Clean Rooms ML

AWS Clean Rooms ML 可協助您和合作夥伴套用增強隱私權的 ML 來產生預測性洞見,而無需彼此共用原始資料。AWS Clean Rooms ML 支援自訂和類似機器學習 (ML) 建模。藉助自訂建模,您可以帶入自訂模型進行訓練,並在集體資料集上執行推論,而無需在協作者之間共用基礎資料或智慧財產權。藉助類似建模,您可以使用 AWS 撰寫的模型,根據合作夥伴帶入協作的小型設定檔範例產生擴展的類似設定檔集。

AWS Clean Rooms ML 可透過多種使用案例協助客戶。例如,廣告商可將他們的專有模型和資料帶入 Clean Room 協作,並邀請發佈者加入他們的資料以訓練和部署自訂 ML 模型,該模型可協助他們提升行銷活動效率;金融機構可以使用歷史交易記錄來訓練自訂 ML 模型,並邀請合作夥伴加入 Clean Rooms 協作以偵測潛在詐騙型交易;研究機構和醫院網路可以尋找與現有臨床試驗參與者相似的候選患者,以協助加速臨床研究;品牌和發佈者可以對市場內客戶的相似群體進行建模並提供高度相關的廣告體驗,而無需任何一家公司與另一家公司共用其基礎資料。

使用 AWS Clean Rooms ML 自訂建模,您可以將自己的機器學習 (ML) 模型、演算法和資料帶入與合作夥伴的協作,以在集體資料集上訓練 ML 模型和執行推論,而無需共用敏感資料或專有 ML 模型。

AWS Clean Rooms ML 自訂建模可支援 ML 訓練和 ML 推論工作流程。對於這兩個工作流程,您首先定義 AWS Clean Rooms Spark SQL 查詢,該查詢用於產生訓練或推論步驟的資料集。中間資料集保留在無塵室協作中,僅可用於核准的 AWS Clean Rooms ML 任務。第二步是 ML 模型訓練或推論。ML 模型和程式碼封裝在容器映像中。經過訓練的模型可以保留在協作中,並且用作推論工作流程的一部分。使用 AWS Clean Rooms ML,您的資料僅用於訓練自訂模型,並且這些資料不會在協作者之間共用,也不會用於 AWS 模型訓練。您可以隨時從 Clean Rooms ML 中移除資料或刪除自訂模型,也可以套用增強隱私權的控制項來保護自己帶入協作的敏感資料。若要套用 AWS Clean Room ML 自訂建模,您必須使用 Spark SQL 作為分析引擎。

藉助 AWS Clean Rooms ML 類似建模,您可以使用 AWS 撰寫的模型,根據合作夥伴帶入協作的小型設定檔範例產生擴展的類似設定檔集,同時保護您和合作夥伴的基礎資料。您可以邀請合作夥伴進入無塵室,並套用 AWS 撰寫的 ML 模型,該模型經過針對每次協作的訓練,只需幾個步驟即可產生類似資料集,從而節省數月的開發工作,以建置、訓練、調整和部署您自己的模型。AWS Clean Rooms ML 類似建模在電子商務和串流影片等各種資料集上建置和測試,與代表性行業的基準相比,可以協助客戶將類似建模的準確性提高多達 36%。在尋找新客戶等真實應用中,這種精確度的提高可節省數百萬美元。

AWS Clean Rooms ML 類似建模會從一方取得一方的記錄範例,並從另一個協作者的資料集中尋找更大的記錄集或類似區段。您可以指定所產生的類似區段的所需大小,AWS Clean Rooms ML 會私下將其範例清單中的唯一設定檔與合作夥伴資料集中的設定檔進行匹配,然後訓練 ML 模型,以預測協作者資料集中的每個設定檔與範例中的設定檔的相似程度。AWS Clean Rooms ML 會自動對類似範例清單的設定檔進行分組,並輸出產生的類似區段。AWS Clean Rooms ML 無需與合作夥伴共享資料以建置、訓練和部署 ML 模型。使用 AWS Clean Rooms ML,您的資料僅用於訓練您的模型,而不用於 AWS 模型的訓練。您可以使用直觀的控制項,協助您和您的合作夥伴調整模型的預測結果。

安全性及資料保護

資料保護始於 AWS 的安全基礎,而 AWS Clean Rooms 建置於 AWS 安全服務之上,包括 AWS Identity and Access Management (IAM)、AWS Key Management Service (KMS) 和 AWS CloudTrail。這可讓您將現有資料保護策略延伸至資料協作工作負載。有了 AWS Clean Rooms,您不再需要將自己的資料複本儲存在 AWS 環境以外的地方並傳送給另一方,就能執行消費者洞察、行銷測量、預測或風險評估等分析。

設定 AWS Clean Rooms 協作並使用 SQL 分析時,您可以為每名協作成員指定不同的能力,以滿足您的特定用例。例如,如果您希望將查詢輸出的轉給不同的成員,可以將一個成員指定為可以編寫查詢的查詢執行者,將另一個成員指定為可以接收結果的查詢結果接收者。這使協作建立者能夠確保負責查詢的成員無法存取查詢結果。

AWS Clean Rooms 也具有 SQL 查詢控件,可讓您透過分析規則組態,限制可以在資料表上執行的查詢種類或特定查詢。AWS Clean Rooms 支援三種類型的 SQL 分析規則:彙總、清單和自訂。您可以使用彙總分析規則設定資料表,以便僅允許進行只會產生彙總統計資料的查詢 (例如行銷活動測量或歸因)。您可以使用清單分析規則設定控制,讓查詢僅分析您資料集與成員可查詢資料集的交集。您可以使用自訂分析規則設定查詢層級控制,以允許在資料集上執行特定帳戶或查詢。使用自訂分析規則時,您可以選擇使用 Differential Privacy。只需點擊幾下,AWS Clean Rooms Differential Privacy 即可透過數學支援和直覺控制,協助您保護使用者的隱私。作為 AWS Clean Rooms 的完全受管功能,您無需具備差異隱私經驗來協助您防止使用者的重新識別。另一個控制項是聚合臨界值,可防止查詢向下鑽研到可能導致重新識別的小型群組。

使用 AWS Clean Rooms ML,您的資料僅用於訓練您的模型,而不用於 AWS 模型的訓練。AWS Clean Rooms ML 不會將任何公司的訓練或類似區段資料與其他公司一起使用,您可以隨時刪除模型和訓練資料。

否。資料集儲存在協作者 AWS 帳戶中。AWS Clean Rooms 會暫時讀取協作者帳戶的資料,以執行查詢、比對記錄、訓練 ML 模型或擴充種子區段。分析結果將傳送到專為分析設計的 S3 位置。

AWS Clean Rooms 上的 AWS Entity Resolution 會產生一個資料集,該資料集會對應協作各方的識別碼。映射資料集由 AWS Clean Rooms 管理。協作中的任何成員都無法檢視或下載映射表。如果協作中的所有成員同意放寬此隱私強制執行,則可以針對特定使用案例查詢映射表。任何一方都可以隨時刪除表格。

AWS Clean Rooms ML 產生的模型由服務儲存,該模型可以使用客戶管理的 AWS KMS key 進行加密,並且客戶可以隨時刪除。

AWS Clean Rooms 加密與分析規則可讓您對想要分享的資訊類型進行精細控管。身為資料協作者,由您負責評估每次協作的風險,包括重新識別身分的風險,以及自行進行額外的盡職調查來確保符合任何資料隱私權法律。若共用的資料具有敏感性或受到管制,我們建議您也運用合適的法律合約與稽核機制,進一步降低隱私權風險。

是。AWS 服務條款禁止在 AWS Clean Rooms 中進行協作的某些使用案例。

是,AWS HIPAA 合規計劃中的 HIPAA 合格服務包含 AWS Clean Rooms。如果您與 AWS 共同履行的商業夥伴協議 (BAA),現可使用 AWS Clean Rooms 建立 HIPAA 合規協作。如果沒有 BAA 或對在 HIPAA 合規應用程式使用 AWS 有任何問題,請聯絡我們以取得詳細資訊。

進一步了解,請參閱以下資源:

AWS HIPAA 合規頁面

AWS 醫療保健的雲端運算頁面

SQL 分析

您可以選擇使用 Spark 分析引擎,以在 AWS Clean Rooms 協作中使用 Spark SQL 方言來執行查詢。AWS Clean Rooms Spark SQL 提供可設定的運算大小,以便在執行 SQL 工作負載時更好地控制價格效能比。若要在協作中套用 AWS Clean Rooms 差分隱私保護或使用彙總或清單分析規則,您必須使用 SQL 作為分析引擎。

AWS Clean Rooms Spark SQL 使用預設執行個體類型 CR.1X,其可提供 4 個 vCPU、30 GB 記憶體和 100 GB 儲存。您可選取較大的 CR.4X 執行個體類型 (提供 16 個 vCPU、120 GB 記憶體和 400 GB 儲存),進而選擇分配更多資源來執行 Spark SQL 工作負載。較大的執行個體大小可以受益於處理大量資料並執行複雜分析的 SQL 工作負載,而這有助於將工作負載分配到更多資源中。在這裡進一步了解每個組態的相關 vCPU、記憶體和儲存。

在 SQL 分析規則中,您可以設定資料欄層級的控制,用其協助自己定義如何在查詢中使用每個資料欄。例如,您可以指定哪些資料欄可以用於計算彙總統計資料 (例如 SUM(price)) — 以及哪些資料欄可以用於將您的資料表加入其他協作成員的資料。在彙總分析規則中,您也可以定義每個輸出資料列必須符合的最低彙總閾值。AWS Clean Rooms 會自動篩掉不符合最低閾值的資料列。

是。您將能夠設定 AWS Clean Rooms 在 Amazon CloudWatch Logs 中發佈查詢日誌。您還可以使用自訂分析規則來審查查詢 (存放在分析範本中),然後再於協作中執行查詢。 

AWS Clean Rooms Differential Privacy

Differential Privacy 經過數學驗證的框架,有助於保護資料隱私。Differential Privacy 的主要益處是透過新增數量受控的隨機 (雜訊),掩蓋正在分析的資料集中是否存在任何單一個體,從而協助保護個人層級的資料。

只需幾個步驟,AWS Clean Rooms Differential Privacy 即可透過數學支援和直觀的控制項,協助您保護使用者的隱私。作為 AWS Clean Rooms 的完全受管功能,您無需具備差異隱私經驗來協助您防止使用者的重新識別。AWS Clean Rooms Differential Privacy 可遮蔽任何個人資料在協作中產生彙總洞察方面的貢獻,因此您可以執行廣泛的 SQL 查詢,以產生有關廣告活動、投資決策、臨床研究等等的洞察。

作為具有貢獻資料能力的成員,開始或加入 AWS Clean Rooms 協作後,只需幾個步驟即可開始使用 AWS Clean Rooms Differential Privacy。建立對 AWS Glue Data Catalog 中資料表進行引用的已設定資料表後,您只需選擇開啟差分隱私保護,同時使用 SQL 分析引擎為已設定資料表新增自訂分析規則。接下來,您可以將已設定的資料表與 AWS Clean Rooms 協作關聯,並在協作中設定 Differential Privacy 政策,使您的表格可供查詢。您可以使用預設策略快速完成設定,或進行自訂以滿足特定需求。 若要在協作中套用 AWS Clean Rooms 差分隱私保護,您必須使用 SQL 作為分析引擎。

設定 AWS Clean Rooms Differential Privacy 後,您的協作合作夥伴就可以開始在您的資料表上執行查詢 — 不需要任何 Differential Privacy 方面的專業知識或由合作夥伴進行其他設定。藉助 AWS Clean Rooms Differential Privacy,查詢執行者可以執行自訂且靈活的分析,包括具有常見表格運算式 (CTE) 以及常用的彙總函數 (例如 COUNT 和 SUM) 的複雜查詢模式。

密碼編譯運算

密碼編譯運算是保護和加密使用中敏感資料的方法。資料可以在儲存時靜態加密,也可以在傳輸中及使用時動態加密。加密是指將純文字資料轉換成無法使用特定「金鑰」解密的編碼資料。 Private Set Intersection (PSI) 是一種密碼編譯運算方法,可讓握有資料集的兩方及多方比較加密的版本以進行運算。加密會在內部部署中使用協作者共用的私密金鑰進行。 C3R 可用於 Spark SQL 分析引擎或 SQL 分析引擎。

Cryptographic Computing for Clean Rooms (C3R) 是 AWS Clean Rooms 提供的工具,其允許使用用戶端加密工具 (SDK 或命令列介面 (CLI)) 預先加密資料;加密工具在 AWS Clean Rooms 協作中與其他參與者使用共用的私密金鑰。這可以在執行查詢時加密資料。