AWS Clean Rooms 常見問答集

一般問題

AWS Clean Rooms 可讓您和您的合作夥伴更輕鬆地分析和協作處理您的集體資料集,從而在不向彼此透露基礎資料的情況下獲得新的洞察。您可以在短短幾分鐘內建立自己的無塵室,簡單幾個步驟就能與夥伴開始分析共同的資料集。透過 AWS Clean Rooms,您可以輕易地與正在使用 AWS 的上萬間公司合作,而無需將資料移出 AWS 或是將資料載入其他平台。

在 AWS 管理主控台中,您可以選擇要執行的分析類型、要與哪些合作夥伴進行協作,以及想為協作貢獻哪些資料集。使用 AWS Clean Rooms,您可以執行兩種類型的分析:SQL 查詢和機器學習 (ML)。

當您執行 SQL 查詢時,AWS Clean Rooms 會從資料所在處讀取資料,並套用內建、靈活的分析規則來協助您維護對資料的掌控權。AWS Clean Rooms 提供多種隱私權增強 SQL 控制,包括查詢控制、查詢輸出限制和查詢記錄,讓您可以針對無塵室參與者的查詢自訂限制。您可以選取自訂分析規則,然後設定 Differential Privacy 參數,使用 AWS Clean Rooms Differential Privacy (預覽版)。只需幾個步驟,AWS Clean Rooms Differential Privacy 即可透過數學支援和直觀的控制項,協助您保護使用者的隱私。此外,無塵室加密計算 (C3R) 可協助您在 SQL 分析期間保持敏感資料的加密狀態。

AWS Clean Rooms ML (預覽版) 可協助您和合作夥伴套用增強隱私的 ML 來產生預測性洞察,而無需彼此共用原始資料。藉助 AWS Clean Rooms ML 類似建模,您可以使用資料訓練自訂模型,並邀請合作夥伴將其記錄的一小部分範例導入協作,以產生擴充的類似記錄集,同時保護您和合作夥伴的基礎資料。醫療保健建模將在未來幾個月推出。

AWS Clean Rooms ML 在電子商務和串流影片等各種資料集上建置和測試,與代表性行業的基準相比,可以協助客戶將類似建模的準確性提高多達 36%。在尋找新客戶等真實應用中,這種精確度的提高可節省數百萬美元。

AWS Clean Rooms 協作是安全的邏輯邊界,允許協作成員執行 SQL 查詢和 ML 建模,而無需與其合作夥伴共用原始資料。唯有受邀參加協作的公司才可以加入協作。多名參與者可以貢獻資料給協作,然後由一名成員接收成果。只有受邀公司才能加入 AWS Clean Rooms 協作。

您可使用 AWS 管理主控台或 API 操作建立無塵室協作、邀請要協作的公司,然後選擇每位參與者在協作中擁有的能力。接著,參與者可以設定如何查詢結構化資料的規則,並在其資料上訓練 ML 模型。資料集不會從參與者帳戶複製,並且僅在需要時才能存取。使用 AWS Clean Rooms,您可以選擇要執行的分析類型:使用 AWS Clean Rooms ML 進行 SQL 查詢和 ML 建模。使用 SQL 查詢時,您還可以使用其他功能,例如無程式碼分析建置器、AWS Clean Rooms Differential Privacy 和加密計算。協作參與者將資料或模型與協作關聯並執行分析後,協作輸出將儲存在指定的 Amazon Simple Storage Service (Amazon S3) 儲存貯體中。

AWS Clean Rooms 每次協作最多支援 5 名參與者。

由您控制誰可以參與您的 AWS Clean Rooms 協作,並且您可以建立協作或受邀加入協作。協作中每個人的參與都公開透明,但無法在建立協作後新增新帳戶。不過,您可以在必要時為不同客戶或合作夥伴設定新協作。由您建立和管理對您內容的存取,並透過您控管的使用者、群組、許可和憑證設定對 AWS 服務和資源的存取。

客戶可以使用 SQL 或 AWS Clean Rooms ML 建模對其合作夥伴的集體資料集產生洞察 — 無需共用或洩露底層資料。

藉助 SQL,多名協作者可以貢獻資料,但僅一名協作者可以執行 SQL 查詢,並且僅一名協作者可接收結果。加入協作時,協作者會同意哪一方將執行查詢、哪一方將收到結果,以及哪一方將負責計算費用。只有您邀請加入該協作的人才能根據您建立的分析規則獲得洞察。設定 AWS Clean Rooms 協作時,您可以為每名協作成員指定不同的能力,以滿足您的特定用例。例如,如果您希望將查詢輸出轉給不同的成員,可以將一個成員指定為可以編寫查詢的查詢執行者,將另一個成員指定為可以接收結果的查詢結果接收者。這使協作建立者能夠確保負責查詢的成員無法存取查詢結果。

藉助 AWS Clean Rooms ML,協作者可以提供範例記錄集,並希望據此從合作夥伴處找到相似的區隔; 另一方擁有較大的群體,我們根據它們與範例記錄的相似性,產生相似的區隔。AWS Clean Rooms ML 會將輸出類似區隔傳送到目的地,該目的地由從中派生類似區隔的較大群體的一方指定。

AWS Clean Rooms 不論身分,可讓您使用自己選擇的任何常用金鑰 (例如假名識別碼),將您的使用者資料與合作夥伴的資料配對。您可以在 SQL 中實作自己的匹配邏輯,或使用我們的合作夥伴解決方案之一。您可以使用 AWS Entity Resolution 協調第一方資料,以便在 AWS Clean Rooms 協作中進行配對。

AWS Clean Rooms 可在以下區域使用:美國東部 (俄亥俄)、美國東部 (維吉尼亞北部)、美國西部 (奧勒岡)、亞太區域 (首爾)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (東京)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦) 和歐洲 (斯德哥爾摩)。

藉助 AWS Clean Rooms,您可以使用彈性的 SQL 分析規則和增強隱私的 ML 來滿足業務需求。您使用 SQL 分析時,您可以靈活選擇哪個協作者為協作中執行的 SQL 查詢的計算能力付費,以無塵室處理單元 (CRPU) -小時為單位,按每秒計算(最低收費時間為 60 秒)。當您使用 AWS Clean Rooms ML 時,您只需按照每 1,000 個設定檔的價格,為您請求的模型訓練和建立的類似區段付費。如需詳細資訊,請參閱 AWS Clean Rooms 定價

AWS Clean Rooms ML

AWS Clean Rooms ML 可協助您和合作夥伴在共同的資料上套用 ML 模型,以獲得預測性洞察,而無需彼此共享敏感資訊。藉助此 AWS Clean Rooms 功能,您可以邀請合作夥伴進入無塵室,並套用 AWS 受管的即用型 ML 模型,該模型經過針對每次協作的訓練,只需幾個步驟即可產生相似的資料集,從而節省數月的開發工作,以建置、訓練、調整和部署您自己的模型。

AWS Clean Rooms ML 可透過多種使用案例協助客戶。例如,航空公司可以使用其客戶的資料,與線上預訂服務合作,並識別具有相似特徵的潛在旅行者;汽車貸款公司和保險公司可以識別與現有租賃車主具有相同特徵的潛在汽車保險客戶;品牌和出版商可以為市場中的客戶建立相似細分模型,並提供高度相關的廣告體驗,而任何一家公司都無需與另一家公司共用其基礎資料。醫療保健建模將在未來幾個月推出。

AWS Clean Rooms ML 在電子商務和串流影片等各種資料集上建置和測試,與代表性行業的基準相比,可以協助客戶將類似建模的準確性提高多達 36%。在尋找新客戶等真實應用中,這種精確度的提高可節省數百萬美元。

藉助 AWS Clean Rooms ML 類似建模,您可以使用資料訓練自訂模型,並邀請合作夥伴將其記錄的一小部分範例導入協作,以產生擴充的類似記錄集,同時保護您和合作夥伴的基礎資料。AWS Clean Rooms ML 會從一方取得一方的記錄範例,並從另一個協作者的資料集中尋找更大的記錄集或類似區段。AWS Clean Rooms ML 不會與任何一方共用資料,而且各方可以隨時移除資料或刪除自訂模型。您可以指定所產生的類似區段的所需大小,AWS Clean Rooms ML 會私下將其範例清單中的唯一設定檔與合作夥伴資料集中的設定檔進行匹配,然後訓練 ML 模型,以預測協作者資料集中的每個設定檔與範例中的設定檔的相似程度。AWS Clean Rooms ML 會自動對類似範例清單的設定檔進行分組,並輸出產生的類似區段。AWS Clean Rooms ML 無需與合作夥伴共享資料以建置、訓練和部署 ML 模型。使用 AWS Clean Rooms ML,您的資料僅用於訓練您的模型,而不用於 AWS 模型的訓練。您可以使用直觀的控制項,協助您和您的合作夥伴調整模型的預測結果。

安全性及資料保護

資料保護始於 AWS 的安全基礎,而 AWS Clean Rooms 建置於 AWS 安全服務之上,包括 AWS Identity and Access Management (IAM)、AWS Key Management Service (AWS KMS) 和 AWS CloudTrail。這可讓您將現有資料保護策略延伸至資料協作工作負載。有了 AWS Clean Rooms,您不再需要將自己的資料複本儲存在 AWS 環境以外的地方並傳送給另一方,就能執行消費者洞察、行銷測量、預測或風險評估等分析。

設定 AWS Clean Rooms 協作並使用 SQL 分析時,您可以為每名協作成員指定不同的能力,以滿足您的特定用例。例如,如果您希望將查詢輸出的轉給不同的成員,可以將一個成員指定為可以編寫查詢的查詢執行者,將另一個成員指定為可以接收結果的查詢結果接收者。這使協作建立者能夠確保負責查詢的成員無法存取查詢結果。

AWS Clean Rooms 也具有 SQL 查詢控件,可讓您透過分析規則組態,限制可以在資料表上執行的查詢種類或特定查詢。AWS Clean Rooms 支援三種類型的 SQL 分析規則:彙總、清單和自訂。您可以使用彙總分析規則設定資料表,以便僅允許進行只會產生彙總統計資料的查詢 (例如行銷活動測量或歸因)。您可以使用清單分析規則設定控制,讓查詢僅分析您資料集與成員可查詢資料集的交集。您可以使用自訂分析規則設定查詢層級控制,以允許在資料集上執行特定帳戶或查詢。使用自訂分析規則時,您可以選擇使用 Differential Privacy。只需幾個步驟,AWS Clean Rooms Differential Privacy 即可透過數學支援和直觀的控制項,協助您保護使用者的隱私。作為 AWS Clean Rooms 的完全受管功能,您無需具備差異隱私經驗來協助您防止使用者的重新識別。另一個控制項是聚合臨界值,可防止查詢向下鑽研到可能導致重新識別的小型群組。

使用 AWS Clean Rooms ML,您的資料僅用於訓練您的模型,而不用於 AWS 模型的訓練。AWS Clean Rooms ML 不會將任何公司的訓練或類似區段資料與其他公司一起使用,您可以隨時刪除模型和訓練資料。

否。資料集儲存在協作者 AWS 帳戶中。AWS Clean Rooms 會暫時讀取協作者帳戶的資料,以執行查詢、訓練 ML 模型或擴充種子區段。分析結果將傳送到專為分析設計的 S3 位置。

AWS Clean Rooms ML 產生的模型由服務儲存,該模型可以使用客戶管理的 AWS KMS key 進行加密,並且客戶可以隨時刪除。

AWS Clean Rooms 加密與分析規則可讓您對想要分享的資訊類型進行精細控管。身為資料協作者,由您負責評估每次協作的風險,包括重新識別身分的風險,以及自行進行額外的盡職調查來確保符合任何資料隱私權法律。若共用的資料具有敏感性或受到管制,我們建議您也運用合適的法律合約與稽核機制,進一步降低隱私權風險。

是。AWS 服務條款禁止在 AWS Clean Rooms 中進行協作的某些使用案例。

是。AWS HIPAA 合規計劃中的 HIPAA 合格服務包含 AWS Clean Rooms。如果您與 AWS 共同履行的商業夥伴增補合約 (BAA),現可使用 AWS Clean Rooms 建立 HIPAA 合規協作。如果沒有 BAA 或對在 HIPAA 合規應用程式使用 AWS 有任何問題,請聯絡我們以取得詳細資訊。若要進一步了解,請參閱 AWS HIPAA 合規性適用於醫療保健與生命科學的 AWS

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

SQL 分析

在 SQL 分析規則中,您可以設定資料欄層級的控制,用其協助自己定義如何在查詢中使用每個資料欄。例如,您可以指定哪些資料欄可以用於計算彙總統計資料 (例如 SUM(price)) — 以及哪些資料欄可以用於將您的資料表加入其他協作成員的資料。在彙總分析規則中,您也可以定義每個輸出資料列必須符合的最低彙總閾值。AWS Clean Rooms 會自動篩掉不符合最低閾值的資料列。

是。您將能夠設定 AWS Clean Rooms 在 Amazon CloudWatch Logs 中發佈查詢日誌。您還可以使用自訂分析規則來審查查詢 (存放在分析範本中),然後再於協作中執行查詢。 

AWS Clean Rooms Differential Privacy

Differential Privacy 經過數學驗證的框架,有助於保護資料隱私。Differential Privacy 的主要益處是透過新增數量受控的隨機 (雜訊),掩蓋正在分析的資料集中是否存在任何單一個體,從而協助保護個人層級的資料。

只需幾個步驟,AWS Clean Rooms Differential Privacy 即可透過數學支援和直觀的控制項,協助您保護使用者的隱私。作為 AWS Clean Rooms 的完全受管功能,您無需具備差異隱私經驗來協助您防止使用者的重新識別。AWS Clean Rooms Differential Privacy 可遮蔽任何個人資料在協作中產生彙總洞察方面的貢獻,因此您可以執行廣泛的 SQL 查詢,以產生有關廣告活動、投資決策、臨床研究等等的洞察。

作為具有貢獻資料能力的成員,開始或加入 AWS Clean Rooms 協作後,只需幾個步驟即可開始使用 AWS Clean Rooms Differential Privacy。建立對 AWS Glue Data Catalog 中表進行引用的已設定資料表後,您只需選擇開啟 Differential Privacy,同時為已設定資料表新增自訂分析規則。接下來,您可以將已設定的資料表與 AWS Clean Rooms 協作關聯,並在協作中設定 Differential Privacy 政策,使您的表格可供查詢。您可以使用預設策略快速完成設定,或進行自訂以滿足特定需求。

設定 AWS Clean Rooms Differential Privacy 後,您的協作合作夥伴就可以開始在您的資料表上執行查詢 — 不需要任何 Differential Privacy 方面的專業知識或由合作夥伴進行其他設定。藉助 AWS Clean Rooms Differential Privacy,查詢執行者可以執行自訂且靈活的分析,包括具有常見表格運算式 (CTE) 以及常用的彙總函數 (例如 COUNT 和 SUM) 的複雜查詢模式。

密碼編譯運算

密碼編譯運算是保護和加密使用中敏感資料的方法。資料可以在儲存時靜態加密,也可以在傳輸中及使用時動態加密。加密是指將純文字資料轉換成無法使用特定「金鑰」解密的編碼資料。 Private Set Intersection (PSI) 是一種密碼編譯運算方法,可讓握有資料集的兩方及多方比較加密的版本以進行運算。加密會在內部部署中使用協作者共用的私密金鑰進行。

C3R 是 AWS Clean Rooms 提供的工具,其允許使用用戶端加密工具 (SDK 或命令列介面 (CLI)) 預先加密資料;加密工具在 AWS Clean Rooms 協作中與其他參與者使用共用的私密金鑰。這可以在執行查詢時加密資料。