跳至主要內容

AWS Clean Rooms

AWS Clean Rooms 常見問答集

一般

全部開啟

AWS Clean Rooms 可讓您和您的合作夥伴更輕鬆地分析和協作處理您的集體資料集,從而在不向彼此透露基礎資料的情況下獲得新的洞察。您可以在短短幾分鐘內建立自己的無塵室,簡單幾個步驟就能與夥伴開始分析共同的資料集。 使用 AWS Clean Rooms,您可以輕鬆地與 AWS 和 Snowflake 中的任何公司協作,而無需任何方式移動、揭示或複製其基礎資料集。

AWS Clean Rooms 協作是安全的邏輯邊界,允許協作成員執行 SQL、Spark SQL 和 PySpark 分析,以及進行 ML 建模,而無需與其合作夥伴共用原始資料。只有受邀請參加協作的公司才能加入,多個參與者可以為 Clean Rooms 協作提供資料。

在 AWS 管理主控台中,您可以選擇要執行的分析類型、要與哪些合作夥伴進行協作,以及想為協作貢獻哪些資料集。使用 AWS Clean Rooms,您可以執行三種類型的分析:SQL、PySpark 分析和機器學習。

AWS Clean Rooms 提供基於 Spark SQL 的分析引擎,可以在 Clean Rooms 協作中執行查詢。AWS Clean Rooms Spark SQL 提供可設定的運算大小,以便增強靈活性,進而根據您的效能、規模和成本需求自訂和分配資源來執行 SQL 查詢。 當您執行 SQL 查詢時,AWS Clean Rooms 會從資料所在處讀取資料,並套用內建、靈活的分析規則來協助您維護對資料的掌控權。AWS Clean Rooms 提供多種隱私權增強 SQL 控制,包括查詢控制、查詢輸出限制和查詢記錄,讓您可以針對無塵室參與者的查詢自訂限制。只需點擊幾下,AWS Clean Rooms 差分隱私保護即可透過數學支援和直覺控制,協助您保護使用者的隱私。您可以在執行查詢時設定所需的差分隱私參數,以使用 AWS Clean Rooms 差分隱私保護。此外,Cryptographic Computing for Clean Rooms (C3R) 可協助您在 SQL 分析期間保持敏感資料的加密狀態。

AWS Clean Rooms 中的 PySpark 可讓公司和其合作夥伴使用 PySpark (適用於 Apache Spark 的 Python API) 執行跨大型資料集的複雜分析。有了 AWS Clean Rooms 中的 PySpark,您和您的合作夥伴就可以將 PySpark 程式碼和程式庫帶入 AWS Clean Rooms 協作中,並執行進階分析,而無需分享基礎資料或專屬分析方法。

AWS Clean Rooms ML 可協助您和合作夥伴套用增強隱私的機器學習來產生預測性洞見,而無需彼此共用原始資料。AWS Clean Rooms ML 支援自訂和類似機器學習 (ML) 建模。藉助自訂建模,您可以帶入自訂模型進行訓練,並在集體資料集上執行推論,而無需在協作者之間共用基礎資料或智慧財產權。藉助類似建模,您可以使用 AWS 撰寫的模型,根據合作夥伴帶入協作的小型設定檔範例產生擴展的類似設定檔集。AWS Clean Rooms ML 類似建模在電子商務和串流影片等各種資料集上使用 AWS 撰寫的模型進行建置和測試,與代表性行業的基準相比,可以協助客戶將類似建模的準確性提高多達 36%。在尋找新客戶等真實應用中,這種精確度的提高可節省數百萬美元。

您可使用 AWS 管理主控台或 API 操作建立無塵室協作、邀請要協作的公司,然後選擇每位參與者在協作中擁有的能力。接著,參與者可以設定如何查詢結構化資料的規則,並在其資料上訓練 ML 模型。資料集不會從參與者帳戶複製,並且僅在需要時才能存取。使用 AWS Clean Rooms,您可以選擇要執行的分析類型:SQL、Spark SQL 和 PySpark 分析,以及使用 AWS Clean Rooms ML 的 ML 建模。使用 SQL 分析時,您可以使用無程式碼分析建置器、AWS Clean Rooms 差分隱私保護和加密運算等功能。使用 Spark SQL 時,您可以選擇可設定的運算大小,以便提升彈性,進而根據您的效能、規模和成本需求來自訂和分配資源,以執行 SQL 查詢。有了 AWS Clean Rooms 中的 PySpark,您和您的合作夥伴就可以將 PySpark 程式碼和程式庫帶入 AWS Clean Rooms 協作中,並執行進階分析,而無需分享基礎資料或專屬分析方法。使用 AWS Clean Rooms ML,您可以使用自訂或 AWS 撰寫的類似模型來產生預測性洞察。協作參與者將資料或模型與協作關聯並執行分析後,協作輸出將儲存在指定的 Amazon Simple Storage Service (Amazon S3) 儲存貯體中。

AWS Clean Rooms 可以使用來自 Amazon S3、Amazon Athena 或 Snowflake 的資料,而無需移動、揭示或複製您的基礎資料集。AWS Clean Rooms 會在執行查詢時從來源讀取資料,避免將資料集複製到單獨環境中的複雜性和成本。在此處進一步了解 AWS Clean Rooms 對多個雲端和資料來源的支援。

AWS Clean Rooms 每次協作最多支援 5 名參與者。

由您控制誰可以參與您的 AWS Clean Rooms 協作,並且您可以建立協作或受邀加入協作。協作中每個人的參與都公開透明,但無法在建立協作後新增新帳戶。不過,您可以在必要時為不同客戶或合作夥伴設定新協作。由您建立和管理對您內容的存取,並透過您控管的使用者、群組、許可和憑證設定對 AWS 服務和資源的存取。

客戶可以使用 SQL、Spark SQL、PySpark 或 AWS Clean Rooms ML 建模,對其合作夥伴的集體資料集產生洞察 — 無需共用或洩露底層資料。設定 AWS Clean Rooms 協作時,您可以為每名協作成員指定不同的能力,以滿足您的使用案例。加入 AWS Clean Rooms 協作時,協作者會同意哪一方將執行分析、哪一方將收到結果,以及哪一方將負責計算費用。只有您邀請加入該協作的人才能根據您建立的分析規則獲得洞察。

使用 Spark SQL 分析,只有一個協作者可以執行 SQL 查詢,但多個協作者可以貢獻資料並接收結果。例如,如果您希望將查詢輸出轉給不同的成員,可以將一個成員指定為可以編寫查詢的查詢執行者,將另一個成員指定為可以接收結果的查詢結果接收者。這使協作建立者能夠確保多個成員接收分析結果,而且可查詢的成員無法存取查詢結果。藉助 SQL 分析,多名協作者可以貢獻資料,但僅一名協作者可以執行 SQL 查詢,並且僅一名協作者可接收結果。例如,如果您希望將查詢輸出轉給不同的成員,可以將一個成員指定為可以編寫查詢的查詢執行者,將另一個成員指定為可以接收結果的查詢結果接收者。這使協作建立者能夠確保負責查詢的成員無法存取查詢結果。

藉助 PySpark 分析,多名協作者可以貢獻資料,但僅一名協作者可以執行工作,並且僅一名工作執行者可接收結果。

藉助 AWS Clean Rooms ML,協作者可以提供範例記錄集,並希望據此從合作夥伴處找到相似的區隔; 另一方擁有較大的群體,我們根據它們與範例記錄的相似性,產生相似的區隔。AWS Clean Rooms ML 會將輸出類似區隔傳送到目的地,該目的地由從中派生類似區隔的較大群體的一方指定。

AWS Entity Resolution 原生整合到 AWS Clean Rooms 中。您可以使用您選擇的任何常用金鑰 (例如假名識別碼),在增強了隱私權的 AWS Clean Rooms 協作中使用以規則為基礎或以資料服務提供者為基礎的比對,以準備、比對和連結使用者資料與合作夥伴的資料。若要在協作中套用 AWS Entity Resolution 匹配功能,您必須使用儲存在 Amazon S3 中的資料。

AWS Clean Rooms 可在以下區域使用:美國東部 (俄亥俄)、美國東部 (維吉尼亞北部)、美國西部 (奧勒岡)、亞太區域 (首爾)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (東京)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦) 和歐洲 (斯德哥爾摩)。

藉助 AWS Clean Rooms,您可以使用彈性的分析工具和增強隱私的 ML 來滿足業務需求。當您使用 SQL、Spark SQL 或 PySpark 分析時,您可以靈活選擇哪個協作者為協作中執行的 SQL 查詢的計算能力付費,以無塵室處理單元 (CRPU) - 小時為單位,按每秒計算(最低收費時間為 60 秒)。當您使用 AWS Clean Rooms ML 時,您只需按照每 1,000 個設定檔的價格,為您請求的模型訓練和建立的類似區段付費。如需詳細資訊,請參閱 AWS Clean Rooms 定價

有了 AWS Clean Rooms 的 AWS Entity Resolution,您可利用提供者資料集 (例如 LiveRamp),以使用以規則為基礎或以資料服務提供者為基礎的比對。

使用規則式匹配流程時,協作中至少需要一名成員在與合作夥伴的資料集比對之前準備資料,除非他們在建立或加入協作之前已使用 AWS Entity Resolution 準備資料。此成員僅在使用時才須支付資料準備費用。任何參與協作的成員都可以為資料比對支付費用。每次協作也需要為資料比對支付一次性費用,此費用將指派給為資料比對付費的任何協作者。

當您使用以資料服務提供者為基礎的比對時,所有協作成員都必須擁有提供者訂閱,才能使用提供者 ID 準備其資料。在與合作夥伴的資料集比對之前,所有協作成員都必須使用提供者 ID 準備資料,除非他們在建立或加入協作之前已使用 AWS Entity Resolution 準備資料。任何參與協作的成員都可以使用提供者的 ID 支付資料比對。此外,為資料比對付費的會員必須擁有提供者訂閱。您可以使用 AWS Data Exchange (ADX) 上列出的公共訂閱,也可以直接透過所選的資料服務提供者購買私有訂閱,然後使用 ADX 的自備訂閱 (BYOS)

如需詳細資訊,請參閱 AWS Clean Rooms 上的 AWS Entity Resolution 定價

安全性及資料保護

全部開啟

資料保護始於 AWS 的安全基礎,而 AWS Clean Rooms 建置於 AWS 安全服務之上,包括 AWS Identity and Access Management (IAM)、AWS Key Management Service (KMS) 和 AWS CloudTrail。這可讓您將現有資料保護策略延伸至資料協作工作負載。有了 AWS Clean Rooms,您不再需要將自己的資料複本儲存在 AWS 環境以外的地方並傳送給另一方,就能執行消費者洞察、行銷測量、預測或風險評估等分析。

設定 AWS Clean Rooms 協作並使用 SQL 分析時,您可以為每名協作成員指定不同的能力,以滿足您的使用案例。例如,如果您希望將查詢輸出的轉給不同的成員,可以將一個成員指定為可以編寫查詢的查詢執行者,將另一個成員指定為可以接收結果的查詢結果接收者。這使協作建立者能夠確保負責查詢的成員無法存取查詢結果。

AWS Clean Rooms 也具有 SQL 查詢控件,可讓您透過分析規則組態,限制可以在資料表上執行的查詢種類或特定查詢。AWS Clean Rooms 支援三種類型的 SQL 分析規則:彙總、清單和自訂。您可以使用彙總分析規則設定資料表,以便僅允許進行只會產生彙總統計資料的查詢 (例如行銷活動測量或歸因)。您可以使用清單分析規則設定控制,讓查詢僅分析您資料集與成員可查詢資料集的交集。您可以使用自訂分析規則設定查詢層級控制,以允許在資料集上執行特定帳戶或查詢。使用自訂分析規則時,您可以選擇使用 Differential Privacy。只需點擊幾下,AWS Clean Rooms Differential Privacy 即可透過數學支援和直覺控制,協助您保護使用者的隱私。作為 AWS Clean Rooms 的完全受管功能,您無需具備差異隱私經驗來協助您防止使用者的重新識別。另一個控制項是聚合臨界值,可防止查詢向下鑽研到可能導致重新識別的小型群組。

使用 AWS Clean Rooms ML,您的資料僅用於訓練您的模型,而不用於 AWS 模型的訓練。AWS Clean Rooms ML 不會將任何公司的訓練或類似區段資料與其他公司一起使用,您可以隨時刪除模型和訓練資料。

否。資料集儲存在協作者的 AWS 或 Snowflake 資料湖中,且不會移動。AWS Clean Rooms 會暫時讀取協作者帳戶的資料,以執行查詢、比對記錄、訓練 ML 模型或擴充種子區段。分析結果將傳送到專為分析設計的 S3 位置。在協作流程期間,從任何資料湖讀取的資料均不會永久儲存在 AWS 中,而且任何暫時讀取到 AWS Clean Rooms 環境的資料都會在查詢完成後刪除。

AWS Clean Rooms 上的 AWS Entity Resolution 會產生一個資料集,該資料集會對應協作各方的識別碼。映射資料集由 AWS Clean Rooms 管理。協作中的任何成員都無法檢視或下載映射表。如果協作中的所有成員同意放寬此隱私強制執行,則可以針對特定使用案例查詢映射表。任何一方都可以隨時刪除表格。

AWS Clean Rooms ML 產生的模型由服務儲存,該模型可以使用客戶管理的 AWS KMS key 進行加密,並且客戶可以隨時刪除。

AWS Clean Rooms 加密與分析規則可讓您對想要分享的資訊類型進行精細控管。身為資料協作者,由您負責評估每次協作的風險,包括重新識別身分的風險,以及自行進行額外的盡職調查來確保符合任何資料隱私權法律。若共用的資料具有敏感性或受到管制,我們建議您也運用合適的法律合約與稽核機制,進一步降低隱私權風險。

是。AWS 服務條款禁止在 AWS Clean Rooms 中進行協作的某些使用案例。

是,AWS HIPAA 合規計劃中的 HIPAA 合格服務包含 AWS Clean Rooms。如果您與 AWS 共同履行的商業夥伴協議 (BAA),現可使用 AWS Clean Rooms 建立 HIPAA 合規協作。如果沒有 BAA 或對在 HIPAA 合規應用程式使用 AWS 有任何問題,請聯絡我們以取得詳細資訊。

若要進一步了解,請參閱以下資源:

AWS HIPAA 合規頁面

醫療保健的 AWS 雲端運算頁面

AWS Clean Rooms ML

全部開啟

AWS Clean Rooms ML 可協助您和合作夥伴套用增強隱私權的機器學習 (ML) 來產生預測性洞見,而無需彼此共用原始資料。AWS Clean Rooms ML 支援自訂和類似機器學習 (ML) 建模。藉助自訂建模,您可以帶入自訂模型進行訓練,並在集體資料集上執行推論,而無需在協作者之間共用基礎資料或智慧財產權。您也可以產生合成資料集,用於訓練您的自訂 ML 模型。 藉助類似建模,您可以使用 AWS 撰寫的模型,根據合作夥伴帶入協作的小型設定檔範例產生擴展的類似設定檔集。

AWS Clean Rooms ML 可透過多種使用案例協助客戶。例如,廣告商可將他們的專有模型和資料帶入 Clean Room 協作,並邀請發佈者加入他們的資料以訓練和部署自訂 ML 模型,該模型可協助他們提升行銷活動效率;金融機構可以使用歷史交易記錄來訓練自訂 ML 模型,並邀請合作夥伴加入 Clean Rooms 協作以偵測潛在詐騙型交易;研究機構和醫院網路可以尋找與現有臨床試驗參與者相似的候選患者,以協助加速臨床研究;品牌和發布者可以對市場內客戶的相似群體進行建模並提供高度相關的廣告體驗,而無需任何一家公司與另一家公司共用其基礎資料。

借助 AWS Clean Rooms ML 自訂建模,您可以將自己的機器學習 (ML) 模型、演算法和資料帶入與合作夥伴的協作,以在集體資料集上訓練 ML 模型和執行推論,而無需共用敏感資料或專有 ML 模型。您也可以產生合成資料集,用於訓練您的自訂 ML 模型。

AWS Clean Rooms ML 自訂建模可支援 ML 訓練和 ML 推論工作流程。對於這兩個工作流程,您首先定義 AWS Clean Rooms Spark SQL 查詢,該查詢用於產生訓練或推論步驟的資料集。中間資料集保留在無塵室協作中,僅可用於核准的 AWS Clean Rooms ML 任務。第二步是 ML 模型訓練或推論。ML 模型和程式碼封裝在容器映像中。經過訓練的模型可以保留在協作中,並且用作推論工作流程的一部分,或在後續訓練任務中更新。使用 AWS Clean Rooms ML,您的資料僅用於訓練自訂模型,並且這些資料不會在協作者之間共用,也不會用於 AWS 模型訓練。您可以隨時從 Clean Rooms ML 中移除資料或刪除自訂模型,也可以套用增強隱私權的控制項來保護自己帶入協作的敏感資料。若要套用 AWS Clean Room ML 自訂建模,您必須使用 Spark SQL 作為分析引擎。

藉助 AWS Clean Rooms ML 類似建模,您可以使用 AWS 撰寫的模型,根據合作夥伴帶入協作的小型設定檔範例產生擴展的類似設定檔集,同時保護您和合作夥伴的基礎資料。您可以邀請合作夥伴進入無塵室,並套用 AWS 撰寫的 ML 模型,該模型經過針對每次協作的訓練,只需幾個步驟即可產生類似資料集,從而節省數月的開發工作,以建置、訓練、調整和部署您自己的模型。AWS Clean Rooms ML 類似建模在電子商務和串流影片等各種資料集上建置和測試,與代表性行業的基準相比,可以協助客戶將類似建模的準確性提高多達 36%。在尋找新客戶等真實應用中,這種精確度的提高可節省數百萬美元。

AWS Clean Rooms ML 類似建模會從一方取得一方的記錄範例,並從另一個協作者的資料集中尋找更大的記錄集或類似區段。您可以指定所產生的類似區段的所需大小,AWS Clean Rooms ML 會私下將其範例清單中的唯一設定檔與合作夥伴資料集中的設定檔進行匹配,然後訓練 ML 模型,以預測協作者資料集中的每個設定檔與範例中的設定檔的相似程度。AWS Clean Rooms ML 會自動對類似範例清單的設定檔進行分組,並輸出產生的類似區段。AWS Clean Rooms ML 無需與合作夥伴共享資料以建置、訓練和部署 ML 模型。使用 AWS Clean Rooms ML,您的資料僅用於訓練您的模型,而不用於 AWS 模型訓練。您可以使用直觀的控制項,協助您和您的合作夥伴調整模型的預測結果。 若要套用 AWS Clean Rooms ML 類似模型,您的訓練資料集必須使用儲存在 Amazon S3 中的資料。種子資料可儲存在 Amazon S3 中,也可以在協作中使用 SQL 查詢建立。

AWS Clean Rooms ML 中的合成資料集

全部開啟

合成資料是由演算法產生的資料,而不是從現實測量 (例如生成式 AI 技術) 中觀察到的資料。合成資料集 (透過演算法建立的資料點集合) 可以模仿真資料的統計資料屬性和模式,同時是部分或完全虛構的。使用合成資料集後,企業可以訓練 AI 模型、進行分析和開發應用程式,而不會有暴露敏感資訊的風險。

藉助 AWS Clean Rooms ML 自訂建模,您與您的合作夥伴可透過集合資料來生成具有統計代表性的綜合資料集,以便在不洩露原始資料中敏感資訊的情況下,訓練迴歸與分類 ML 模型。此功能會在原始資料中消除識別主體 (例如已收集資料的人員或實體) 身分,從而減輕模型記住訓練資料中個人相關資訊的風險。

AWS Clean Rooms ML 增強隱私的合成資料集產生內容已經過最佳化,以建立用於訓練迴歸和分類模型的表格式資料集。資料集不是用來訓練大型語言模型 (LLM) 或其他基礎模型。

若要建立合成資料集,請先在原始資料集中指定預測值資料欄,以訓練自訂 ML 模型。AWS Clean Rooms ML 將在您的資料集上訓練專業的隱私增強模型,以便從指定的資料欄產生預測。透過使用在資料上訓練的專業模型來推斷最終資料行,取樣每個非預測值資料欄來產生合成記錄。AWS Clean Rooms ML 中的合成資料集產生內容,藉由將校正的雜訊量插入預測值中,從而移除非預測值資料欄之間的關聯性。

不,AWS Clean Rooms ML 合成資料集產生內容不會變更或移除資料集中的個別值。透過從輸入資料集中的值取樣來產生合成資料列。輸入資料集中的任何值都可以包含在合成資料集中。

注意:合成資料集產生內容可防止推論原始資料集中個人的個別屬性。建議您排除個人身分識別資訊 (PII),以防止原始資料集中的文字值出現在合成資料集中。直接識別碼 (例如電子郵件、電話、身分證字號或地址) 不應包含在原始資料集中。它們可以用作產生 ML 輸入管道之查詢中的聯結金鑰,但不應包含在用於產生合成資料集的分析範本中。請參閱文件,了解詳細資訊。

您可以先與合作夥伴建立 AWS Clean Rooms 協作,並定義模型演算法和資料集,以便開始使用。接下來,您可以建立 SQL 查詢;該查詢會指定要合成的資料和基本隱私控制項,包括雜訊等級,以防止使用者重新識別身分,並防範常見安全的威脅。一旦所有資料擁有者核准此設定,就會開始合成資料產生程序。使用合成資料之前,模型擁有者可以檢閱顯示與原始資料的統計資料相似性及隱私保護強度的全方位指標。最後,您可以使用此合成資料來訓練自訂模型並匯出模型權重,或直接在訓練的模型上執行推論工作。請參閱文件以開始使用。

PySpark

全部開啟

您可以選擇使用 Spark 分析引擎,在 AWS Clean Rooms 協作中執行 PySpark 指令碼。PySpark 提供可設定的運算大小,以便在執行 PySpark 工作負載時更好地控制價格效能比。

AWS Clean Rooms 中的 PySpark 使用預設執行個體類型 CR.1X,其可提供 4 個 vCPU、30 GB 記憶體和 100 GB 儲存。您可選取較大的 CR.4X 執行個體類型 (提供 16 個 vCPU、120 GB 記憶體和 400 GB 儲存),進而選擇分配更多資源來執行 PySpark 工作負載。較大的執行個體大小可以受益於處理大量資料並執行複雜分析的 PySpark 工作負載,而這有助於將工作負載分配到更多資源中。在這裡進一步了解每個組態的相關 vCPU、記憶體和儲存。

您可以彈性地導入 Python 指令碼,而且可以選擇性地在 Python 中提供自訂或開放原始碼程式庫。

在 AWS Clean Rooms 中使用 PySpark 時,會套用單獨的定價。若要進一步了解 PySpark 定價,請造訪 AWS Clean Rooms 定價

SQL 分析

全部開啟

您可以選擇使用 Spark 分析引擎,以在 AWS Clean Rooms 協作中使用 Spark SQL 方言來執行查詢。AWS Clean Rooms SQL 提供可設定的運算大小,以便在執行 SQL 工作負載時更好地控制價格效能比。

AWS Clean Rooms SQL 使用預設執行個體類型 CR.1X,其可提供 4 個 vCPU、30 GB 記憶體和 100 GB 儲存。您可選取較大的 CR.4X 執行個體類型 (提供 16 個 vCPU、120 GB 記憶體和 400 GB 儲存),進而選擇分配更多資源來執行 Spark SQL 工作負載。較大的執行個體大小可以受益於處理大量資料並執行複雜分析的 SQL 工作負載,而這有助於將工作負載分配到更多資源中。在這裡進一步了解每個組態的相關 vCPU、記憶體和儲存。

在彙總分析規則中,您可以設定資料欄層級的控制,用其協助自己定義如何在查詢中使用每個資料欄。例如,您可以指定哪些資料欄可以用於計算彙總統計資料 (例如 SUM(price)) — 以及哪些資料欄可以用於將您的資料表加入其他協作成員的資料。在彙總分析規則中,您也可以定義每個輸出資料列必須符合的最低彙總閾值。AWS Clean Rooms 會自動篩掉不符合最低閾值的資料列。

是。您將能夠設定 AWS Clean Rooms 在 Amazon CloudWatch Logs 中發佈查詢日誌。您還可以使用自訂分析規則來審查查詢 (存放在分析範本中),然後再於協作中執行查詢。 

AWS Clean Rooms 差分隱私保護

全部開啟

差分隱私是保護經過數學驗證的框架,有助於保護資料隱私。差分隱私保護的主要益處是透過新增數量受控的隨機 (雜訊),掩蓋正在分析的資料集中是否存在任何單一個體,從而協助保護個人層級的資料。

只需幾個步驟,AWS Clean Rooms 差分隱私保護即可透過數學支援和直觀的控制項,協助您保護使用者的隱私。作為 AWS Clean Rooms 的完全受管功能,您無需具備差異隱私經驗來協助您防止使用者的重新識別。AWS Clean Rooms 差分隱私保護可遮蔽任何個人資料在協作中產生彙總洞察方面的貢獻,因此您可以執行廣泛的 SQL 查詢,以產生有關廣告活動、投資決策、臨床研究等等的洞察。

作為具有貢獻資料能力的成員,開始或加入 AWS Clean Rooms 協作後,只需幾個步驟即可開始使用 AWS Clean Rooms 差分隱私保護。建立對 AWS Glue Data Catalog 中表進行引用的已設定資料表後,您只需選擇開啟差分隱私保護,同時為已設定資料表新增自訂分析規則。接下來,您可以將已設定的資料表與 AWS Clean Rooms 協作關聯,並在協作中設定 Differential Privacy 政策,使您的表格可供查詢。您可以使用預設策略快速完成設定,或進行自訂以滿足特定需求。 若要在協作中套用 AWS Clean Rooms 差分隱私保護,您必須使用 Amazon S3 中儲存的資料。

設定 AWS Clean Rooms 差分隱私保護後,您的協作合作夥伴就可以開始在您的資料表上執行查詢 — 不需要任何差分隱私保護方面的專業知識或由合作夥伴進行其他設定。藉助 AWS Clean Rooms 差分隱私保護,查詢執行者可以執行自訂且靈活的分析,包括具有常見表格運算式 (CTE) 以及常用的彙總函數 (例如 COUNT 和 SUM) 的複雜查詢模式。

加密運算

全部開啟

加密運算是保護和加密使用中敏感資料的方法。資料可以在儲存時靜態加密,也可以在傳輸中及使用時動態加密。加密是指將純文字資料轉換成無法使用特定「金鑰」解密的編碼資料。 Private Set Intersection (PSI) 是一種密碼編譯運算方法,可讓握有資料集的兩方及多方比較加密的版本以進行運算。加密會在內部部署中使用協作者共用的私密金鑰進行。 C3R 可用於 Spark SQL 分析引擎或 SQL 分析引擎。

AWS Clean Rooms 包括 Cryptographic Computing for Clean Rooms (C3R),提供透過用戶端加密工具 (SDK 或命令列介面 (CLI)) 預先加密資料的選項;加密工具會在 AWS Clean Rooms 協作中與其他參與者使用共用的私密金鑰。這可以在執行查詢時加密資料。