AWS Clean Rooms 定价
AWS Clean Rooms 定价概述
借助 AWS Clean Rooms,您和您的合作伙伴可以分析集体数据、使用可增强隐私的机器学习(ML),并通过 AWS Clean Rooms 上的 AWS Entity Resolution 数据匹配服务来解析记录,以便满足您的业务需求。当您在 AWS Clean Rooms 中分析集体数据时,您或指定的协作者以洁净室处理单元(CRPU)小时为单位,为协作运行的 PySpark 或 SQL 查询的计算付费。请在下方详细了解 CRPU 小时。当您使用 AWS Clean Rooms ML 自定义建模时,您需要根据用于训练和/或推理的每百万条记录的价格、您选择的计算实例类型的使用量,以及为从协作的训练和推理中创建输入数据而运行的 Spark SQL 查询的计算容量付费。使用 AWS Clean Rooms ML 相似建模时,您只需按每 1000 个配置文件的价格为您请求的模型训练和创建的相似分段付费。当您使用 AWS Clean Rooms 上的 AWS Entity Resolution 数据匹配服务时,您需要按每 1000 条记录的价格付费。
注意:定价可能因 AWS 区域而异,具体情况取决于您使用的功能,AWS Free Tier 不适用于 AWS Clean Rooms、AWS Clean Rooms ML 或 AWS Entity Resolution 数据匹配服务中的 PySpark。
AWS Clean Rooms 已在以下 AWS 区域中推出:美国东部(弗吉尼亚州北部)、美国东部(俄亥俄州)、美国西部(俄勒冈州)、亚太地区(首尔)、亚太地区(新加坡)、亚太地区(悉尼)、亚太地区(东京)、欧洲地区(法兰克福)、欧洲地区(爱尔兰)、欧洲地区(伦敦)和欧洲地区(斯德哥尔摩)。
AWS Free Tier
Free Plan 不适用于 AWS Clean Rooms Free Plan。新的 AWS 客户可以免费开始使用,还可以使用 AWS Clean Paid Plan 专属积分。
-
PySpark 定价
-
SQL 定价
-
AWS Clean Rooms ML 定价
-
AWS Clean Rooms 上的 AWS Entity Resolution 数据匹配服务定价
-
额外费用
-
PySpark 定价
-
AWS Clean Rooms 中的 PySpark 以 Clean Rooms 协作方式在 Spark SQL 分析引擎上运行。您也可以选择使用 Spark SQL 或 SQL 方言来运行查询。要了解详情,请参阅 Spark SQL 或 SQL 定价。AWS Clean Rooms 中的 PySpark 以每秒为单位测量洁净室处理单元(CRPU)小时的计算容量(需要支付 10 分钟的最低费用)。
AWS Clean Rooms 中的 PySpark 根据运行 PySpark 作业时消耗的 CRPU 数量,按小时费率付费。您需要按每 CRPU 小时的价格为计算使用量付费,并且可以选择不同的实例来运行查询。您可以根据性能、规模和成本要求,选择计算引擎配置来运行 PySpark 作业。默认情况下,AWS Clean Rooms 为每个 PySpark 作业分配 32 个 CRPU,您可以选择将工作负载大小配置为最多 256 个 CRPU 或者最少 8 个 CRPU。默认情况下,AWS Clean Rooms 为每个 PySpark 作业分配 32 个 CRPU。您无需管理任何资源,也无需为启动或关闭时间付费。当您使用 PySpark 时,可以进行配置,让运行 PySpark 作业的协作者或者参与协作的任何成员来负责付款。负责付款的成员需要为协作中的所有 PySpark 作业付费。
您可以选择实例类型和实例(工作线程)数量来运行 PySpark 作业。对于 CR.1X,您可以选择最多 128 个工作线程或者最少 4 个工作线程。对于 CR.4X,您可以选择最多 32 个工作线程或者最少 4 个工作线程。例如:
实例类型 实例 总计 CRPU 小时 CR.1X 4 8 CR.1X(默认) 16(默认) 32(默认) CR.1X 128 256 CR.4X 4 32 CR.4X 32 256 PySpark 定价维度
PySpark 计算:您需要根据月度使用量,按每 CRPU 小时的价格(因 AWS 区域而异)为 PySpark 作业运行时花费的时间长度付费。AWS Clean Rooms 中的 PySpark 以每秒为单位测量洁净室处理单元(CRPU)小时的计算容量(需要支付 10 分钟的最低费用)。 AWS Clean Rooms 中的 PySpark 因 AWS 区域而异。
PySpark 自定义分析规则定价示例
示例 1 – PySpark 作业(活动衡量)
您需要使用 PySpark,对从广告商的数据集配置的表运行自定义分析,以便衡量活动效果。您的 PySpark 作业运行 3 分钟,在美国东部(弗吉尼亚州北部)的 AWS Clean Rooms 协作中,需要每月接受一次处理。您需要在具有 CR.1X 和 16 个实例的 AWS Clean Rooms 计算配置中使用 PySpark,它将使用 32 个 CRPU 的总容量来运行作业。每个 AWS Clean Rooms PySpark 作业需要支付 10 分钟的最低费用*。
下表汇总了您当月的总使用量:
查询执行期 作业每月运行一次,耗时 3 分钟(10 分钟的最低费用*)= 600 秒/3600 = 0.167 小时 已用月度容量 5.3 个 CRPU =(0.167 小时 * 32 个 CRPU,使用 CR.1X 和 16 个实例) 月度费用 21.33 美元 =(5.3 个 CRPU * 每 CRPU 小时 4.00 美元) *AWS Clean Rooms 中的 PySpark 以每秒为单位测量洁净室处理单元(CRPU)小时的计算容量(需要支付 10 分钟的最低费用)。每个 AWS Clean Rooms PySpark 作业需要支付的最低费用为 0.167 小时 = 10 分钟 = 600 秒/3600 秒。
示例 2 – PySpark 作业(欺诈检测)
您需要使用 PySpark,对从金融机构配置的表运行自定义分析,以便识别欺诈交易。您的 PySpark 作业运行 5 分钟,在美国东部(弗吉尼亚州北部)的 AWS Clean Rooms 协作中,需要每天接受一次处理。您需要在具有 CR.4X 和 4 个实例的 AWS Clean Rooms 计算配置中使用 PySpark,它将使用 32 个 CRPU 的总容量来运行作业。每个 AWS Clean Rooms PySpark 作业需要支付 10 分钟的最低费用*。
下表汇总了您当月的总使用量:
查询执行期 作业每天运行一次,耗时 5 分钟(10 分钟的最低费用*)= 600 秒/3600 = 0.167 小时 已用每日容量 5.3 个 CRPU =(0.167 小时 * 32 个 CRPU,使用 CR.4X 和 4 个实例) 每日费用 21.33 美元 =(5.3 个 CRPU * 每 CRPU 小时 4.00 美元) 月度费用 640.00 美元 =(21.33 美元 * 30) *AWS Clean Rooms 中的 PySpark 以每秒为单位测量洁净室处理单元(CRPU)小时的计算容量(需要支付 10 分钟的最低费用)。每个 AWS Clean Rooms PySpark 作业需要支付的最低费用为 0.167 小时 = 10 分钟 = 600 秒/3600 秒。
示例 3 – PySpark 作业(临床研究)
您需要在获得适当患者同意的情况下,使用 PySpark 在多个医疗提供商数据集的临床试验中评估药物依从性。您可以使用 PySpark,对从 AWS Clean Rooms 协作中的多个协作成员配置的表运行自定义分析。您的 PySpark 作业运行 12 分钟,在美国东部(弗吉尼亚州北部)的 AWS Clean Rooms 协作中,需要每天接受两次处理。您需要在具有 CR.1X 和 12 个实例的 AWS Clean Rooms 计算配置中使用 PySpark,它将使用 24 个 CRPU 的总容量来运行作业。
下表汇总了您当月的总使用量:
查询执行期 作业每天运行两次,每次耗时 12 分钟 = 24 分钟 = 1440 秒/3600 = 0.40 小时 已用每日容量 9.6 个 CRPU =(0.40 小时 * 24 个 CRPU,使用 CR.1X 和 12 个实例) 每日费用 38.40 美元 =(9.6 个 CRPU * 每 CRPU 小时 4.00 美元) 月度费用 1152.00 美元 =(38.40 美元 * 30) 示例 4 – PySpark 作业(多方归因)
您需要使用 PySpark,对多个发布者数据集运行多方归因模型,以便衡量营销渠道。您可以使用 PySpark,对从 AWS Clean Rooms 协作中的多个协作成员配置的表运行自定义分析。您的 PySpark 作业运行 10 分钟,在美国东部(弗吉尼亚州北部)的 AWS Clean Rooms 协作中,需要每天接受两次处理。您需要在具有 CR.4X 和 8 个实例的 AWS Clean Rooms 计算配置中使用 PySpark,它将使用 64 个 CRPU 的总容量来运行作业。
下表汇总了您当月的总使用量:
查询执行期 作业每天运行两次,每次耗时 10 分钟 = 20 分钟 = 1200 秒/3600 = 0.33 小时 已用每日容量 21.3 个 CRPU =(0.33 小时 * 64 个 CRPU,使用 CR.4X 和 8 个实例) 每日费用 85.33 美元 =(21.3 个 CRPU * 每 CRPU 小时 4.00 美元) 月度费用 2560.00 美元 =(85.33 美元 * 30) -
SQL 定价
-
借助 AWS Clean Rooms,您可以在 AWS Clean Rooms 协作中使用 Spark SQL 方言来运行查询。AWS Clean Rooms Spark SQL 可提供可配置的计算大小,以便在运行 SQL 工作负载时更好地控制性价比。
-
Spark SQL 定价
-
Spark SQL 定价
-
AWS Clean Rooms 以每秒为单位测量洁净室处理单元(CRPU)小时的计算容量(需要支付 60 秒的最低费用)。您无需管理任何资源和预付任何费用,也无需为启动或关闭时间付费。当您在 AWS Clean Rooms 上运行 Spark SQL 查询时,可以进行配置,让运行查询的协作者或者参与协作的任何成员来负责付款。负责付款的成员需要为协作中的所有查询付费。
AWS Clean Rooms PySpark SQL 根据运行查询时使用的 CRPU 数量,按小时费率付费。您需要按每 CRPU 小时的价格为计算使用量付费,并且可以选择不同的实例来运行查询。默认情况下,AWS Clean Rooms 为每个 Spark SQL 查询分配 32 个 CRPU。
您可以选择实例类型和实例(工作线程)数量来运行 Spark SQL 查询。对于 CR.1X,您可以选择最多 128 个工作线程或者最少 2 个工作线程。对于 CR.4X,您可以选择最多 32 个工作线程或者最少 2 个工作线程。例如:
实例类型 实例 总计 CRPU 小时 CR.1X 2 4 CR.1X(默认) 16(默认) 32(默认) CR.1X 128 256 CR.4X 8 64 CR.4X 32 256 注意:您可以选择具有更多实例的计算引擎配置,以便为 Spark SQL 查询分配更多资源。更高的计算引擎配置会将工作负载分配给更多的实例,以便满足您的作业要求和限制。请在此处详细了解每种配置的相关 vCPU、内存和存储。
Spark SQL 规则定价维度
Spark SQL 计算:您需要按每 CRPU 小时的价格为 Spark SQL 查询运行时花费的时间长度付费。AWS Clean Rooms Spark SQL 计算定价因 AWS 区域而异。
Spark SQL 定价示例
示例 1 – Spark SQL 查询(使用具有 16 个实例的默认 CR.1X)
您需要使用 Spark SQL 查询,对从多个协作成员配置的表运行分析。您的 Spark SQL 查询运行 3 分钟,在美国东部(弗吉尼亚州北部)的 AWS Clean Rooms 协作中,需要每天接受三次处理。您需要使用具有 CR.1X 和 16 个实例的默认 AWS Clean Rooms Spark SQL 计算引擎配置,它将使用每小时 32 个 CRPU 的总容量来运行查询。
下表汇总了您当天和当年的总使用量:
查询执行期 查询每天运行三次,每次耗时 3 分钟 = 9 分钟 = 540 秒/3600 = 0.150 小时 已用容量 4.8 个 CRPU =(0.150 小时 * 32 个 CRPU 小时,使用 CR.1X 和 16 个实例) 每日费用 9.60 美元 =(4.8 个 CRPU * 每 CRPU 小时 2.00 美元) 年度费用 3504.00 美元 = 9.60 美元 * 365 示例 2 – Spark SQL 查询(使用具有 8 个实例的 CR.4X)
您需要使用 Spark SQL 查询,对从多个协作成员配置的表运行分析。您的 Spark SQL 查询在美国东部(弗吉尼亚州北部)的 AWS Clean Rooms 协作中每天运行一次,耗时 3 分钟。您选择使用具有 CR.4X 和 8 个实例的 AWS Clean Rooms Spark SQL 计算引擎配置,它将使用每小时 64 个 CRPU 的总容量来运行查询。
下表汇总了您当天和当年的总使用量:
查询执行期 查询运行一次,耗时 3 分钟 = 180 秒/3600 = 0.050 小时 已用容量 3.2 个 CRPU =(0.050 小时 * 64 个 CRPU 小时,使用 CR.4X 和 8 个实例) 每日费用 6.40 美元 =(3.2 个 CRPU * 每 CRPU 小时 2.00 美元) 年度费用 2336.00 美元 = 6.40 美元 * 365 示例 3 – 已启用 AWS Clean Rooms Differential Privacy 差异化隐私管控功能的 Spark SQL 查询
您需要使用 Spark SQL 查询,对从多个协作成员配置的表运行分析,并使用 AWS Clean Rooms Differential Privacy 差异化隐私管控功能来提供一层额外的保护。每 CRPU 小时的总费用为 4.00 美元(Spark SQL 计算每 CRPU 小时 2.00 美元 + AWS Clean Rooms Differential Privacy 差异化隐私管控功能每 CRPU 小时 2.00 美元)。在美国东部(弗吉尼亚州北部)的 AWS Clean Rooms 协作中,查询需要每天接受一次处理。您需要使用具有 CR.1X 和 16 个实例的默认 AWS Clean Rooms Spark SQL 计算引擎配置,它将使用每小时 32 个 CRPU 的总容量来运行查询。您的平均查询完成时间为 4.5 分钟。
下表汇总了您当天和当年的总使用量:
查询执行期 查询运行一次,耗时 4.5 分钟 = 270 秒/3600 = 0.075 小时 已用容量 2.4 个 CRPU =(0.075 小时 * 32 个 CRPU 小时,使用 CR.1X 和 16 个实例) 每日费用 9.60 美元 =(2.4 个 CRPU * 每 CRPU 小时 4.00 美元) 年度费用 3504.00 美元 = 9.60 美元 * 365
-
-
AWS Clean Rooms ML 定价
-
AWS Clean Rooms ML 支持自定义和相似机器学习(ML)建模。借助自定义建模,您可以提供自定义模型,以便进行训练并对集体数据集运行推理,而无需在协作者之间共享基础数据或知识产权。您可以选择生成合成数据集来训练您的自定义机器学习模型。借助相似建模,您可以使用 AWS 制作的模型,根据合作伙伴为协作提供的少量配置文件样本来生成一组扩展的相似配置文件。
注意:AWS 免费套餐不适用于 AWS Clean Rooms ML。
-
自定义建模定价
-
合成数据集定价
-
相似建模定价
-
自定义建模定价
-
当您运行 AWS Clean Rooms ML 自定义建模时,您需要根据成本的三个维度,为训练和/或推理付费,这三个维度包括按每百万条记录的价格付费的记录数量、您选择的计算实例类型的使用量,以及为从协作的训练和推理中创建输入数据而运行的 Spark SQL 查询的计算容量。有关成本的三个维度的详情,请参阅下文。
注意:要应用 AWS Clean Rooms ML 自定义建模,您必须将 Spark SQL 用作分析引擎。有关详情,请参阅 AWS Clean Rooms Spark SQL 定价。
自定义建模定价维度
1.记录数量:您需要按每百万条记录的价格为记录数量付费。 根据每月处理的用于训练或推理的记录数量,需要按不同的定价付费。
注意:用于训练和推理的记录数量的定价不因 AWS 区域而异。
2.自定义建模计算:您需要为您选择的计算实例类型的使用量以及完成训练和推理的时间长度付费。
注意:AWS Clean Rooms ML 自定义建模计算定价可能因 AWS 区域而异,具体情况取决于您使用的功能。您需要根据您运行的每个训练和推理作业的时间长度,为计算付费。
3.Spark SQL 计算:您需要按每 CRPU 小时的价格为 Spark SQL 查询运行时花费的时间长度付费,并且可以选择不同的实例来运行查询。您可以根据性能、规模和成本要求,从 4 个计算引擎配置选项中进行选择,以便运行您的查询。默认情况下,AWS Clean Rooms 为每个 Spark SQL 查询分配 32 个 CRPU,您可以选择最多 256 个 CRPU 或者最少 4 个 CRPU 的工作负载大小。
注意:要应用 AWS Clean Rooms ML 自定义建模,您必须将 Spark SQL 用作分析引擎。有关详情,请参阅 AWS Clean Rooms Spark SQL 定价。
自定义建模定价示例(用于训练)
您需要使用 AWS Clean Rooms ML 自定义建模来训练专有模型,以便检测另一个金融机构的欺诈交易。您需要利用一个集体数据集来训练此模型,此数据集由您和另一个协作者的 3000 万条交易记录组成。您需要使用 ml.p3.8xlarge 实例,每个训练作业平均需要 6 小时才能完成。用于拉取可疑交易列表的 Spark SQL 查询运行 1 小时。您需要使用具有 CR.1X 和 16 个实例的 AWS Clean Rooms Spark SQL 计算引擎配置,它将使用每小时 32 个 CRPU 的总容量来运行查询。
下表汇总了您在美国东部(弗吉尼亚州北部)的使用量和费用:
训练数据集内的记录数量
3000 万条记录
300.00 美元 = 3000 万 * 每 1000 条记录 0.01 美元
自定义建模计算
ml.p3.8xlarge 耗时 6 小时
88.128 美元 = 14.688 美元 x 6 小时
用于训练数据的 Spark SQL 计算 32 个 CRPU 小时,使用 CR.1X 和 16 个实例,耗时 1 小时
64.00 美元 =(1 小时 * 32 个 CRPU * 每 CRPU 小时 2.00 美元)
每次训练的总费用
452.128 美元 = 300.00 美元 + 88.128 美元 + 64.00 美元
自定义建模定价示例(用于推理)
您需要使用 AWS Clean Rooms ML 自定义建模,预测潜在客户在电子商务网站上点击您的广告的可能性。您需要对一个数据集进行推理,此数据集包含来自电子商务合作伙伴的 500 亿条客户记录。您需要使用 ml.m5.4xlarge,每个推理作业平均需要 2 小时才能完成。Spark SQL 查询运行 1 小时,以便生成用于推理的数据。您需要使用具有 CR.4X 和 8 个实例的 AWS Clean Rooms Spark SQL 计算引擎配置,它将使用每小时 64 个 CRPU 的总容量来运行查询。
下表汇总了您在美国东部(弗吉尼亚州北部)的使用量和费用:
推理数据集内的记录数量
500 亿条记录
19800.00 美元 = 10000.00 美元 + 9800.00 美元 =(每百万条记录 10.00 美元 * 1000)+(每百万条记录 0.20 美元 * 49000)
自定义建模计算
ml.m5.4xlarge 耗时 2 小时
1.844 美元 = 0.922 美元 x 2 小时
用于推理的 Spark SQL 计算 64 个 CRPU 小时,使用 CR.4X 和 8 个实例,耗时 1 小时
128.00 美元 =(1 小时 * 64 个 CRPU * 每 CRPU 小时 2.00 美元)
每次推理的总费用
19929.84 USD = 19800.00 USD + 1.844 USD + 128.00 USD
-
合成数据集定价
-
借助 AWS Clean Rooms ML 自定义建模,您和您的合作伙伴可以从您的集体数据中生成具有统计代表性的合成数据集,以便训练回归和分类机器学习模型,而无需泄露原始数据中的敏感信息。
在 AWS Clean Rooms 中,生成用于进行自定义机器学习并且可增强隐私的合成数据集,以便衡量合成数据生成单元(SDGU)中的计算容量。您需要按每个 SDGU 的价格,为用于运行生成作业的计算资源付费。有关详情,请参阅文档。
注意:合成数据集生成功能的定价不因 AWS 区域而异。
类型 定价 合成数据生成计算 每个 SDGU 2.00 美元 您的作业消耗的 SDGU 数量取决于您尝试合成的数据集的大小和复杂程度。以下示例可帮助您根据开源天气预报数据的变化,估算合成数据集生成作业的费用。
行 列 SDGU 10 万 15 152 250 万 100 1844 100 万 1000 15219 注意:仅供参考。您的合成数据集生成作业的价格可能无法反映所提供的示例。
合成数据集生成定价示例
您需要使用合作伙伴的用户级数据来训练模型。您需要每周创建一个新的合成数据集来训练模型。每个合成数据生成作业消耗 100 个 SDGU。
下表汇总了您当月的总使用量:
消耗的合成数据生成单元
每月 400 个 SDGU = 100 个 SDGU * 每月 4 个作业 月度总费用
800.00 USD = 每月 400 个 SDGU * 每个 SDGU 2.00 USD -
相似建模定价
-
在 AWS Clean Rooms ML 中运行 AWS 人工智能相似建模时,您只需按每 1000 个配置文件的价格,为您请求并由 AWS 制作的模型训练和创建的相似分段付费。模型所有者需要为训练和分段生成作业付费。
注意:定价不因 AWS 区域而异。
相似建模定价维度
维度 价格
用于训练数据集的每 1000 个配置文件的价格 每 1000 个配置文件 0.04 美元 相似分段中的每 1000 个配置文件的价格 每 1000 个配置文件 0.25 美元 相似建模定价示例
您需要使用 AWS Clean Rooms ML 相似建模来训练 AWS 制作的模型,并关联大约 5000 万个客户的交互数据。一个与您协作的合作伙伴在一周内请求 10 个相似分段,每个分段的平均大小为 200 万个配置文件。
下表汇总了您的每周使用量和费用:
训练数据集内的配置文件数量(每周)
5000 万个配置文件
2000 美元 = 5000 万 * 每 1000 个配置文件 0.04 美元
每个分段的配置文件数量
200 万个配置文件
500 美元 = 200 万 * 每 1000 个配置文件 0.25 美元
分段数量 10
5000 美元 = 10 * 每个分段 500 美元
每周总费用
7000 美元 = 2000 美元 + 5000 美元
-
-
AWS Clean Rooms 上的 AWS Entity Resolution 数据匹配服务定价
-
当您使用 AWS Clean Rooms 上的 AWS Entity Resolution 数据匹配服务时,您需要按每 1000 条记录的价格付费。您可以借助提供商数据集(例如 LiveRamp),使用基于规则的匹配或基于数据服务提供商的匹配来准备数据,并将记录与协作者的数据集进行匹配。
注意:定价不因 AWS 区域而异,AWS Free Tier 不适用于 AWS Clean Rooms 上的 AWS Entity Resolution 数据匹配服务。如果使用基于数据服务提供商的匹配,您必须订阅提供商的服务。定价不包含由于使用第三方的服务而向他们支付的任何费用。您可以使用 AWS Data Exchange(ADX)上列出的公共订阅,也可以直接通过您选择的数据服务提供商购买私有订阅,然后对 ADX 使用自带订阅(BYOS)。要在 AWS Clean Rooms 之外使用 AWS Entity Resolution 数据匹配服务,请在此处详细了解它的定价。
AWS Clean Rooms 上的 AWS Entity Resolution 数据匹配服务已在以下 AWS 区域中推出:基于规则的匹配只在美国东部(俄亥俄州)、美国东部(弗吉尼亚州北部)、美国西部(俄勒冈州)、亚太地区(首尔)、亚太地区(新加坡)、亚太地区(悉尼)、亚太地区(东京)、欧洲地区(法兰克福)、欧洲地区(爱尔兰)和欧洲地区(伦敦)推出。基于数据服务提供商的匹配只适用于美国东部(俄亥俄州)、美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)。
-
数据准备定价
-
数据匹配定价
-
数据准备定价
-
数据准备定价维度
当您使用基于规则的匹配时,协作中的至少一个成员必须准备数据,才能与合作伙伴的数据集进行匹配。当您使用基于数据服务提供商的匹配时,所有协作成员都必须使用提供商 ID 来准备数据集,才能与合作伙伴的数据集进行数据匹配。
维度 价格 用于准备数据的每 1000 条记录的价格
每处理 1000 条记录 0.10 美元
注意:在参与 AWS Clean Rooms 协作之前,如果已经使用 AWS Entity Resolution 数据匹配服务来准备数据,您可以在 AWS Clean Rooms 协作中使用此数据集进行匹配。您无需再次准备数据。
-
数据匹配定价
-
数据匹配定价维度
协作中的任何成员都可以为数据匹配付费。对于基于规则的匹配,一个协作者必须为每次协作一次性支付 100.00 美元的匹配费用,此费用将分配给任何为数据匹配付费的协作者。
匹配技术 维度 价格 基于规则 用于数据匹配的每 1000 条记录的价格 每匹配 1000 条记录 0.50 美元 基于数据服务提供商* 用于基于数据服务提供商进行匹配的每 1000 条记录的价格 每处理 1000 条记录 0.10 美元 *对于基于数据服务提供商的匹配,所有成员都必须准备各自的数据集,才能使用提供商 ID 进行数据匹配。
基于规则的匹配定价示例
您需要与协作者一起使用 AWS Clean Rooms 上的 AWS Entity Resolution 数据匹配服务,以便使用基于规则的匹配来匹配记录。您的数据集具有 100 万条记录。您一劳永逸地对所有记录运行一次这一匹配。您需要首先准备数据,然后将记录与协作者进行匹配。使用 AWS Entity Resolution 数据匹配服务运行基于规则的匹配工作流之后,您将获得 60% 的匹配率(60% 是一个用于说明定价的示例;匹配率因具体情况而异)。协作中的所有成员都同意,您将成为数据准备、匹配和基本费用的付款人。
下表汇总了您当天的总使用量:
为准备数据而处理的记录数量 100 万 100.00 美元 = 100 万条记录 * 每 1000 条记录 0.10 美元 为进行数据匹配而匹配的记录数量 60 万 300.00 美元 = 100 万条记录 * 60% 的记录匹配率 * 每 1000 条记录 0.50 美元 数据匹配的基本费用 100.00 美元 100.00 美元 = 每次协作的数据匹配基本费用 总费用 500.00 美元 = 100.00 美元 + 300.00 美元 + 100.00 美元
基于数据服务提供商的匹配定价示例
您需要与协作者一起使用 AWS Clean Rooms 上的 AWS Entity Resolution 数据匹配服务,以便使用基于数据服务提供商的匹配和 LiveRamp(RampID)来匹配记录。您和协作者已经使用提供商 ID 准备了数据集。您的数据集具有 100 万条记录。您需要将您的数据与协作者的数据(包含 500 万条记录)进行匹配,不过协作者的数据集大小不会影响您的费用,因为您只需为处理的记录付费。协作中的所有成员都同意,您将成为付款人,不过,如果您的协作者是付款人,他们仍然需要指定要处理的记录列表(在本例中为 100 万条记录),以便为处理的 100 万条记录付费。您可以借助基于数据服务提供商的匹配技术,使用 LiveRamp 进行匹配。要使用 LiveRamp,您必须已经拥有一个提供商许可证,这是使用这种匹配技术所必需的。
下表汇总了您的总费用:
为进行数据匹配而处理的记录数量 100 万 100.00 美元 = 100 万条记录 * 每 1000 条记录 0.10 美元 总费用 100.00 美元(除了提供商订阅费用以外) 注意:如果使用基于数据服务提供商的匹配并为其付费,您必须订阅提供商的服务。定价不包含由于使用第三方的服务而向他们支付的任何费用。您可以使用 AWS Data Exchange(ADX)上列出的公共订阅,也可以直接通过您选择的数据服务提供商购买私有订阅,然后对 ADX 使用自带订阅(BYOS)。所有成员都必须使用提供商 ID 来准备各自的数据集,才能进行数据匹配。
-
-
额外费用
-
AWS Clean Rooms 查询来自 Amazon Simple Storage Service(Amazon S3)的数据和来自 AWS Glue Data Catalog 的元数据。使用 AWS Clean Rooms 查询数据时,无需支付额外的存储费用。对于为协作贡献了数据的每个协作成员,如果在查询中使用了他们的数据集,他们需要支付标准的 Amazon S3 API 费用和检索费用以及 AWS Glue Data Catalog API 费用。
- 当您的工作负载读取、存储和传输数据时,S3 会向您收费。查询结果存储在您选择的 S3 存储桶中,并按标准 Amazon S3 费率计费。有关详情,请参阅 Amazon S3 定价。
- 对于向 AWS Glue Data Catalog 发出的请求,AWS Glue 会向您收费。有关详情,请参阅 AWS Glue 定价。