使用 AWS Glue 时,您需要按小时费率(按秒计)为抓取程序(发现数据)和 ETL 作业(处理和加载数据)付费。对于 AWS Glue 数据目录,您需要为元数据的存储和访问支付简单月度费用。前 100 万个对象的存储和前 100 万次访问都是免费的。如果您预置了开发终端节点并以交互式方法开发 ETL 代码,那么您需要按小时费率付费(按秒计)。对于 AWS Glue DataBrew,交互式会话按每次会话计费,DataBrew 作业按每分钟计费。 用户可免费使用 AWS Glue Schema 注册表。
注意:定价可能因区域而异。
-
ETL 作业和开发终端节点
-
数据目录存储和请求
-
抓取程序
-
DataBrew 交互式会话
-
DataBrew 作业
-
Elastic Views
-
ETL 作业和开发终端节点
-
定价示例
ETL 作业示例:假设一个 Apache Spark 类型的 AWS Glue 作业运行了 10 分钟且使用了 6 个 DPU。1 个 DPU 小时的价格为 0.44 USD。由于您的作业运行了 10 分钟(即一小时的 1/6)并使用了 6 个 DPU,您需要支付的费用为 6 个 DPU * 1/6 小时 * 0.44 USD/DPU 小时,即 0.44 USD。
开发终端节点示例:现在来假设您预置了一个开发终端节点来连接您的笔记本电脑,从而以交互式方法开发您的 ETL 代码。此外,您为这个开发终端节点预置了 5 个 DPU。如果您让该开发终端节点运行了 24 分钟(即一小时的 2/5),则您需要支付的费用为 5 个 DPU * 2/5 小时 * 0.44 USD/DPU 小时,即 0.88 USD。
ML 转换示例:与 AWS Glue 作业运行类似,在您的数据中运行 ML 转换(包括 FindMatches)的成本将因数据大小、数据内容和所使用的节点数量和类型而异。在以下示例中,我们使用 FindMatches 来整合不同数据源中的兴趣信息。数据集大小约为 11,000,000 行 (1.6GB),标记数据(例如真匹配或真不匹配数据)大小约为 8,000 行 (641kb),且在 16 个 G.2x 类实例中运行时,34 分钟标签集生成运行时间的成本为 8.23 USD,11 分钟指标估计运行时间的成本为 2.66 USD,而 32 分钟 FindingMatches 作业执行运行时间的成本为 7.75 USD。
-
数据目录存储和请求
-
定价示例
AWS Glue 数据目录免费套餐示例:让我们假设您在给定月份在 AWS Glue 数据目录中存储了 100 万个表格,并对这些表格发出了 100 万个访问请求。在这种情况下,您无需支付任何费用,因为您使用的资源均包含在 AWS Glue 数据目录免费套餐中。您每月可免费存储 100 万个对象和发出 100 万个请求。
AWS Glue 数据目录示例:现在来假设您每月仍存储了 100 万个表格,但您每月发出的请求数翻了一番,即 200 万个。假设您还使用了抓取程序来发现新表格,它们运行了 30 分钟,并使用了 2 个 DPU。
您的存储费用仍然为 0 USD,因为您存储的前 100 万个表格是免费的。您的前 100 万个请求也是免费的。您将需要为超出免费套餐的 100 万个请求付费,即 1 USD。抓取程序的费用为每个 DPU 小时 0.44 USD,因此您需要为其支付的费用为 2 个 DPU * 1/2 小时 * 0.44 USD/DPU 小时,即 0.44 USD。您在该月总共需要支付 1.44 USD。
-
抓取程序
-
-
DataBrew 交互式会话
-
定价示例
AWS Glue DataBrew 示例:每个 30 分钟交互式会话的价格为 1.00 USD。如果您将 2 个会话用于 AWS Glue DataBrew 项目,您需要支付的费用为 2 次交互式会话 * 1.00 USD/会话,即 2.00 USD。
如果 AWS Glue DataBrew 作业运行 10 分钟并使用 6 个 AWS Glue DataBrew 节点,则 1 节点-小时的价格为 0.48 USD。由于您的作业运行了 10 分钟(即一小时的 1/6)并使用了 6 个节点,您需要支付的费用为 6 个 节点 * 1/6 小时 * 0.48 USD/节点小时,即 0.48 USD。
-
DataBrew 作业
-
定价示例
AWS Glue DataBrew 示例:每个 30 分钟交互式会话的价格为 1.00 USD。如果您将 2 个会话用于 AWS Glue DataBrew 项目,您需要支付的费用为 2 次交互式会话 * 1.00 USD/会话,即 2.00 USD。
如果 AWS Glue DataBrew 作业运行 10 分钟并使用 6 个 AWS Glue DataBrew 节点,则 1 节点-小时的价格为 0.48 USD。由于您的作业运行了 10 分钟(即一小时的 1/6)并使用了 6 个节点,您需要支付的费用为 6 个节点 * 1/6 小时 * 0.48 USD/节点小时或 $0.48。
-
Elastic Views
-
示例 1:您可以创建一个视图,从 Amazon DynamoDB 表中复制数据,并将其具体化到 Amazon Elasticsearch Service 域。您的应用程序每小时将 0.5GB 数据写入 DynamoDB 表,平均每天 8 小时。由于该视图将数据从单个源复制到托管的 AWS 数据库和分析服务(从 DynamoDB 到 Elasticsearch Service)中的单个目标,因此该视图处理 1GB 的数据大约需要消耗 1 个 VPU 小时。整个月平均使用的表存储量为 100GB。
AWS Glue Elastic Views 每月费用:
视图处理 – 0.5GB/小时 × 1 VPU 小时/GB × 8 小时/天 × 30 天 × 0.16 USD/VPU 小时 = 19.20 USD
表存储 – 100GB × 0.023 USD/GB 月 = 2.30 USD
总计 – 19.20 USD + 2.30 USD = 21.50 USD示例 2:您可以创建一个视图,从 DynamoDB 表中复制数据,并将其具体化到 Amazon S3。您的应用程序每小时将 2GB 数据写入 DynamoDB 表中,平均每天 12 小时。因为此视图将数据从 DynamoDB 中的一个表(即托管 AWS 数据库服务)复制到 Amazon S3 中的一个存储桶(既不是托管数据库也不是分析服务),所以它处理 1GB 数据大约需要消耗 1.3 VPU 小时。整个月平均使用的表存储量为 150GB。
AWS Glue Elastic Views 每月费用:
视图处理 – 2 GB/小时 × 1.3 VPU 小时/GB × 12 小时/天 × 30 天 × 0.16 USD/VPU 小时 = 149.76 USD
表存储 – 150 GB × 0.023 USD/GB 月 = 3.45 USD
总计 – 149.76 USD + 3.45 USD = 153.21 USD
注意:定价可能因区域而异。
查看全球区域表,详细了解 AWS Glue 的供应情况