使用 AWS Glue 时,您需要按小时费率(按秒计)为抓取程序(发现数据)和 ETL 作业(处理和加载数据)付费。对于 AWS Glue 数据目录,您需要为元数据的存储和访问支付简单月度费用。前 100 万个对象的存储和前 100 万次访问都是免费的。如果您预置了开发终端节点并以交互式方法开发 ETL 代码,那么您需要按小时费率付费(按秒计)。

注意:定价可能因区域而异。

  • ETL 作业和开发终端节点
  • 数据目录存储和请求
  • 抓取程序
  • ETL 作业和开发终端节点
  • 数据目录存储和请求
  • 抓取程序

定价示例

ETL 作业示例:假设一个 Apache Spark 类型的 AWS Glue 作业运行了 10 分钟且使用了 6 个 DPU。1 个 DPU 小时的价格为 0.44 USD。由于您的作业运行了 10 分钟(即一小时的 1/6)并使用了 6 个 DPU,您需要支付的费用为 6 个 DPU * 1/6 小时 * 0.44 USD/DPU 小时,即 0.44 USD。

开发终端节点示例:现在来假设您预置了一个开发终端节点来连接您的笔记本电脑,从而以交互式方法开发您的 ETL 代码。此外,您为这个开发终端节点预置了 5 个 DPU。如果您让该开发终端节点运行了 24 分钟(即一小时的 2/5),则您需要支付的费用为 5 个 DPU * 2/5 小时 * 0.44 USD/DPU 小时,即 0.88 USD。

AWS Glue 数据目录免费套餐示例:让我们假设您在给定月份在 AWS Glue 数据目录中存储了 100 万个表格,并对这些表格发出了 100 万个访问请求。在这种情况下,您无需支付任何费用,因为您使用的资源均包含在 AWS Glue 数据目录免费套餐中。您每月可免费存储 100 万个对象和发出 100 万个请求。

AWS Glue 数据目录示例:现在来假设您每月仍存储了 100 万个表格,但您每月发出的请求数翻了一番,即 200 万个。假设您还使用了抓取程序来发现新表格,它们运行了 30 分钟,并使用了 2 个 DPU。

您的存储费用仍然为 0 USD,因为您存储的前 100 万个表格是免费的。您的前 100 万个请求也是免费的。您将需要为超出免费套餐的 100 万个请求付费,即 1 USD。抓取程序的费用为每个 DPU 小时 0.44 USD,因此您需要为其支付的费用为 2 个 DPU * 1/2 小时 * 0.44 USD/DPU 小时,即 0.44 USD。您在该月总共需要支付 1.44 USD。

ML 转换示例:与 AWS Glue 作业运行类似,在您的数据中运行 ML 转换(包括 FindMatches)的成本将因数据大小、数据内容和所使用的节点数量和类型而异。在以下示例中,我们使用 FindMatches 来整合不同数据源中的兴趣信息。数据集大小约为 11,000,000 行 (1.6GB),标记数据(例如真匹配或真不匹配数据)大小约为 8,000 行 (641kb),且在 16 个 G.2x 类实例中运行时,34 分钟标签集生成运行时间的成本为 8.23 USD,11 分钟指标估计运行时间的成本为 2.66 USD,而 32 分钟 FindingMatches 作业执行运行时间的成本为 7.75 USD。 

注意:定价可能因区域而异。 

查看全球区域表,详细了解 AWS Glue 的供应情况

其他定价资源

TCO 计算器

计算您的总体拥有成本 (TCO)

AWS 定价计算器

轻松计算 AWS 的月度费用

经济资源中心

用于切换到 AWS 的其他资源

AWS Glue 入门
了解如何开始使用 AWS Glue

访问“入门”页面。

了解更多 
注册 AWS 账户
注册免费账户

立即享受 AWS 免费套餐。 

注册 
开始在控制台中构建
开始在控制台中构建

在 AWS 管理控制台中,使用 AWS Glue 开始构建。

登录