使用 AWS Glue 时,您需要按小时费率(按秒计)为抓取程序(发现数据)和 ETL 作业(处理和加载数据)付费。对于 AWS Glue 数据目录,您需要为元数据的存储和访问支付简单月度费用。前 100 万个对象的存储和前 100 万次访问都是免费的。如果您预置了开发终端节点并以交互式方法开发 ETL 代码,那么您需要按小时费率付费(按秒计)。

注意:定价可能因区域而异。

  • ETL 作业和开发终端节点
  • 数据目录存储和请求
  • 抓取程序
  • ETL 作业和开发终端节点
  • 数据目录存储和请求
  • 抓取程序

定价示例

ETL 作业示例:假设一个 Apache Spark 类型的 AWS Glue 作业运行了 10 分钟且使用了 6 个 DPU。1 个 DPU 小时的价格为 0.44 USD。由于您的作业运行了 10 分钟(即一小时的 1/6)并使用了 6 个 DPU,您需要支付的费用为 6 个 DPU * 1/6 小时 * 0.44 USD/DPU 小时,即 0.44 USD。

开发终端节点示例:现在来假设您预置了一个开发终端节点来连接您的笔记本电脑,从而以交互式方法开发您的 ETL 代码。此外,您为这个开发终端节点预置了 5 个 DPU。如果您让该开发终端节点运行了 24 分钟(即一小时的 2/5),则您需要支付的费用为 5 个 DPU * 2/5 小时 * 0.44 USD/DPU 小时,即 0.88 USD。

AWS Glue 数据目录免费套餐示例:让我们假设您在给定月份在 AWS Glue 数据目录中存储了 100 万个表格,并对这些表格发出了 100 万个访问请求。在这种情况下,您无需支付任何费用,因为您使用的资源均包含在 AWS Glue 数据目录免费套餐中。您每月可免费存储 100 万个对象和发出 100 万个请求。

AWS Glue 数据目录示例:现在来假设您每月仍存储了 100 万个表格,但您每月发出的请求数翻了一番,即 200 万个。假设您还使用了抓取程序来发现新表格,它们运行了 30 分钟,并使用了 2 个 DPU。

您的存储费用仍然为 0 USD,因为您存储的前 100 万个表格是免费的。您的前 100 万个请求也是免费的。您将需要为超出免费套餐的 100 万个请求付费,即 1 USD。抓取程序的费用为每个 DPU 小时 0.44 USD,因此您需要为其支付的费用为 2 个 DPU * 1/2 小时 * 0.44 USD/DPU 小时,即 0.44 USD。您在该月总共需要支付 1.44 USD。

ML 转换示例:与 AWS Glue 作业运行类似,在您的数据中运行 ML 转换(包括 FindMatches)的成本将因数据大小、数据内容和所使用的节点数量和类型而异。在以下示例中,我们使用 FindMatches 来整合不同数据源中的兴趣点信息。数据集大小约为 11,000,000 行 (1.6GB),标记数据(例如真匹配或真不匹配数据)大小约为 8,000 行 (641kb),且在 16 个 G.2x 类实例中运行时,34 分钟标签集生成运行时间的成本为 8.23 USD,11 分钟指标估计运行时间的成本为 2.66 USD,而 32 分钟 FindingMatches 作业执行运行时间的成本为 7.75 USD。 

注意:定价可能因区域而异。 

查看全球区域表,详细了解支持 AWS Glue 的区域

其他定价资源

TCO 计算器

计算您的总体拥有成本 (TCO)

简单月度成本结算器

轻松计算 AWS 的月度费用

经济资源中心

用于切换到 AWS 的其他资源

Product-Page_Standard-Icons_01_Product-Features_SqInk
了解如何开始使用

访问“入门”页面。

了解更多 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
注册免费账户

立即享受 AWS 免费套餐。 

注册 
Product-Page_Standard-Icons_03_Start-Building_SqInk
开始在控制台中构建

在 AWS 管理控制台中,使用 AWS Glue 开始构建。

登录