AWS HealthOmics 定价

概览

使用 AWS HealthOmics,您只需按实际用量付费。您需要根据存储的数据量和用于处理工作流程的计算实例付费。借助 AWS HealthOmics,您可以存储序列和参考数据对象或变体和注释数据。您还可以运行生物信息学工作流程来分析和转换基因组、转录组和其他组学数据。 AWS HealthOmics 针对组学数据的存储和计算进行了优化,可与其他 AWS 服务(如 Amazon SageMaker、Amazon Simple Storage Service (S3) 和 Amazon Athena)配合使用。

免费套餐

作为 AWS Free Tier 的一部分,您可以免费开始使用 AWS HealthOmics。您的免费套餐从您创建第一个 AWS HealthOmics 资源的第一个月开始。如需了解关于 AWS HealthOmics 免费套餐的详细信息,请见下表。

 

免费套餐前 2 个月的每个月使用情况

AWS HealthOmics 存储 活动存储类每月 1500 千兆碱基,归档存储类每月 1500 千兆碱基
AWS HealthOmics 工作流程

275 个 omics.m.xlarge 实例小时或同等计算实例和每小时 49,000 GB 的运行存储

AWS HealthOmics 分析 每月 200 千兆字节

AWS HealthOmics 存储定价

当您将基因组序列存储在 AWS HealthOmics 存储中时,您需要按月按千兆碱基的存储付费。一千兆碱基即导入的序列文件(如 FASTQ、BAM 和 CRAM)中的十亿个碱基。 AWS HealthOmics 存储存储源文件中的碱基、质量分数、对齐方式和其他元数据。您按存储的千兆碱基付费,因此您无需担心最佳文件格式或压缩技术。 AWS HealthOmics 会为您处理所有这些工作。

序列对象称为读取集,在逻辑上相当于 FASTQ、BAM 或 CRAM 文件。 AWS HealthOmics 存储为您的读取集提供活动存储类和归档存储类。归档类中的读取集每月存储成本低于活动类中的读取集。活动类中的读取集可以在几毫秒内访问,归档层中的读取集则需要先激活,然后才能访问。在 30 天未访问读取集后,它们会自动移动到成本较低的归档存储类,直到它们被重新激活。

读取集不收取导入费用。 AWS HealthOmics 存储数据最低存储持续时间为 30 天,在 30 天之内删除的数据会产生与用尽剩余天数的存储费用相同的预估费用。 AWS HealthOmics 存储的设计适用于长期但非频繁访问的数据(已保留了数年)。

您需要为对读取集对象发出的 GET 请求付费。读取集上的所有其他请求类型都是免费的。

AWS HealthOmics 分析定价

AWS HealthOmics 分析可帮助您准备基因组变体数据和基因组注释,以便与广泛的 AWS 分析和机器学习服务套件(如 Amazon Athena 和 Amazon SageMaker)一起使用。您可以存储任意数量的基因组变体数据,并且只需为存储的内容付费。数据大小定义为转换后数据的大小。但是,当您查询和分析其他服务中的数据时,您需要为使用这些服务付费。

AWS HealthOmics 分析数据最低存储持续时间为 30 天,在 30 天之内删除的数据会产生与用尽剩余天数的存储费用相同的预估费用。

AWS HealthOmics 私有和 Ready2Run 工作流程定价

AWS HealthOmics 还通过私有和 Ready2Run 工作流程管理生物信息学工作流程的执行。

私有工作流程使您可以使用最常用的工作流程语言编写自己的生物信息学脚本。您可以通过一次执行来运行私有工作流程。您只需按请求量付费,并针对组学实例类型和运行存储单独计费。工作流程中的所有任务都映射到最适合其已定义资源的实例。例如,定义为使用 8 个 CPU 和 60 GB RAM 的任务将映射到 omics.r.2xlarge 实例类型以便执行。

Ready2Run 工作流程是由行业第三方软件公司通过开源管线打包的预构建工作流程。Ready2Run 工作流程让您可以使用最常用的工作流程(比如 Germline 和 GATK-BP)轻松处理数据。Ready2Run 工作流程按运行次数付费,这意味着每个工作流程的费用相同。

对于私有和 Ready2Run 工作流程,日志存储在您账户的 Amazon CloudWatch Logs 中,并在 CloudWatch 中计费(只要您选择保留)。您可以将服务配置为报告每次运行的资源使用情况,以简化预算、规划和核算。

  • 私有工作流程
  • Ready2Run 工作流程

定价示例

示例 1

一项种群测序计划开始对它们收集的生物库中的个体进行测序。它们选择在欧洲西部(爱尔兰)区域执行此操作。它们对 100000 个个体进行测序,每个个体为 130 千兆碱基,然后他们将原始测序数据存储在 AWS HealthOmics 存储中。在接下来的五年中,它们在导入后的 30 天后仍保留在存档存储类中,并且在过渡到活动存储类 30 天时平均被访问两次。每个基因组分 500 个部分下载,生成 500 个 GET API 调用。它们在五年内单个基因组的总费用为:
活动存储类:每月每千兆碱基 0.005769 USD * 130 千兆碱基 * 90 天 = 2.22 USD
归档存储类:每月每千兆碱基 0.001154 USD * 130 千兆碱基 *(1825 – 90)天 = 8.56 USD。
GET API:每 1000 个 API 调用 0.005 USD *(2 * 500 次 API 调用)= 0.005 USD
5 年总费用:2.22 USD + 8.56 USD + 0.005 USD = 10.79 USD(或每年 2.16 USD)

示例 2

一位生物信息学科学家想要在美国东部(弗吉尼亚州北部)区域的 AWS HealthOmics 工作流程中运行 Nextflow 工作流程。她在工作流程中有三个任务。第一个是保留 16 个 vCPU 和 30 GB 内存,运行需要 3 小时。第二个是需要 32 个 vCPU 和 160 GB 内存,运行需要 2 小时。第三个是保留 4 个 vCPU 和 10 GB 内存,运行需要 10 分钟。客户注册工作流程并使用默认的 1200 GB 文件系统调用 StartRun API。她的总费用是:
任务 1 (omics.c.4xlarge):每小时 $ 0.9180 * 3 小时 = $ 2.754
任务 2 (omics.r.8xlarge):
每小时 $2.7216 * 2 小时 = $5.4432
任务 3 (omics.m.xlarge):每小时 $ 0.2592 * 1/6 小时 = $ 0.0432
存储:每小时每 GB $0.0001918 *(1200GB*(3 小时+2 小时+1/6 小时))= $1.18916
合计:$9.42956

示例 3

一名数据科学家有 3202 个变体调用格式(VCF)文件,他想在美国东部(弗吉尼亚州北部)区域的 Amazon Athena 中分析这些文件。他创建了一个变体存储,并使用 AWS HealthOmics API 引入这些文件。引入的数据大小为 1.5TB。在接下来的一个月里,他在 Athena 中执行了 1000 次查询,计算不同亚群的等位基因频率,每个亚群平均消耗 50 GB。他每月的总费用是:
变体存储:每月每 GB 0.035 USD *(1024 GB/TB * 1.5 TB)= 53.76 USD
Amazon Athena:每 TB 5 USD * 1000 * 50 / 1024 = 244.14 USD

示例 4

一位计算科学家想要在美国东部(弗吉尼亚州北部)区域为 3 个样本运行 GATK-BP Germline fq2vcf for 30x genome Ready2Run 工作流程。客户输入他们的数据,然后为每个样本调用 StartRun API。3 次运行的成本为:
GATK-BP Germline fq2vcf for 30x genome Ready2Run 工作流程:每次运行 10.00 USD * 3 = 30.00 USD
总计:30.00 USD

其他定价资源

AWS 定价计算器

轻松计算 AWS 的月度费用

云经济资源中心

联系 AWS 专家获取个性化报价