参考部署

AWS 上的 Illumina DRAGEN

下一代测序数据的分析

本合作伙伴解决方案将在 Amazon Web Services(AWS)Cloud 上部署 Illumina DRAGEN(基因组学动态读取分析)Bio-IT 平台。

DRAGEN Bio-IT 平台实现下一代测序(NGS)数据的超快速分析,显著缩短分析基因组数据所需的时间和提高准确度。它包括生物信息学管道,为映射、调整、排序、重复标记和单倍型变体识别提供优化算法。这些管道包括生殖系、体细胞(肿瘤和肿瘤/正常)、RNA、单细胞 RNA、甲基化、联合基因分型和 DRAGEN-GATK。

本合作伙伴解决方案构建了一个 AWS 环境,该环境跨越两个可用区以实现高可用性,并为竞价型实例和按需型实例预置了两个 AWS Batch 计算环境。这些环境包括 DRAGEN F1 实例,可连接到现场可编程门阵列(FPGA)以实现硬件加速。

Illumina 徽标

此合作伙伴解决方案由 Illumina 与 AWS 合作开发。Illumina 是 AWS 合作伙伴


AWS Service Catalog 管理员可以将此架构添加到他们自己的目录中。 

  •  构建内容
  • 使用本合作伙伴解决方案可在 AWS 上创建以下可配置环境:

    • 跨两个可用区的高度可用架构。*
    • 一个根据 AWS 最佳实践配置有公共子网和专用子网的 Virtual Private Cloud (VPC)。这为您的部署提供了网络基础设施。*
    • 一个用于提供互联网访问权限的互联网网关。*
    • 托管 NAT 网关(在公有子网中),以允许对私有子网中的资源进行出站互联网访问。*
    • 一个 AWS CodePipeline 管道,用于构建 Docker 镜像并将其上传到 Amazon Elastic Container Registry (Amazon ECR) 存储库。
    • 两个 AWS Batch 计算环境:一个用于 Amazon Elastic Compute Cloud (Amazon EC2) Spot 实例,另一个用于按需实例。
    • 一个 AWS Batch 作业队列,该队列优先考虑提交到用于 Spot 实例的计算环境,以优化成本。
    • 一个 AWS Batch 作业定义,用于运行 DRAGEN。
    • AWS Identity and Access Management(IAM)角色和策略,用于要运行的 AWS Batch 作业。

    * 将此合作伙伴解决方案部署到现有 VPC 中的模板会跳过标有星号的任务,并提示您使用现有 VPC 配置。

  •  如何部署
  • 要部署 Illumina DRAGEN,请按照部署指南中的说明操作。部署过程包括以下步骤:

    1. 如果您还没有 AWS 账户,请访问 https://aws.amazon.com 进行注册。
    2. 在 AWS Marketplace 中订阅 DRAGEN Bio-IT 平台
    3. 启动合作伙伴解决方案。每次部署大约需要 15 分钟。有以下两种方案可供选择:
    4. 通过运行 DRAGEN 作业测试部署。

    要自定义部署,请配置网络架构,为 AWS Batch 环境设置所需数量的虚拟 CPU,指定竞价型实例的竞价百分比,并设置 AWS Batch 作业重试次数。

    Amazon 可能会跟与 AWS 合作打造此解决方案的 AWS 合作伙伴共享用户部署信息。  

  •  费用和许可证
  • 要使用本合作伙伴解决方案,您需要在 AWS Marketplace 中订阅适用于 DRAGEN Bio-IT Platform的亚马逊云机器镜像(AMI),费用按小时计算。

    您需要支付在运行此解决方案期间使用 AWS 服务和任何第三方许可证所产生的费用。使用此解决方案不会产生任何额外费用。

    此解决方案包括可自定义的配置参数。其中一些设置(如实例类型)会影响部署成本。有关成本估算信息,请参阅您使用的每种 AWS 服务的定价页面。价格可能随时变动。

    提示:部署解决方案后,请创建 AWS 成本和使用情况报告,以跟踪相关成本。这些报告会将账单指标发送至您账户中的 Amazon Simple Storage Service (Amazon S3) 桶。它们根据每个月的使用情况提供成本估算,并在月末汇总数据。有关更多信息,请参阅 什么是 AWS 成本和使用情况报告?