参考部署

AWS 上的 Illumina DRAGEN

使用 DRAGEN 和 F1 实例对新一代测序 (NGS) 数据进行超快速分析

本快速入门可在大约 15 分钟内在 AWS 云上为 Illumina 的数据分析平台 GENomics Complete Suite (DRAGEN CS) 部署动态读取分析。

DRAGEN CS 实现下一代测序 (NGS) 数据的超快速分析,显著缩短分析基因组数据所需的时间和提高准确度。它包括生物信息学管道,为映射、调整、排序、重复标记和单倍型变体识别提供高度优化的算法。这些管道包括 DRAGEN Germline V2、DRAGEN Somatic V2(肿瘤和肿瘤/正常)、DRAGEN 虚拟长读取检测 (VLRD)、DRAGEN RNA 基因融合、DRAGEN 联合基因分型和 GATK 最佳实践。

本快速入门构建了一个 AWS 环境,该环境跨越两个可用区以实现高可用性,并为 Spot 实例和按需实例预置了两个 AWS Batch 计算环境。这些环境包括 DRAGEN F1 实例,可连接到现场可编程门阵列 (FPGA) 以实现硬件加速。

Illumina 徽标

本快速入门是由 Illumina 与 AWS 合作开发的。Illumina 是
APN 合作伙伴

  •  构建内容
  •  部署方式
  •  费用和许可证
  •  构建内容
  • 使用本快速入门可在 AWS 上创建以下可配置环境:

    • 一个跨两个可用区的高度可用架构。*
    • 一个根据 AWS 最佳实践配置有公共子网和专用子网的 Virtual Private Cloud (VPC)。这为您的部署提供了网络基础设施。*
    • 一个提供互联网访问权限的互联网网关。*
    • 托管 NAT 网关(在公有子网中),以允许对私有子网中的资源进行出站互联网访问。*
    • 一个 AWS CodePipeline 管道,用于构建 Docker 镜像并将其上传到 Amazon Elastic Container Registry (Amazon ECR) 存储库。
    • 两个 AWS Batch 计算环境:一个用于 Amazon Elastic Compute Cloud (Amazon EC2) Spot 实例,另一个用于按需实例。
    • 一个 AWS Batch 作业队列,该队列优先考虑提交到用于 Spot 实例的计算环境,以优化成本。
    • 一个 AWS Batch 作业定义,用于运行 DRAGEN。
    • AWS Identity and Access Management (IAM) 角色和策略,用于要运行的 AWS Batch 作业。

    *将本快速入门部署到现有 VPC 的模板会跳过标有星号的任务,并提示您使用现有 VPC 配置。

  •  部署方式
  • 要在 AWS 上部署 Illumina DRAGEN,请按照部署指南中的说明操作。部署过程包括以下步骤:

    1. 如果您还没有 AWS 账户,请访问 https://aws.amazon.com 进行注册。
    2. 在 AWS Marketplace 中订阅 DRAGEN Complete Suite
    3. 启动本快速入门。每次部署大约需要 15 分钟。有以下两种方案可供选择:
    4. 通过运行 DRAGEN 作业测试部署。

    要自定义部署,您可以配置网络架构,为 AWS Batch 环境设置所需数量的虚拟 CPU,指定 Spot 实例的竞价百分比,并设置 AWS Batch 作业重试次数。

    Amazon 可能会跟与 AWS 合作打造 Quick Start 的 AWS 合作伙伴共享用户部署信息。  

  •  费用和许可证
  • 您需要支付在运行此 Quick Start 的参考部署期间使用 AWS 服务所产生的费用。使用本快速入门无需额外付费。

    此 Quick Start 的 AWS CloudFormation 模板包括可自定义的配置参数。其中一些设置(如实例类型)会影响部署成本。有关成本估算信息,请参阅您要使用的各项 AWS 服务的定价页面。价格会随时发生变化。

    要使用本快速入门,您需要在 AWS Marketplace 中订阅适用于 DRAGEN Complete Suite 的 Amazon 系统映像 (AMI),费用按小时计算。