參考部署

Illumina DRAGEN on AWS

使用 DRAGEN 和 F1 執行個體迅速分析下一代序列 (NGS) 資料

本快速入門會在 AWS 雲端上部署 Dynamic Read Analysis for GENomics Complete Suite (DRAGEN CS),這是 Illumina 推出的資料分析平台,整個過程大約需要 15 分鐘的時間。

DRAGEN CS 可以對下一代定序 (NGS) 資料進行超快速分析,大幅縮短分析基因組資料所需的時間,並提高準確性。它包括生物資訊學管道,為映射、比對、分類、重複標記和單倍型變體呼叫提供高度優化的演算法。這些管道包括 DRAGEN Germline V2、DRAGEN Somatic V2 (腫瘤和腫瘤/正常)、DRAGEN Virtual Long Read Detection (VLRD)、DRAGEN RNA Gene Fusion、DRAGEN Joint Genotyping 和 GATK 最佳實務。

快速入門可建立跨兩個可用區域的 AWS 環境以提供高可用性,以及為 Spot 執行個體和隨需執行個體佈建兩個 AWS Batch 運算環境。這些環境包括 DRAGEN F1 執行個體,可連接現場可程式化閘道陣列 (FPGA) 以進行硬體加速。

Illumina 標誌

本快速入門由 Illumina 與 AWS 共同合作開發。Illumina 是
APN 合作夥伴

  •  您將建置的項目
  •  如何部署
  •  成本和授權
  •  您將建置的項目
  • 使用本快速入門在 AWS 設定以下可設定環境:

    • 跨越兩個可用區域的高可用性架構。*
    • 根據 AWS 最佳實務,設定公有和私有子網路的虛擬私有雲端 (VPC)。這可為您的部署提供網路基礎設施。*
    • 提供網際網路存取的網際網路閘道。*
    • 在公有子網路中,設定受管 NAT 閘道以允許對私有子網路資源進行傳出網際網路存取。*
    • 設定 AWS CodePipeline 管道,以建立 Docker 映像並將其上傳到 Amazon Elastic Container Registry (Amazon ECR) 儲存庫。
    • 兩個 AWS Batch 運算環境:一個用於 Amazon Elastic Compute Cloud (Amazon EC2) Spot 執行個體,另一個用於隨需執行個體。
    • 設定 AWS Batch 任務佇列以優先處理提交到 Spot 執行個體運算環境的項目,以優化成本。
    • 用於執行 DRAGEN 的 AWS Batch 任務定義。
    • AWS Batch 任務要執行的 AWS Identity and Access Management (IAM) 角色和政策。

    * 負責將快速入門部署到現有 VPC 的範本會略過標有星號的任務,並提示您輸入現有的 VPC 組態。

  •  如何部署
  • 要在 AWS 上部署 Illumina DRAGEN,請按照部署指南中的說明進行操作。部署程序包括以下步驟:

    1. 如果您還沒有 AWS 帳戶,請在 https://aws.amazon.com 註冊。
    2. 訂閱 AWS Marketplace 中的 DRAGEN Complete Suite
    3. 啟動快速入門。每個部署的時間約 15 分鐘。您可以從兩個選項中進行選擇:
    4. 執行 DRAGEN 任務來測試部署。

    要自訂部署,您可以設定網路架構、為 AWS Batch 環境設定所需的虛擬 CPU 數量、指定 Spot 執行個體的出價百分比,以及設定 AWS Batch 任務重試次數。

  •  成本和授權
  • 您需自行負擔執行本快速入門參考部署所使用的 AWS 服務費用。使用本快速入門無須額外付費。

    本快速入門的 AWS CloudFormation 範本包含您可以自訂的組態參數。部分設定 (如執行個體類型) 將會影響部署的成本。查看您將使用之每個 AWS 服務的定價頁面以估算成本。定價會隨時變更。

    本快速入門需要訂閱 DRAGEN Complete Suite 的 Amazon Machine Image (AMI),您可以在 AWS Marketplace 訂閱並按小時支付使用費。