參考部署

Illumina DRAGEN on AWS

下一代定序資料分析

此合作夥伴解決方案將 Illumina DRAGEN (基因體學動態讀取分析) Bio-IT Platform 部署到 Amazon Web Services (AWS)。

DRAGEN Bio-IT Platform 可以對下一代定序 (NGS) 資料進行超快速分析,大幅縮短分析基因組資料所需的時間,並提高準確性。它包括生物資訊學管道,為映射、比對、分類、重複標記和單倍型變體呼叫提供優化的演算法。這些管道包括生殖細胞、體細胞 (腫瘤和腫瘤/正常細胞),RNA、單細胞 RNA、甲基化、聯合基因分型和 DRAGEN-GATK。

此合作夥伴解決方案可建立跨兩個可用區域的 AWS 環境以提供高可用性,以及為 Spot 執行個體和隨需執行個體佈建兩個 AWS Batch 運算環境。這些環境包括 DRAGEN F1 執行個體,可連接現場可程式化閘道陣列 (FPGA) 以進行硬體加速。

Illumina 標誌

本合作夥伴解決方案由 Illumina 與 AWS 合作開發。Illumina 是 AWS 合作夥伴


AWS Service Catalog 管理員可將此架構新增至其專屬目錄。 

  •  您將建置的項目
  • 使用此合作夥伴解決方案,在 AWS 上設定下列可設定的環境:

    • 跨越兩個可用區域的高度可用的架構。*
    • 根據 AWS 最佳實務,設定公有和私有子網路的虛擬私有雲端 (VPC)。這可為您的部署提供網路基礎設施。*
    • 提供網際網路存取的網際網路閘道。*
    • 在公有子網路中,設定受管 NAT 閘道以允許對私有子網路資源進行傳出網際網路存取。*
    • 設定 AWS CodePipeline 管道,以建立 Docker 映像並將其上傳到 Amazon Elastic Container Registry (Amazon ECR) 儲存庫。
    • 兩個 AWS Batch 運算環境:一個用於 Amazon Elastic Compute Cloud (Amazon EC2) Spot 執行個體,另一個用於隨需執行個體。
    • 設定 AWS Batch 任務佇列以優先處理提交到 Spot 執行個體運算環境的項目,以優化成本。
    • 用於執行 DRAGEN 的 AWS Batch 任務定義。
    • AWS Batch 任務要執行的 AWS Identity and Access Management (IAM) 角色和政策。

    * 可將合作夥伴解決方案部署至現有 VPC 的範本,會略過標有星號的元件,並提示您輸入現有的 VPC 組態。

  •  部署方式
  • 要部署 Illumina DRAGEN,請按照部署指南中的說明進行操作。部署程序包括以下步驟:

    1. 如果您尚未擁有 AWS 帳戶,請在 https://aws.amazon.com 註冊。
    2. 在 AWS Marketplace 中訂閱 DRAGEN Bio-IT Platform
    3. 啟動合作夥伴解決方案。每個部署的時間約 15 分鐘。您可以從兩個選項中進行選擇:
    4. 執行 DRAGEN 任務來測試部署。

    要自訂部署,請設定網路架構、為 AWS Batch 環境設定所需的虛擬 CPU 數量、指定 Spot 執行個體的出價百分比,以及設定 AWS Batch 任務重試次數。

    Amazon 可能會與 AWS 合作夥伴 (與 AWS 在此解決方案上協作的合作夥伴) 分享使用者部署資訊。  

  •  成本和授權
  • 本合作夥伴解決方案需要訂閱 DRAGEN Bio-IT Platform 的 Amazon Machine Image (AMI),您可以在 AWS Marketplace 訂閱並按小時支付使用費。

    執行此解決方案時,您須自行支付使用 AWS 服務和任何第三方授權的相關費用。使用此解決方案無須額外付費。

    此解決方案包括您能自訂的組態參數。其中某些設定 (例如執行個體類型) 會影響到部署的成本。若要估算成本,請參閱您所使用每項 AWS 服務的定價頁面。定價可能會隨時變更。

    提示:在部署解決方案後,建立  AWS Cost and Usage Report 以追蹤相關成本。這些報告會向您帳戶中的 Amazon Simple Storage Service (Amazon S3) 儲存貯體提供各個帳單指標。它們會根據每個月的用量提供成本估算,並在月底彙總資料。如需詳細資訊,請參閱 什麼是 AWS Cost and Usage Report?