本快速入門在 AWS 雲端上部署了 Illumina DRAGEN (GENomics 動態讀取分析) Bio-IT Platform。
DRAGEN Bio-IT Platform 可以對下一代定序 (NGS) 資料進行超快速分析,大幅縮短分析基因組資料所需的時間,並提高準確性。它包括生物資訊學管道,為映射、比對、分類、重複標記和單倍型變體呼叫提供優化的演算法。這些管道包括生殖細胞、體細胞 (腫瘤和腫瘤/正常細胞),RNA、單細胞 RNA、甲基化、聯合基因分型和 DRAGEN-GATK。
快速入門可建立跨兩個可用區域的 AWS 環境以提供高可用性,以及為 Spot 執行個體和隨需執行個體佈建兩個 AWS Batch 運算環境。這些環境包括 DRAGEN F1 執行個體,可連接現場可程式化閘道陣列 (FPGA) 以進行硬體加速。
-
您將建置的項目
-
如何部署
-
成本和授權
-
您將建置的項目
-
使用本快速入門在 AWS 設定以下可設定環境:
- 跨越兩個可用區域的高可用性架構。*
- 根據 AWS 最佳實務,設定公有和私有子網路的 Virtual Private Cloud (VPC)。這可為您的部署提供網路基礎設施。*
- 提供網際網路存取的網際網路閘道。*
- 在公有子網路中,設定受管 NAT 閘道以允許對私有子網路資源進行傳出網際網路存取。*
- 設定 AWS CodePipeline 管道,以建立 Docker 映像並將其上傳到 Amazon Elastic Container Registry (Amazon ECR) 儲存庫。
- 兩個 AWS Batch 運算環境:一個用於 Amazon Elastic Compute Cloud (Amazon EC2) Spot 執行個體,另一個用於隨需執行個體。
- 設定 AWS Batch 任務佇列以優先處理提交到 Spot 執行個體運算環境的項目,以優化成本。
- 用於執行 DRAGEN 的 AWS Batch 任務定義。
- AWS Batch 任務要執行的 AWS Identity and Access Management (IAM) 角色和政策。
* 負責將快速入門部署到現有 VPC 的範本會略過標有星號的任務,並提示您輸入現有的 VPC 組態。
- 跨越兩個可用區域的高可用性架構。*
-
如何部署
-
要在 AWS 上部署 Illumina DRAGEN,請按照部署指南中的說明進行操作。部署程序包括以下步驟:
- 如果您還沒有 AWS 帳戶,請在 https://aws.amazon.com 註冊。
- 在 AWS Marketplace 中訂閱 DRAGEN Bio-IT Platform。
- 啟動快速入門。每個部署的時間約 15 分鐘。您可以從兩個選項中進行選擇:
- 執行 DRAGEN 任務來測試部署。
要自訂部署,您可以設定網路架構、為 AWS Batch 環境設定所需的虛擬 CPU 數量、指定 Spot 執行個體的出價百分比,以及設定 AWS Batch 任務重試次數。
Amazon 可能會與在此合作夥伴解決方案上與 AWS 進行協作的 AWS 合作夥伴分享使用者部署資訊。
- 如果您還沒有 AWS 帳戶,請在 https://aws.amazon.com 註冊。
-
成本和授權
-
您必須自行負擔執行此快速入門參考部署時,所使用 AWS 服務的費用。使用快速入門無須另外付費。
此快速入門的 AWS CloudFormation 範本包含您可以自訂的組態參數。其中某些設定 (例如執行個體類型) 將會影響到部署的費用。查看您將使用之每個 AWS 服務的定價頁面以估算成本。定價可能會隨時變更。
本快速入門需要訂閱 DRAGEN Bio-IT Platform 的 Amazon Machine Image (AMI),您可以在 AWS Marketplace 訂閱並按小時支付使用費。