使用 AWS Step Functions 和 AWS Batch 的基因體次要分析

使用 AWS Step Functions 和 AWS Batch 的基因體次要分析可在 AWS 上建立可擴展環境,以開發、建置、部署和執行基因體次要分析管道,例如將原始的全基因體序列處理為變異識別。此指引包括透過 AWS CodeCommit 來源程式碼儲存庫和 AWS CodePipeline 實現的持續整合和持續交付 (CI/CD),以便建置和部署更新至基因體工作流程和支援其執行的基礎設施。其充分利用 Infrastructure as Code 原則和最佳實務,可協助您快速發展解決方案。

此解決方案還部署 Amazon CloudWatch 操作儀表板來監控管道和工具的狀態和效能。針對您的基因體分析和研究專案部署此指引。

概觀

以下圖表展示了您可以使用 GitHub 上的範例程式碼建置的架構。

使用 AWS Step Functions 和 AWS Batch 的基因體次要分析架構

該程式碼在您的 AWS 帳戶中建立了四個 CloudFormation 堆疊,包括用於安裝指引的 setup 堆疊。其他堆疊包括含有常用的解決方案資源和成品的登陸區域 (zone) 堆疊、定義解決方案 CI/CD 管道的部署管道 (pipe) 堆疊,以及提供工具、工作流程定義和任務執行環境原始程式碼的程式碼庫 (code) 堆疊。

setup 堆疊建置包含 setup.sh 指令碼的 AWS CodeBuild 專案。該指令碼建置其餘 CloudFormation 堆疊,並在這些堆疊建置後,為 AWS CodeCommit pipe 儲存庫和 code 儲存庫提供原始程式碼。

登陸區域 (zone) 堆疊建置 CodeCommit pipe 儲存庫、Amazon CloudWatch 事件和 AWS CodePipeline pipe 管道,該管道定義基因體工作流程的持續整合/持續交付 (CI/CD) 管道。部署管道 (pipe) 堆疊建置 CodeCommit code 儲存庫、Amazon CloudWatch 事件和 CodePipeline code 管道。

CodePipeline code 管道部署程式碼庫 (code) CloudFormation 堆疊。部署在您帳戶的資源包括 Amazon Simple Storage Service (Amazon S3) 儲存貯體、用於原始程式碼的 CodeCommit 儲存庫、AWS CodeBuild 專案、AWS CodePipeline 管道、Amazon Elastic Container Registry (Amazon ECR) 映像儲存庫、AWS Step Functions 狀態機器範例,以及 AWS Batch 運算環境、任務佇列和任務定義。Amazon CloudWatch 範例儀表板提供操作工作負載監控功能。整體而言,這個解決方案可讓您建立更新並部署至基因體工作流程,以及支援執行工作流程的基礎設施。

使用 AWS Step Functions 和 AWS Batch 的基因體次要分析

1.0.3 版
上次更新日期:2021 年 5 月
作者:AWS

本指南對您有幫助嗎?
提供意見回饋 

功能

在 AWS 中提供可擴展環境以進行基因體分析和研究專案

在 AWS 中建立可擴展環境以開發、建置、部署和執行基因體次要分析管道,例如將原始的全基因體序列處理為變異識別。

充分利用持續整合和持續交付 (CI/CD)

使用 AWS CodeCommit 原始程式碼儲存庫和 AWS CodePipeline 來建置更新並部署至基因體工作流程,以及支援執行工作流程的基礎設施。

充分利用 Infrastructure as Code 最佳實務

使用 Infrastructure as Code (IaC) 原則和最佳實務來快速演進指引。

針對您的基因體分析和研究專案進行修改

修改指引以符合您的特定需求,例如新增新的容器化工具並建立新的工作流程。CI/CD 管道將追蹤每個變更,以促進變更控制管理、回復和稽核。
建立圖示
自行部署 AWS 解決方案

瀏覽我們的 AWS 解決方案庫,獲取常見架構問題的答案。

進一步了解 
尋找 APN 合作夥伴
尋找 AWS 合作夥伴解決方案

尋找 AWS 合作夥伴以協助您入門。

進一步了解 
探索圖示
探索指引

尋找常見使用案例的規範架構圖、範例程式碼與技術內容。

進一步了解