AWS Step Functions と AWS Batch を使用したゲノミクス二次分析は、ゲノミクス二次分析のパイプラインを開発、構築、デプロイ、および実行するスケーラブルな環境を AWS 上に作成します。たとえば、未処理の全ゲノムシーケンスをバリアントコールに処理できます。このガイダンスにはゲノミクスワークフローとその実行をサポートするインフラストラクチャの両方にアップデートを構築およびデプロイするための、AWS CodeCommit のソースコードリポジトリと AWS CodePipeline を使用する継続的インテグレーションと継続的デリバリー (CI/CD) が含まれます。Infrastructure as Code の原理とベストプラクティスを十分に利用しているため、お客様はソリューションを迅速に進化させることができます。
Amazon CloudWatch の運用ダッシュボードは、パイプラインおよびツールのステータスとパフォーマンス監視用にデプロイされます。独自のゲノミクス分析とリサーチプロジェクト用にこのガイダンスをデプロイします。
概要
下の図表は、GitHub にあるサンプルコードを使って構築できるアーキテクチャを示しています。

AWS Step Functions および AWS Batch を使用したゲノミクスセカンダリ分析のアーキテクチャ
コードはこのガイダンスをインストールするため、AWS アカウントに setup スタックを含む 4 つの CloudFormation スタックを作成します。他のスタックには共通のソリューションリソースとアーティファクトを含むランディングゾーン (zone) スタック、ソリューションの CI/CD パイプラインを定義するデプロイパイプライン (pipe) スタック、ツールを提供するコードベース (code) スタック、ワークフロー定義、ジョブ実行環境のソースコードなどがあります。
setup スタックは setup.sh スクリプトを含む AWS CodeBuild プロジェクトを作成します。このスクリプトは残りの CloudFormation スタックを作成し、それらが作成されると、AWS CodeCommit pipe リポジトリと code リポジトリの両方にコードを提供します。
ランディングゾーン (zone) スタックは CodeCommit pipe リポジトリ、Amazon CloudWatch イベント、AWS CodePipeline pipe パイプラインを作成し、これがゲノミクスワークフロー用の継続的インテグレーション/継続的デリバリー (CI/CD) パイプラインを定義します。デプロイパイプライン (pipe) スタックは CodeCommit code リポジトリ、Amazon CloudWatch イベント、CodePipeline code パイプラインを作成します。
CodePipeline code パイプラインはコードベース (code) CloudFormation スタックをデプロイします。アカウントにデプロイされるリソースには Amazon Simple Storage Service (Amazon S3) バケット、ソースコード用の CodeCommit リポジトリ、AWS CodeBuild プロジェクト、AWS CodePipeline パイプライン、Amazon Elastic Container Registry (Amazon ECR) 画像リポジトリ、サンプルの AWS Step Functions ステートマシン、AWS Batch コンピューティング環境、ジョブキュー、ジョブ定義などが含まれます。サンプルの Amazon CloudWatch ダッシュボードでは運用ワークロードの監視を利用できます。つまり、このソリューションを使用することで、ゲノミクスのワークフローおよびその実行をサポートするインフラストラクチャ両方のアップデートを構築、デプロイきるようになります。
AWS Step Functions および AWS Batch を使用したゲノミクスセカンダリ分析
バージョン 1.0.3
最終更新日: 2021 年 5 月
作成者: AWS