AWS Step Functions および AWS Batch を使用したゲノミクスセカンダリ分析

AWS Step Functions と AWS Batch を使用したゲノミクス二次分析は、ゲノミクス二次分析のパイプラインを開発、構築、デプロイ、および実行するスケーラブルな環境を AWS 上に作成します。たとえば、未処理の全ゲノムシーケンスをバリアントコールに処理できます。このガイダンスにはゲノミクスワークフローとその実行をサポートするインフラストラクチャの両方にアップデートを構築およびデプロイするための、AWS CodeCommit のソースコードリポジトリと AWS CodePipeline を使用する継続的インテグレーションと継続的デリバリー (CI/CD) が含まれます。Infrastructure as Code の原理とベストプラクティスを十分に利用しているため、お客様はソリューションを迅速に進化させることができます。

Amazon CloudWatch の運用ダッシュボードは、パイプラインおよびツールのステータスとパフォーマンス監視用にデプロイされます。独自のゲノミクス分析とリサーチプロジェクト用にこのガイダンスをデプロイします。

概要

下の図表は、GitHub にあるサンプルコードを使って構築できるアーキテクチャを示しています。

AWS Step Functions および AWS Batch を使用したゲノミクスセカンダリ分析 | アーキテクチャの図
 拡大イメージを見る

AWS Step Functions および AWS Batch を使用したゲノミクスセカンダリ分析のアーキテクチャ

コードはこのガイダンスをインストールするため、AWS アカウントに setup スタックを含む 4 つの CloudFormation スタックを作成します。他のスタックには共通のソリューションリソースとアーティファクトを含むランディングゾーン (zone) スタック、ソリューションの CI/CD パイプラインを定義するデプロイパイプライン (pipe) スタック、ツールを提供するコードベース (code) スタック、ワークフロー定義、ジョブ実行環境のソースコードなどがあります。

setup スタックは setup.sh スクリプトを含む AWS CodeBuild プロジェクトを作成します。このスクリプトは残りの CloudFormation スタックを作成し、それらが作成されると、AWS CodeCommit pipe リポジトリと code リポジトリの両方にコードを提供します。

ランディングゾーン (zone) スタックは CodeCommit pipe リポジトリ、Amazon CloudWatch イベント、AWS CodePipeline pipe パイプラインを作成し、これがゲノミクスワークフロー用の継続的インテグレーション/継続的デリバリー (CI/CD) パイプラインを定義します。デプロイパイプライン (pipe) スタックは CodeCommit code リポジトリ、Amazon CloudWatch イベント、CodePipeline code パイプラインを作成します。

CodePipeline code パイプラインはコードベース (code) CloudFormation スタックをデプロイします。アカウントにデプロイされるリソースには Amazon Simple Storage Service (Amazon S3) バケット、ソースコード用の CodeCommit リポジトリ、AWS CodeBuild プロジェクト、AWS CodePipeline パイプライン、Amazon Elastic Container Registry (Amazon ECR) 画像リポジトリ、サンプルの AWS Step Functions ステートマシン、AWS Batch コンピューティング環境、ジョブキュー、ジョブ定義などが含まれます。サンプルの Amazon CloudWatch ダッシュボードでは運用ワークロードの監視を利用できます。つまり、このソリューションを使用することで、ゲノミクスのワークフローおよびその実行をサポートするインフラストラクチャ両方のアップデートを構築、デプロイきるようになります。

AWS Step Functions および AWS Batch を使用したゲノミクスセカンダリ分析

バージョン 1.0.3
最終更新日: 2021 年 5 月
作成者: AWS

このガイダンスは役に立ちましたか?
フィードバックを送る 

特徴

ゲノミクス分析とリサーチプロジェクトを実行するために AWS にスケーラブルな環境を提供

全ゲノムシーケンスをバリアントコールに処理するなど、ゲノミクスセカンダリ分析パイプラインを開発、構築、デプロイ、および実行するため AWS にスケーラブルな環境を作成します。

継続的インテグレーションと継続的デリバリーの (CI/CD) の活用

AWS CodeCommit のソースコードリポジトリと AWS CodePipeline を使用して、ゲノミクスのワークフローおよびその実行をサポートするインフラストラクチャ両方のアップデートを構築、デプロイします。

Infrastructure as Code のベストプラクティスを活用

Infrastructure as Code の原理とベストプラクティスを使用してガイダンスを迅速に展開します。

独自のゲノミクス分析とリサーチプロジェクト用に変更

たとえば、新しいコンテナ化されたツールを追加したり、新しいワークフローを作成したり、特定のニーズに合わせてガイダンスを変更します。変更コントロール管理、ロールバック、監査などを容易にするため、各変更は CI/CD パイプラインによって追跡されます。
アイコンを作成する
自分でソリューションをデプロイする

よくみられるアーキテクチャ上の問題に関して答えを知るため、AWS ソリューション実装のライブラリを閲覧する。

詳細はこちら 
APN パートナーを見つける
APN パートナーを見つける

サービスの開始をサポートする AWS 認定コンサルティングパートナーとテクノロジーパートナーを見つけましょう。

詳細はこちら 
アイコンについて調べる
ソリューションコンサルティングサービスについて調べる

ソリューションをデプロイし、AWS により審査済みのサポートを受けるため、コンサルティングサービスのポートフォリオを閲覧する。

詳細はこちら