リファレンスデプロイ

AWS での Illumina DRAGEN

次世代シーケンシングデータの解析

このパートナーソリューションは、Illumina DRAGEN (Dynamic Read Analysis for GENomics) Bio-IT Platform を Amazon Web Services (AWS) クラウドにデプロイします。

DRAGEN Bio-IT プラットフォームは、次世代シーケンシング (NGS) データの超高速分析を可能にし、ゲノムデータの分析に必要な時間を大幅に短縮し、正確性を向上させます。これには、マッピング、配列、並び替え、マーキングの複製、およびハプロタイプのバリアントの呼び出し用に最適化されたアルゴリズムを提供するバイオインフォマティクスパイプラインが含まれます。これらのパイプラインには生殖細胞、体細胞 (腫瘍および腫瘍/正常)、RNA、単細胞 RNA、メチル化、ジョイントジェノタイピング、および DRAGEN-GATK が含まれます。

このパートナーソリューションは、高可用性のための 2 つのアベイラビリティーゾーンをつなげる AWS 環境を構築し、スポットインスタンスとオンデマンドインスタンスのための 2 つの AWS Batch コンピューティング環境を提供します。これらの環境には、ハードウェアアクセラレーションのため、フィールドプログラマブルゲートアレイ (FPGA) に接続されている DRAGEN F1 インスタンスが含まれます。

Illumina のロゴ

このパートナーソリューションは Illumina と AWS が共同開発しました。Illumina は AWS パートナーです。


AWS Service Catalog の管理者は、このアーキテクチャをご自分のカタログに追加できます。 

  •  構築するもの
  • このパートナーソリューションを使用して、以下の設定可能な環境を AWS 上にセットアップします。

    • 2 つのアベイラビリティーゾーンにまたがる可用性の高いアーキテクチャ。*
    • AWS のベストプラクティスに沿ってパブリックサブネットとプライベートサブネットが設定された Virtual Private Cloud (VPC)。これが、デプロイにおけるネットワークインフラストラクチャとなります。*
    • インターネットへのアクセスを提供するインターネットゲートウェイ。*
    • パブリックサブネット内のマネージド NAT ゲートウェイ。プライベートサブネット内のリソースへのアウトバウンドのインターネットアクセスを提供します。*
    • Docker イメージを構築し、それを Amazon Elastic Container Registry (Amazon ECR) リポジトリにアップロードする AWS CodePipeline パイプライン。
    • 2 つの AWS Batch コンピューティング環境: Amazon Elastic Compute Cloud (Amazon EC2) スポットインスタンス用に 1 つとオンデマンドインスタンス用に 1 つ。
    • スポットインスタンスのコンピューティング環境への送信に優先順位を付け、コストに関して最適化する AWS Batch ジョブキュー。
    • DRAGEN を実行する AWS Batch ジョブ定義。
    • AWS Batch ジョブを実行するための AWS Identity and Access Management (IAM) のロールとポリシー。

    * パートナーソリューションを既存の VPC にデプロイするテンプレートは、アスタリスクが付けられたタスクをスキップし、既存の VPC 設定にユーザーを誘導します。

  •  デプロイ方法
  • Illumina DRAGEN をデプロイするには、デプロイガイドの指示に従ってください。デプロイプロセスには、次のステップが含まれます。

    1. AWS アカウントをまだお持ちでない場合は、https://aws.amazon.com でサインアップしてください。
    2. AWS Marketplace で DRAGEN Bio-IT Platform をサブスクライブします。
    3. パートナーソリューションを起動します。それぞれのデプロイにはおよそ 15 分かかります。次の 2 つのオプションから選択できます。
    4. DRAGEN ジョブを実行し、デプロイをテストします。

    デプロイをカスタマイズするには、ネットワークアーキテクチャを設定し、AWS のバッチ環境に任意の数の仮想 CPU を設定し、スポットインスタンスの入札率を指定し、AWS のバッチジョブの再試行回数を設定します。

    Amazon は、本ソリューションで AWS と協力した AWS パートナーとユーザーデプロイ情報を共有する場合があります。  

  •  コストとライセンス
  • このパートナーソリューションでは、DRAGEN Bio-IT Platform 用の Amazon マシンイメージ (AMI) のサブスクリプションが必要です。これは AWS Marketplace から 1 時間あたりの料金で入手できます。

    このソリューションの実行中に使用した AWS のサービスおよびサードパーティーライセンスのコストは、お客様のご負担となります。このソリューションを使用しても追加コストは発生しません。

    このソリューションには、カスタマイズ可能な設定パラメータが含まれています。インスタンスタイプなどの設定の一部は、デプロイにかかるコストに影響します。料金の見積もりについては、利用する AWS の各サービスの料金ページを参照してください。料金は変更される場合があります。

    ヒント: ソリューションをデプロイした後、 AWS Cost and Usage Report を作成し、関連するコストを追跡します。これらのレポートは、お客様のアカウントでの Amazon Simple Storage Service (Amazon S3) バケットへの請求メトリクスを提供します。毎月の使用量に基づいてコストを見積もり、月末のデータを集計します。詳細については、 AWS Cost and Usage Report とはを参照してください。