Amazon Web Services ブログ
Element BiosciencesがAmazon OmicsでReady2RunワークフローのBases2FASTQを提供開始
本ブログは、Element BiosciencesのMaxim Mass、Rosi BajariとBryan Lajoieによるゲスト執筆です。カスタマーが簡単にワークロードをビルド、デプロイそしてスケールできるように、Amazon Omicsは3rd partyのソフトウェア企業やオープンソース パイプラインによりプレビルドされたReady2Run workflowをサポートしました。詳しくはこちらを参照ください。
昨年、Element BiosciencesはAVITIベンチトップシーケンサー装置を販売し、顧客へ精度向上とコストベネフィットを提供しています。ElementはAmazon Web Services (AWS)と協力し、高速で、強力かつコスト効率の高い解析ワークフローをAmazon OmicsのElementの Ready2Run Bases2Fastqワークフローを活用して提供しています。この統合により、例えばFASTQファイルから直接開始するといったように、顧客はこのプラットフォーム上で利用可能な幅広い2次解析ワークフローを活用できます。
AVITIでは装置内で一次解析を実行し、顧客がベースコールとクオリティスコアを直接Amazon S3のバケットにストリーミングできるよう設定可能です。これにより、中間の場所へのデータ移送やマネージドで高価なサブスクリプションサービスへの依存が不要になります。Elementのアプローチにより、顧客は特定サービスへの前払いのサブスクリプションなしに、データのエンドツーエンドのコントロールを維持することが可能です。Amazon Omicsは、クラウド技術のスケーラビリティとベネフィットを提供しながら、顧客自身の環境にコンピューティングリソースとストレージを活用することでこれをサポートします。
Element BioscienceのBases2Fastq Ready2RunワークフローをAmazon Omicsで利用することで、顧客はデマルチプレックスを高速に行ってFASTQファイルを生成することが可能です。これらのファイルは、Amazon OmicsのReady2Runワークフローで利用可能な様々な2次解析のインプットとして役立ちます。Ready2Runワークフローは、3rd partyのソフトウェア企業やオープンソースプロジェクトのプレビルド、標準化そして最適化されたパイプラインで構成されています。顧客は、たった数回のクリックや1つのAPIコールで、これらのパイプラインを簡単に実行できます。Ready2Runワークフローの料金体系は実行ごとのモデルに基づいており、顧客に予測可能で透明性のある価格を提供しています。
図1: Amazon OmicsでElement BiosciencesのReady2Runワークフローの実行毎の価格リストと推定実行時間の表示例
顧客は、Bases2Fastq Ready2Runワークフローの入力パラメータとしてディレクトリとS3の出力先を指定して簡単に実行することができます。一旦、ワークフロー実行が完了すると、サンプル毎のFASTQや実行パフォーマンスや品質に関するQCレポートを含む複数のファイルが生成され、顧客が指定したS3の出力バケットに格納されます。
図2: 2×150 kit Ready2RunのBases2Fastqのワークフロー図
現在ベータ版ですが、ElementのBases2Fastq Ready2RunワークフローをElembio Cloudを介して利用するオプションもあります。Elembio Cloudは、Amazon Omicsや他のゲノミクス解析プラットフォームを利用しています。Elembio Cloudを利用することで、シーケンス実行が完了するとすぐに、顧客のAWSアカウントでAmazon Omicsを利用してBases2Fastq Ready2Runを自動起動できます。この設定は簡単で、セキュアなAWS IAMロールと外部IDを利用することで数回のクリックだけで設定できます。顧客は、この設定をアカウント内のすべてのシーケンス実行に適用したり、特定のS3バケットにストリーミングするシーケンス実行のサブセットに選択的に適用できます。これにより、個々の実行毎に複雑なオーケストレーションロジックを開発する必要がなくなります。
ワークフローが完了すると、Elembio Cloudは実行記録を提供し、インタラクティブなレポートを通してクオリティコントロール(QC)統計の可視化を行うことでAmazon Omicsの機能強化を行います。シーケンス実行の開始から解析完了まで、顧客自身のアカウント内でデータを完全に制御できます。オプションで、ElementをQC実行の統計メタデータにアクセスさせ、そのデータはElembio Cloudで表示可能です。このセットアップにより、顧客がデータの所有権とコントロールを維持しながら、Elementがオーケストレーションプロセスを処理することが可能です。
サポートパイプライン
Element Biosciencesは、Amazon Omicsで3つのBases2Fastq Ready2Runワークフローを提供しています。各ワークフローは3つのシーケンスキット、150Cycles (2×75)、300Cycles (2×150)、または600Cycles (2×300)のいずれかをサポートするよう設計されています。各ワークフローの価格は実行ごととなっており、これはワークフローの実行ごとに予測可能な価格を顧客に提供するためです。
Amazon Omicsはまた、SentieonやNVIDIA Parabricksゲノミクスパイプラインなどの様々な2次解析 Ready2Runワークフローを提供し、FASTQのアラインメントや結果を生成するシンプルなソリューションを顧客に提供します。
総論
Amazon Omicsで、顧客はAVITI用のElementのBases2Fastq Ready2Runや他のReady2Run解析ワークフローを大規模に実行できます。これらのワークフローは、エンドツーエンドで顧客自身のデータコントロールを維持しながら、費用対効果が高く、柔軟で、簡単に結果を得られるソリューションです。Amazon Omicsは、一貫性、効率性とスケーラビリティを備えたプラットフォームを提供し、1次、2次、3次解析を実行できます。
Element BioscienceのBases2Fastq Ready2Runワークフローを開始するには、Amazon Omicsコンソールへアクセスしてください。
各ワークフローの価格詳細を知りたい場合は、Amazon Omics Ready2Runワークフローの料金を参照ください。
著者
Maxim Massは、Element Biosciencesのクラウドソフトウェア責任者です。San Diegoのスタートアップスペースで働きながら、非常に使いやすいソフトウェアバックエンドのの構築に情熱を注いできました。過去10年以上に渡り、使いやすさとスケーラビリティを重視したクラウドネイティブなゲノミクス解析プラットフォームの設計と構築を行ってきました。プライベートでは、妻と2人の子供と大自然の中でのキャンプや、スノーボード、自家製ピザでゲストをもてなしたり、旅行を楽しんでいます。
Rosi Bajariは、Element Biosciencesのソフトウェア製品設計チームのスタッフプロダクトオーナーです。NGSとライフサイエンスソフトウェア業界で10年以上、ゲノミクスデータ生成と解析のイノベーティブで合理化されたエクスペリエンスの開発に取り組んできました。 次の大きなNGSの問題解決に熱中していない時は、ビデオゲーム、サイクリングやキャンプをして自由時間を過ごしています。
Bryan Lajoieは、Element Biosciencesのソフトウェアとバイオインフォマティクスチームのプリンシパル サイエンティストです。現在は、AVITIシステムの精度を活用してイノベーティブで、柔軟かつスケーラブルなソリューション構築のために、研究や臨床の様々な顧客と協力して働いています。 ヒトの病気に焦点を当てて、様々な次世代シーケンシングアプリケーション(NGS)に取り組んでいます。Job Dekker PhD HHMIの指導の下、マサチューセッツ・メディカル・スクール大学でPhDを取得し、Hi-C方法論の開発と開拓に取り組んでいました。
翻訳はプロトタイプソリューションアーキテクト 小泉が担当しました。原文はこちらです。