概要

AWS HealthOmics では、お支払いいただくのは使用した分だけです。お客様は、保存するデータの量と、ワークフローの処理に使用するコンピューティングインスタンスに基づいて課金されます。AWS HealthOmics では、シーケンスとリファレンスデータオブジェクト、またはバリアントと注釈データを保存することができます。また、バイオインフォマティクスワークフローを実行して、ゲノム、トランスクリプトーム、およびその他のオミクスデータを解析し、変換することもできます。 AWS HealthOmics は、オミクスデータの保存と計算のために最適化されており、Amazon SageMaker、Amazon Simple Storage Service (S3)、Amazon Athena などの他の AWS のサービスと連動します。

無料利用枠

AWS 無料利用枠の一部として、AWS HealthOmics を無料で開始できます。無料利用枠は、初めて AWS HealthOmics リソースを作成した最初の月から開始されます。AWS HealthOmics の無料利用枠の詳細は、以下の表でご確認いただけます。

 

最初の 2 か月間は 1 か月あたりの無料利用枠を利用可能

AWS HealthOmics ストレージ アクティブストレージクラスで 1500 ギガベース/月、アーカイブストレージクラスで 1500 ギガベース/月
AWS HealthOmics ワークフロー

275 omics.m.xlarge インスタンス時間または同等のコンピューティングインスタンス、および 49,000 GB-時間の実行ストレージ

AWS HealthOmics 分析 200 ギガバイト/月

AWS のお客様は、すべての AWS のサービスとリージョン (中国と GovCloud を除く) を集計して、1 か月あたり 100 GB のインターネットへのデータ転送 (アウト) を無料でご利用いただけます。

AWS HealthOmics ストレージ料金

AWS HealthOmics ストレージにゲノム配列を保存する場合、ギガベース/月単位でストレージ料金を支払います。ギガベースとは、インポートしたシーケンスファイル (FASTQ、BAM、CRAM など) から抽出された 10 億塩基対を指します。 AWS HealthOmics ストレージには、ソースファイルから抽出された塩基対、品質スコア、整列、その他のメタデータが保存されます。保存されたギガベース単位で支払うため、最適なファイル形式や圧縮技術を気にする必要はありません。 AWS HealthOmics がすべての処理を行います。

シーケンスオブジェクトは読み取りセットと呼ばれ、論理的には FASTQ、BAM、または CRAM ファイルと同等のものです。 AWS HealthOmics ストレージでは、読み取りセットに対してアクティブストレージクラスとアーカイブストレージクラスが提供されます。アーカイブクラスの読み取りセットの保存コストは、アクティブクラスの読み取りセットよりも 1 か月あたりのコストが低くなります。アクティブクラスの読み取りセットにはミリ秒単位でアクセスできます。アーカイブ層の読み取りセットは、アクセスする前にアクティブ化する必要があります。読み取りセットが 30 日間アクセスされなければ、自動的に低コストのアーカイブストレージクラスに移動し、再度アクティブ化されるまで保存されます。

読み取りセットのインポート手数料はかかりません。 AWS HealthOmics のストレージデータには、最小ストレージ期間である 30 日分の料金が請求されます。30 日が経過する前に削除されたデータには、残りの日数分のストレージ料金に等しい日割り料金が発生します。 AWS HealthOmics ストレージは、長期間使用するが頻繁にアクセスしないデータを年単位で保持するためのものです。

AWS HealthOmics ストレージデータにアクセスするには、HealthOmics API による読み取り、書き込み、更新と、S3 API による読み取りの 2 つの方法があります。  HealthOmics API を介してアクセスする場合、読み取りセットオブジェクトに対して行われた GET リクエストの料金が発生します。読み取りセットに関するその他の HealthOmics リクエストタイプはすべて無料です。S3 API を介したアクセスの場合、COPY リクエストと LIST リクエストは他のすべてのリクエストタイプとは別に請求されます。  

Amazon S3 API を使って GET リクエストと LIST リクエストを行う場合、S3 API 料金が発生します (料金表はこちら)。

AWS HealthOmics 分析の料金

AWS HealthOmics 分析は、Amazon Athena や Amazon SageMaker などの幅広い AWS 分析および機械学習サービスで使用するゲノムバリアントデータやゲノム注釈を準備するのに役立ちます。ゲノムバリアントデータを任意の量で保存でき、保存した分だけの料金を支払います。データサイズは、変換されたデータのサイズとして定義されます。ただし、他のサービスのデータをクエリおよび分析する場合は、それらのサービスの使用料を支払います。

AWS HealthOmics 分析のデータには、最小ストレージ期間である 30 日分の料金が請求されます。30 日が経過する前に削除されたデータには、残りの日数分のストレージ料金に等しい日割り料金が発生します。

AWS HealthOmics のプライベートワークフローと Ready2Run ワークフローの料金

AWS HealthOmics は、プライベートワークフローと Ready2Run ワークフローによるバイオインフォマティクスワークフローの実行も管理します。

プライベートワークフローにより、最も一般的に使用されるワークフロー言語で記述された、独自のバイオインフォマティクススクリプトを使用できます。プライベートワークフローは 1 回の実行で実行できます。リクエストした分の料金のみをお支払いいただきます。また、Omics インスタンスタイプと実行ストレージの料金は別途請求されます。ワークフロー内のすべてのタスクは、定義されたリソースに最適なインスタンスにマッピングされます。例えば、8 コア CPU と 60 GB の RAM を使用するように定義されたタスクは、omics.r.2xlarge インスタンスタイプにマッピングされて実行されます。

Ready2Run ワークフローは、業界のサードパーティソフトウェア会社やオープンソースパイプラインによってパッケージ化された、あらかじめ構築されたワークフローです。Ready2Run ワークフローを使用するだけで、Germline や GATK-BP などの最も一般的に使用されるワークフローでデータを処理できます。Ready2Run ワークフローは実行ごとに料金が発生するため、すべてのワークフローで同じ料金が請求されます。

プライベートワークフローと Ready2Run ワークフローの両方で、ログはアカウントの Amazon CloudWatch Logs に保存され、保持することを選択している限り、CloudWatch で料金が請求されます。実行ごとにリソース使用量をレポートするようにサービスを設定して、予算、計画、会計を簡素化することができます。

  • プライベートワークフロー
  • Ready2Run ワークフロー

料金の例

例 1

ある集団シーケンシングイニシアチブでは、収集したバイオバンクから個人の配列を開始しました。これは、欧州西部 (アイルランド) リージョンで行うことにします。それぞれ 130 ギガベース、50 ギガバイトの 10 万人の個人を配列し、生のシーケンシングデータを AWS HealthOmics ストレージに保存します。今後 5 年間は、インポート後 30 日経過してもアーカイブストレージクラスに残り、アクティブストレージクラスに移動した後は 30 日間で平均 2 回アクセスされます。ファイルへのアクセスには、S3 API を使用します。各ゲノムは 500 回に分けてダウンロードされ、500 の GET API コールが生成されます。1 つのゲノムにかかる 5 年間の合計コストは、次のとおりです。
アクティブストレージクラス: 0.005769 USD ギガベース/月 * 130 ギガベース * 90 日 = 2.22 USD
アーカイブストレージクラス: 0.001154 USD ギガベース/月 * 130 ギガベース * (1,825 – 90) 日 = 8.56 USD。
S3 GET API: 0.0004 USD/1000 API コール * (2 x 500 API コール) = 0.0004 USD
5 年間の合計コスト: 2.22 USD + 8.56 USD + 0.0004 USD = 10.78 USD (または 2.15 USD/年)

例 2

バイオインフォマティクスの研究者が、米国東部 (バージニア北部) リージョンの AWS HealthOmics ワークフローで Nextflow ワークフローを実行したいと考えています。ワークフローには 3 つのタスクがあります。1 つ目のタスクでは 16 vCPU と 30 GB のメモリを確保し、3 時間かけて実行します。2 つ目のタスクには 32 vCPU と 160 GB のメモリが必要で、実行には 2 時間かかります。3 つ目のタスクでは 4 vCPU と 10 GB のメモリを確保し、10 分かけて実行します。お客様がワークフローを登録し、デフォルトの 1200 GB のファイルシステムで StartRun API を呼び出します。合計コストは以下の通りです。
タスク 1 (omics.c.4xlarge): 0.9180 USD/時間 * 3 時間 = 2.754 USD
タスク 2 (omics.r.8xlarge):
2.7216 USD/時間 * 2 時間 = 5.4432 USD
タスク 3 (omics.m.xlarge): 0.2592 USD/時間 * 1/6 時間 = 0.0432 USD
ストレージ: 0.0001918 USD/GB-時間 * (1200 GB*(3 時間 +2 時間 + 1/6 時間)) = 1.18916 USD
合計: 9.42956 USD

例 3

あるデータサイエンティストが、バリアント呼び出しフォーマット (VCF) ファイルを 3,202 個持っていて、米国東部 (バージニア北部) リージョンの Amazon Athena で分析したいと考えています。バリアントストアを作成し、AWS HealthOmics API を使用してこれらのファイルを取り込みます。取り込まれたデータのサイズは 1.5 TB です。その後 1 か月の間に、Athena でクエリを 1000 回実行し、異なる亜母集団の対立遺伝子頻度を計算し、各実行で平均 50 GB を消費しました。全体的な月間コストは次のとおりです。
バリアントストア: 0.035 USD GB/month * (1,024 GB/TB * 1.5 TB) = 53.76 USD
Amazon Athena: 5 USD/TB * 1,000 * 50 / 1,024 = 244.14 USD

例 4

ある計算科学者は、米国東部 (バージニア北部) リージョンで、30x のゲノム Ready2Run ワークフローで GATK-BP Germline fq2vcf を 3 つのサンプルに対して実行したいと考えています。顧客はデータを入力し、サンプルごとに StartRun API を呼び出します。3 回の実行のコストは次のとおりです。
30x のゲノムの Ready2Run ワークフロー用の GATK-BP Germline fq2vcf : 10.00 USD / 実行 * 3 = 30.00 USD
合計: 30.00 USD

料金に関するその他のリソース

AWS 料金計算ツール

AWS の月額料金を簡単に計算

クラウドエコノミクスリソースセンター

個別のお見積もりをご希望の場合、AWS のスペシャリストに問い合わせる