使用 AWS HealthOmics 時,您只需依用量付費。系統根據資料儲存量以及用於處理工作流程的運算執行個體計費。AWS HealthOmics 可用於儲存序列和參考資料物件或變體和註釋資料。您也可以執行生物資訊學工作流程來分析和轉換基因體學、轉錄組學和其他體學資料。 AWS HealthOmics 已針對體學資料的儲存與運算進行優化,並可與 Amazon SageMaker、Amazon Simple Storage Service (S3) 和 Amazon Athena 等其他 AWS 服務搭配使用。
免費方案
AWS 免費方案可讓您免費開始使用 AWS HealthOmics。免費方案從您建立第一個 AWS HealthOmics 資源的第一個月開始計算。下表提供 AWS HealthOmics 免費方案的詳細資訊。
前 2 個月的每月免費方案用量 |
|
AWS HealthOmics 儲存 | 作用中儲存類別為 1,500 Gb (每月),封存儲存類別為 1,500 Gb (每月) |
AWS HealthOmics 工作流程 | omics.m.xlarge 執行個體或同等運算執行個體 275 個小時,以及 49,000 GB (每小時) 執行儲存 |
AWS HealthOmics 分析 | 200 GB (每月) |
AWS HealthOmics 儲存定價
當您在 AWS HealthOmics 儲存體中存放基因組序列時,可按月支付每 Gb 的儲存費用。1 Gb (gigabase) 表示所匯入序列檔案 (例如 FASTQ、BAM 和 CRAM) 中的 10 億個基底。 AWS HealthOmics 儲存體會存放來源檔案中的基底、品質得分、比對以及其他中繼資料。您可按儲存的 Gb 數付費,因此無須擔心最佳檔案格式或壓縮技術。 AWS HealthOmics 會負責處理所有工作。
序列物件稱為讀取集,在邏輯上等同於 FASTQ、BAM 或 CRAM 檔案。 AWS HealthOmics 儲存體會提供讀取集的作用中儲存類別與封存儲存類別。封存類別讀取集的每月儲存費用低於作用中類別的讀取集。系統僅需數毫秒時間即可存取作用中類別讀取集,而封存方案讀取集必須經過啟動方可存取。若 30 天未存取讀取集,系統會將這些讀取集自動移入較低成本的封存儲存類別,除非受到重新啟用。
讀取集無匯入費用。 AWS HealthOmics 儲存體資料需支付 30 天最低儲存費用,30 天內刪除的資料會依比例計費,等同與剩餘儲存天數的費用。 AWS HealthOmics 儲存體旨在將長效但不常存取的資料保留數年。
您需為讀取集物件產生的 GET 請求付費。讀取集的其他類別請求則為免費。
AWS HealthOmics 分析定價
AWS HealthOmics 分析可協助您準備基因組變體資料與基因組註釋,以便與 Amazon Athena 和 Amazon SageMaker 等廣泛的 AWS 分析與機器學習套件服務搭配使用。您可儲存任意數量的基因組變體資料,且僅需支付儲存內容的費用。資料大小定義為所轉換資料的大小。不過,當您在其他服務中查詢和分析資料時,則需支付這些服務的使用費用。
AWS HealthOmics 分析資料需支付 30 天最低儲存費用,30 天內刪除的資料會依比例計費,等同與剩餘儲存天數的費用。
AWS HealthOmics 私有與 Ready2Run 工作流程定價
AWS HealthOmics 亦可透過私有與 Ready2Run 工作流程,管理生物資訊學工作流程的執行。
私有工作流程可讓您使用以最常用工作流程語言所編寫的專屬生物資訊學指令碼。您可透過單一執行來執行私有工作流程。您僅需依要求付費,系統會針對 Omics 執行個體類型與執行儲存個別計費。工作流程中的所有任務,皆會對應至最適合其定義資源的執行個體。例如,定義為使用 8 個 CPU 和 60 GB RAM 的任務,會對應至 omics.r.2xlarge 執行個體類型以供執行。
Ready2Run 工作流程是由業界第三方軟體公司和開放原始碼管道封裝的預置工作流程。您只需使用 Ready2Run 工作流程,即可使用最常用的工作流程 (例如 Germline 和 GATK-BP) 來處理資料。Ready2Run 工作流程是依執行付費,表示每個工作流程會向您收取相同價格的費用。
私有與 Ready2Run 工作流程日誌皆會會儲存在您帳戶的 Amazon CloudWatch Logs 中;若您選擇保留這些日誌,則會在 CloudWatch 中計費。您可將服務設定為報告每次執行的資源使用,從而簡化預算、規劃和會計工作。
-
私有工作流程
-
Ready2Run 工作流程
-
私有工作流程
-
-
Ready2Run 工作流程
-
定價範例
範例 1
群體測序計畫開始對收集在人體生物資料庫中的個人進行測序。該計畫選擇在西歐 (愛爾蘭) 地區執行此工作。其針對每 130 Gb 的 100,000 名個人進行測序,並將原始測序資料存放在 AWS HealthOmics 儲存體中。在接下來的五年中,這些資料在匯入 30 天過後會保留於封存儲存類別,並且在轉換為作用中儲存類別 30 天中平均受到兩次存取。每個基因組分為 500 個部分下載,產生 500 次 GET API 呼叫。單個基因組的五年期總成本為:
作用中儲存類別:0.005769 USD Gb/月 * 130 Gb * 90 天 = 2.22 USD
封存儲存類別:0.001154 USD Gb/月 * 130 Gb * (1825 – 90) 天 = 8.56 USD。
GET API:0.005 USD / 1000 次 API 呼叫 * (2 * 500 次 API 呼叫) = 0.005 USD
5 年期總成本:2.22 USD + 8.56 USD + 0.005 USD = 10.79 USD (或 2.16 USD/年)
範例 2
在美國東部 (維吉尼亞北部) 地區,一位生物資訊學科學家想在 AWS HealthOmics 工作流程中執行 Nextflow 工作流程。她的工作流程中有三項任務。第一項任務是保留 16 個 vCPU 和 30 GB 記憶體,執行時間為 3 小時。第二項任務是保留 32 個 vCPU 和 160 GB 記憶體,執行時間為 2 小時。第三項任務是保留 4 個 vCPU 和 10 GB 記憶體,執行時間為 10 分鐘。該客戶註冊工作流程,並透過預設的 1200 GB 檔案系統呼叫 StartRun API。整體成本如下:
任務 1 (omics.c.4xlarge):0.9180 USD/小時 * 3 小時 = 2.754 USD
任務 2 (omics.r.8xlarge):2.7216 USD/小時 * 2 小時 = 5.4432 USD
任務 3 (omics.m.xlarge):0.2592 USD/小時 * 1/6 小時 = 0.0432 USD
儲存體:0.0001918 USD/GB-小時 * (1200GB*(3小時+2 小時+1/6 小時)) = 1.18916 USD
總計:9.42956 USD
範例 3
在美國東部 (維吉尼亞北部) 地區,一位資料科學家想使用 Amazon Athena 分析 3,202 個變體呼叫格式 (VCF) 檔案。他先建立了變體存放區,然後使用 AWS HealthOmics API 擷取這些檔案。擷取到的資料大小為 1.5 TB。在接下來的一個月中,他使用 Athena 執行了 1,000 次查詢,針對不同子群體計算對偶基因頻率,平均每次耗用 50 GB。每月整體成本如下:
變體存放區:0.035 USD GB/月 * (1024 GB/TB * 1.5 TB) = 53.76 USD
Amazon Athena:5 USD / TB * 1000 * 50 / 1024 = 244.14 USD
範例 4
一位計算科學家希望在美國東部 (維吉尼亞北部) 區域,針對 30 倍的基因體 Ready2Run 工作流程執行 GATK-BP Germline fq2vcf,以取得 3 個樣本。客戶輸入其資料,並針對每個樣本呼叫 StartRun API。3 次執行的成本如下:
用於 30 倍基因體 Ready2Run 工作流程的 GATK-BP Germline fq2vcf: 10.00 USD/執行 * 3 = 30.00 USD
總計: 30.00 USD