AWS HealthOmics 功能

AWS HealthOmics 可讓客戶更加輕鬆地儲存、查詢以及分析基因組、轉錄組及其他體學資料,繼而透過這些資料產生深入洞察。此服務可簡化並加速儲存和分析用於研究及多方臨床應用的多組學資訊的過程,讓您可以專注於從資料中取得更深入的洞察。

AWS HealthOmics 儲存體可容納多達數 PB 的體學資料,讓您以划算的價格擁有超高的工作效率,能根據人口規模開展科學研究工作。 AWS HealthOmics 私有和 Ready2Run 工作流程可自動佈建及擴展計算基礎結構,讓您可以根據生產規模執行生物資訊學分析管道,削減管理基礎結構的時間,將更多時間用於研究工作。 AWS HealthOmics 隨附 Ready2Run 工作流程集合,這些工作流程經過預先建置並按每次執行定價。 AWS HealthOmics 分析可簡化多模態分析的體學資料準備流程,讓您能夠將多組學和健康記錄資料整合在一起,從而產生更具針對性及個人化的治療。這些功能也符合 HIPAA 規範。

一般問題

AWS HealthOmics 儲存體與 FASTQ、BAM 和 CRAM 等格式的生物資訊學檔案相容,讓您能夠以低成本高效率的方式儲存、探索和共用這些資料。這些格式的檔案以讀取集物件儲存在序列存放區內。您還可以用 FASTA 格式儲存參考基因組。將資料作為具有唯一標識碼的不可變物件匯入,以支援需要嚴格資料來源的工作負載。客戶可透過 AWS Identity and Access Management (IAM) 使用索引標籤和基於屬性的存取控制,掌控對單一資料物件 (包括參考和讀取集物件) 的存取。為了降低長期儲存成本,將 30 天之內未曾被存取過的資料物件自動移至封存儲存類別。已封存物件隨時可透過 API 呼叫受到重新啟用。

AWS HealthOmics 對於大規模執行生物資訊學工作流程大有助益。您可以選擇 Ready2Run 工作流程或自攜私有工作流程來處理您的生物資料,而無需管理基礎設施。

Ready2Run 工作流程是由產業領先的第三方軟體公司 (例如 Sentieon, Inc.、NVIDIA 和 Element Biosciences) 以及常見的開放原始碼管道 (例如 Broad Institute 的 GATK 最佳實務工作流程和 AlphaFold 的蛋白質結構預測) 設計的預先建置工作流程。您只需使用 Ready2Run 工作流程即可處理資料,無需管理軟體工具或工作流程指令碼。Ready2Run 工作流程依據預先確定的價格按每次執行計費。

私有工作流程可讓您使用以工作流程描述語言 (WDL) 或 Nextflow (這是兩種最常用的工作流程語言) 撰寫的自攜工作流程指令碼。您可以透過單一執行 (稱為執行),來執行這些私有工作流程。針對私有工作流程,您僅需依要求付費,系統會針對 Omics 執行個體類型與執行儲存個別計費。工作流程中的所有任務,皆會對應至最適合您定義資源的執行個體。

AWS HealthOmics 讓您可以快速擷取 (g)VCF、GFF3 和 TSV/CSV 等格式的基因組學資料,然後將資料轉換為 Apache Iceberg 資料表。您可以透過 Amazon Athena 等分析服務讓基因組學資料可以存取。您可以轉換變體資料 (來自單一樣本的資料) 和註釋資料 (基因組中位置的已知資訊)。您可以使用 AWS Lake Formation 控制對分析存放區的存取權限,在實作精細存取控制的同時,簡化跨不同資料來源執行查詢的流程。例如,您可以將個人的基因組資料與 Amazon HealthLake 中的病歷 (可能包括之前的治療、用藥或檢驗室報告) 安全地合併,以利於精準醫療。

AWS HealthOmics 將研究人員的工作流程化繁為簡,便於他們透過標記、設定權限並與協作者安全共用資料來協作。這可簡化將體學資料變得可查找、可存取、可互操作並可重複使用 (FAIR) 的方式。您可以透過網域特定的中繼資料,將 AWS HealthOmics 資料存放區與其他組學和醫療保健資料連結起來,以利多組學和多模態分析。針對資料來源,AWS HealthOmics 會將所有工作流程執行中繼資料封存在 CloudWatch 日誌中,讓您輕鬆儲存查詢這些資訊。您可以將這些資訊從 CloudWatch 匯出至 S3 以進行長期儲存。這些資訊可協助您追蹤哪些演算法與輸入資料一起使用,以產生符合合規要求的輸出資料。

安全性、隱私權與合規性

AWS HealthOmics 符合 HIPAA 資格。您可以套用基於屬性的控制來定義精細的資料存取和控管。服務已內建全面的記錄和來源擷取功能,方便您了解存取的資料內容、存取人員及存取時間。