Amazon Omics 可讓客戶更加輕鬆地儲存、查詢以及分析基因組、轉錄組及其他組學資料,繼而透過這些資料產生深入洞察。此服務可簡化並加速儲存和分析用於研究及多方臨床應用的多組學資訊的過程,讓您可以專注於從資料中取得更深入的洞察。

Amazon Omics 儲存體可容納多達數 PB 的組學資料,讓您以划算的價格擁有超高的工作效率,能根據人口規模開展科學研究工作。Amazon Omics 工作流程可自動佈建及擴展計算基礎結構,讓您可以根據生產規模執行生物資訊學分析管道,削減管理基礎結構的時間,將更多時間用於研究工作。Amazon Omics 分析可簡化多模態分析的組學資料準備流程,讓您能夠將多組學和健康記錄資料整合在一起,從而產生更具針對性及個人化的治療。這些功能也符合 HIPAA 規範。

一般

專用儲存體

Amazon Omics 儲存體與 FASTQ、BAM 和 CRAM 等格式的生物資訊學檔案相容,讓您能夠以低成本高效率的方式儲存、探索和共用這些資料。這些格式的檔案以讀取集物件儲存在序列存放區內。您還可以用 FASTA 格式儲存參考基因組。將資料作為具有唯一標識碼的不可變物件匯入,以支援需要嚴格資料來源的工作負載。客戶可透過 AWS Identity and Access Management (IAM) 使用索引標籤和基於屬性的存取控制,掌控對單一資料物件 (包括參考和讀取集物件) 的存取。為了降低長期儲存成本,將 30 天之內未曾被存取過的資料物件自動移至封存儲存類別。已封存物件隨時可透過 API 呼叫受到重新啟用。

生物資訊學工作流程

Amazon Omics 對於大規模執行生物資訊學工作流程大有助益。具體說明工作流程定義、要使用的工具以及要分析的資料後,再由 Amazon Omics 佈建基礎結構並實作工作流程。支援符合 WDL 1.1 和 Nextflow 22.04.0 DSL2 規範的工作流程定義。工作流程採用儲存在 Amazon Elastic Container Registry (ECR) 私人登錄檔中符合 OCI 規範的容器化工具。您可以分析 S3 儲存貯體或 Amazon Omics 序列存放區中的資料。您可以控制誰有權存取特定的工作流程、控制使用的資源總量,以及透過工作流程執行群組管理實作的優先順序。

大規模分析

Amazon Omics 讓您可以快速擷取 (g)VCF、GFF3 和 TSV/CSV 等格式的基因組學資料,然後將資料轉換為 Apache Parquet 格式。您可以透過 Amazon Athena 等分析服務讓基因組學資料可以存取。您可以轉換變體資料 (來自單一樣本的資料) 和註釋資料 (基因組中位置的已知資訊)。您可以使用 AWS Lake Formation 控制對分析存放區的存取權限,在實作精細存取控制的同時,簡化跨不同資料來源執行查詢的流程。例如,您可以將個人的基因組資料與 Amazon HealthLake 中的病歷 (可能包括之前的治療、用藥或檢驗室報告) 安全地合併,以利於精準醫療。

資料協作和來源

Amazon Omics 將研究人員的工作流程化繁為簡,便於他們輕鬆標記協作者、設定其權限並與之安全共用資料。這可簡化將組學資料變得可查找、可存取、可互操作並可重複使用 (FAIR) 的方式。您可以透過網域特定的中繼資料,將 Amazon Omics 資料存放區與其他組學和醫療保健資料連結起來,以利多組學和多模態分析。

安全性、隱私權與合規性

符合 HIPAA 規範

Amazon Omics 符合 HIPAA 規範。您可以套用基於屬性的控制來定義精細的資料存取和控管。服務已內建全面的記錄和來源擷取功能,方便您了解存取的資料內容、存取人員及存取時間。