一般性问题

问:什么是 Amazon Omics?

Amazon Omics 是一项专用服务,可帮助医疗保健和生命科学组织及其软件合作伙伴存储、查询和分析基因组、转录组和其他组学数据,然后从这些数据中产生见解,从而改善健康。它支持大规模分析和协作研究。

问:Amazon Omics 如何帮助提高效率?

Amazon Omics 为准备和分析组学数据提供了可扩展的工作流程和集成工具,并自动提供和扩展底层基础设施,以便您可以将更多时间用于研究和创新。Amazon Omics 支持大规模分析和协作研究。

问:此服务如何与其他 AWS 服务配合使用?

Amazon Omics 可以使用 Amazon Omics 工作流程直接从 Amazon Simple Storage Service (S3) 或 Amazon Omics 存储处理数据。您可以将原始基因组序列文件、变体调用格式文件和注释数据集等数据从 Amazon S3 导入与生物信息学兼容的 Amazon Omics 存储和分析商店。您可以使用 AWS Lake Formation 控制对 Amazon Omics 变体和注释存储的访问,并使用 Amazon Athena 使数据更易于查询,并与其他形式的数据(例如来自 Amazon HealthLake 的医疗健康记录)相结合。您还可以使用 Amazon Athena 使数据更容易查询并与其他形式的数据相结合,例如来自 Amazon HealthLake 的医疗健康记录。此外,您还可以在 Amazon QuickSight 中使用转换后的数据进行高级分析。您还可以使用 Amazon SageMaker 在您的多组学和多模态数据上构建、训练和部署新型机器学习算法。

问:Amazon Omics 支持哪些数据格式?

我们有两种类型的数据存储,一种用于原始、生物数据存储,另一种用于变体和注释数据存储。Amazon Omics Storage 可以导入 FASTA 格式的参考基因组和 Gzip 压缩后的 FASTQ、BAM 和 CRAM 格式的原始序列文件。Amazon Omics 分析存储可以为变体数据导入 (g)VCF 格式的文件,为基因组注释导入 VCF、GFF 和 TSV/CSV 文件。Amazon Omics 工作流程可以从 Amazon Omics 存储或 Amazon S3 读取您定义的工作流程定义和工具支持的任何数据。

问:用 Amazon Omics 工作流程运行 WDL 或 Nextflow 工作流程,与运行它们的开源引擎实施有什么不同?

Amazon Omics 工作流程支持符合 WDL 1.1 规范或 Nextflow 22.04.0 DSL2 的工作流程定义。目前,工作流程引用的工具必须被封装在符合 OCI 标准的容器中,并存储在 Amazon Elastic Container Registry(ECR)的私有注册表中。工作流程定义必须定义特定的最终输出——当工作流程运行完成后,中间结果将被丢弃。目前不支持工作流程运行或任务的缓存。

隐私与安全性

问:Amazon Omics 提供什么类型的安全?

Amazon Omics 符合 HIPAA 要求。您可以使用基于属性的访问控制来定义谁可以访问 Amazon Omics 资源。所有持久性存储支持客户管理的密钥。行权限和列权限也可以在 Amazon Omics 分析商店中使用。Amazon Omics API 与 AWS CloudTrail 和 Amazon CloudWatch Logs 集成,允许您生成详细的数据出处并访问审计跟踪记录。

问:在使用 Amazon Omics 之前,我是否需要一个商业伙伴附录 (BAA)?

Amazon Omics 是一项符合 HIPAA 要求的服务。如果您在 AWS 上存储受保护的健康信息 (PHI) ,您需要有一个商业伙伴附录。您可以使用 AWS Artifact 在线快速输入一个商业伙伴附录。