Indivumed 通过基于 AWS 的强大分析促进癌症研究

2022 年

Indivumed 总部位于汉堡,专业使用最高质量的生物样本和全面的临床数据来推进精准肿瘤学的研究与开发。其 IndivuType 发现解决方案使用 AWS 存储数据并支持分析,以破译癌症的复杂性。通过改进 AWS 基础设施,Indivumed 节省了超过 50% 的 IT 总成本,并将每周可处理的样本数量从 20 个增加到 500 个,增加了 2400%。

Indivumed
kr_quotemark

我们拥有世界上自动化程度最高的多组学处理设施。该设施正在推动创造新的治疗方法,最终挽救和延长人们的生命。这是值得骄傲的事情。”

Rene Steen
Indivumed IT 副总裁

Indivumed 通过基于 AWS 的强大分析促进癌症研究

二十年来,总部位于汉堡的 Indivumed 专注于生物样本库,为癌症研究与开发提供基础设施、专业知识和技术。该公司大多数客户和合作伙伴是学术研究机构和制药公司,利用 Indivumed 产生的洞察来发现和验证新药物,并最终开发出用于治疗危及生命的癌症的新疗法。

随着生命科学领域和制药行业变得更加数据化,Indivumed 看到了通过分析多组学数据产生这些洞察的机会。Indivumed 决定利用其存储的数千份组织样本,为癌症的深层分子信息创建一个独特的存储库。

但数据集既复杂又广泛。为了管理这种复杂性,该公司向 Amazon Web Services(AWS)寻求帮助,并使用基于云的高性能计算(HPC)构建了世界上第一个也是最广泛的专有多组学数据库。

在 AWS 上启动多组学数据库

合作成果便是 IndivuType,这是一个多组学数据库,结合了来自欧洲、美国和亚洲成千上万患者的不同分子生物学信息与临床信息。每个癌症样本的数据集包括检测疾病标记物的分子分析的原始读数,其大小可达 200 GB。

Indivumed 知道数据库的计算需求将非常高。因此,该公司决定构建一个 HPC 集群,不仅可以处理巨大的数据集,还可以根据所需的处理量自动扩展和缩减资源。

该公司选择 AWS 帮助其实现愿景。“AWS 是帮助我们进行扩展的最佳选择,它为我们的构建提供了一系列安全、可靠和无服务器的技术。”Indivumed 高级分析和人工智能副总裁 Jonathan Woodsmith 博士表示。

最初,Indivumed 使用 Amazon Elastic Compute Cloud(EC2)和 Amazon Elastic File System(EFS)构建了一个 HPC 集群,后者提供了安全且可调整大小的计算容量,并在添加和删除文件时自动增长和收缩。

现代化集群使处理能力提高 2,400%

随着公司的发展,Indivumed 需要增加其可以处理的数据量,以便增加每年可以处理的样本数量。为了实现这一目标,Indivumed 需要重构集群。Woodsmith 表示:“我们花了大量时间构建一个云原生的技术平台。”

Indivumed 和 AWS 启动了癌症和临床分析多组学(MOCCA)项目,以使集群现代化。该项目基于 Amazon Elastic Kubernetes Service(Amazon EKS),这是一项托管容器服务,可以运行和扩展 Kubernetes。Indivumed 还使用基于 Intel 的计算优化 Amazon EC2 竞价型实例,意图以低成本提供高性能工作负载。

为了进一步优化成本,新集群用 Amazon Simple Storage Service(Amazon S3)提供的对象存储取代了多个 Amazon EFS 工作负载,旨在从任何位置检索任意数量的数据。与之前的 AWS 设置相比,使用 MOCCA 集群后,Indivumed 节省超过 50% 的 IT 总成本,并将每个样本的成本降低了 41% 左右。

该集群还增加了可以并行处理的样本数量。通过使用 Amazon EKS 纵向扩展到 1,000 个实例,IndivuType 现在每周可以处理的样本数量从原来的 20 个,增加到 500 个。与之前的系统相比,处理能力增加了 2400%。

Indivumed 使用 Amazon S3 Glacier 进一步增强了存储不再需要的数据的能力,为数据归档提供了长期、安全、持久的存储类。Woodsmith 表示:“随着业务的增长,我们必须能够继续向前发展,并知道我们有能力跟上增长的步伐。”

利用 AI 和 ML 把握拯救生命的机会

随着 IndivuType 的启动和运行,Indivumed 希望对癌症生物学产生新的洞察,以供其客户和合作伙伴开发新的治疗方法。为了产生这些洞察,Indivumed 将机器学习(ML)应用于多组学数据分析。除此之外,该公司还使用了 JADBio,这是一种为生命科学应用定制的自动化 ML 系统,包括大型多组学临床数据集和医学图像。

JADBio 是一个软件即服务平台,在 AWS 上运行,通过 API 直接与 IndivuType 集成。JADBio 技术通过识别和学习肿瘤数据中的信息模式,为 Indivumed 的 nRavel® 人工智能(AI)平台提供支持。

nRavel® 包括有 Indivumed 使用综合生物数据库中精选的疾病模型数据进行构建和验证的定制工具。再加上先进的分析算法和 ML,可以帮助 Indivumed 更好地了解癌症的生物学、治疗和结果。

这些新功能帮助 Indivumed 建立了新的联系和伙伴关系。该公司现在为多家大型制药机构和多家中小型生物技术公司提供 IndivuType 和 nRavel® 高级组织样本分析。

使用 Indivumed 技术的组织所取得的进步可能会改变癌症患者的生活。“我们拥有世界上自动化程度最高的多组学处理设施。”Indivumed 的 IT 副总裁 Rene Steen 表示,“该设施正在推动创造新的治疗方法,最终将能够挽救和延长人们的生命。这是值得骄傲的事情。”


关于 Indivumed

Indivumed 总部位于汉堡,专业使用最高质量的生物样本和全面的临床数据来推进精准肿瘤学的研究与开发。成立于 20 年前,总部位于德国汉堡。

AWS 的优势

  • 开发了一个多组学数据库,存储了数千份组织样本用于医疗研究
  • 产生的洞察用于创造癌症治疗的新疗法
  • 将 IT 总成本降低 50% 
  • 将样本的数据处理能力提高了 2,500%

使用的 AWS 服务

Amazon EC2

Amazon Elastic Compute Cloud(Amazon EC2)是一种 Web 服务,可以在云中提供安全并且可应需调整的计算容量。该服务旨在让开发人员能够更轻松地进行 Web 规模的云计算。

了解更多 »

Amazon S3

Amazon Simple Storage Service (Amazon S3) 是一种对象存储服务,提供行业领先的可扩展性、数据可用性、安全性和性能。

了解更多 »

Amazon EKS

Amazon Elastic Kubernetes Service(Amazon EKS)是一项托管容器服务,可以在云中和本地运行和扩展 Kubernetes 应用程序。

了解更多 »

Amazon EFS

Amazon Elastic File System(Amazon EFS)可随着您添加和删除文件自动增大或收缩,无需管理或预置。

了解更多 »


开始使用

不同行业和规模的企业都在使用 AWS 对其业务进行转型,以实现自身愿景。联系我们的专家,立即踏上您的 AWS 之旅。