跳至主要内容
2025 年

Tune Therapeutics 使用 AWS PCS 加速拯救生命的研究

了解 Tune Therapeutics 在使用 AWS PCS 进行生物技术分析时,如何将 50 TB 单细胞数据的处理时间减少 67%。

关键成果

100 万
使用 AWS PCS 处理的单细胞数据集中包含的细胞数量
2–3 周
处理数据所需的时间,而不需要长达 12 周
4–6 倍
处理速度增幅

概述

生物技术公司 Tune Therapeutics(Tune)致力于通过表观遗传编辑发掘再生医学的全部潜力。作为这种治疗模式的先驱,该公司正在为多种常见和复杂疾病开发治疗方法,包括慢性乙肝。

Tune 希望启动一个雄心勃勃的项目,以确定肝脏相关疾病的新治疗靶点。为此,该公司需要强大的计算能力来处理一个包含 100 万个细胞的大型、高维、单细胞多模态数据集,并将每个细胞数以万计的基因组学观察结果转化为可操作的后续步骤。然而,Tune 通常合作的第三方云供应商无法处理如此大的数据集,而在单个大型服务器上运行 Tune 的分析软件也因所需的处理时间过长而不可行。

Tune 知道答案在于高性能计算(HPC)解决方案。Tune 自 2020 年以来一直使用 Amazon Web Services(AWS)解决方案,因此当需要为此使用案例寻找 HPC 解决方案时,该公司求助于 AWS。

Tune 选择了 AWS 并行计算服务(AWS PCS),这是一项使可运行和扩展 HPC 工作负载变得更加轻松的托管服务。通过使用 AWS PCS,Tune 将向研究人员交付数据的时间从数月缩短到几周——加速了可能拯救生命的疗法的开发时间表。

Missing alt text value

关于 Tune Therapeutics

Tune Therapeutics 成立于 2020 年,正在开创治疗挑战性疾病的新方法。它使用基因调频技术来激活、抑制和微调特定基因的输出,以中断疾病通路。

商机 | 使用 AWS PCS 处理 100 万个人体细胞

自 2020 年以来,Tune 一直致力于为常见疾病开发创新疗法。其雄心勃勃的项目之一旨在发现肝脏相关疾病的新治疗靶点,这些疾病可能使人衰弱甚至致命。Tune 的高级软件工程师 Harry Winters 表示:“目前,对于许多这类疾病,有效的治疗方法并不多。因此,能够阻止疾病恶化,或者甚至可能逆转它,可以对很多人的人生产生巨大影响。”

为此,该公司需要分析一个庞大的、多模态的人体单细胞数据集。过去,Tune 主要进行单模态分析,例如基因表达分析。但是,对于这个项目,Tune 希望同时研究数据集中的多种模态。使用单细胞数据进行更先进的多模态分析,对于发现研究人员可能会错过的新的、可能重要的治疗靶点至关重要。Winters 表示:“使用单细胞分析,我们可以将数据分离成不同的细胞群,并查看这些群体中不同的基因表达和基因组确认。然后,我们不仅可以发现肝脏作为一个整体,还可以发现肝脏内特定细胞类型的独特特征和潜在靶点。”

由于涉及的数据量巨大(大约 50 TB 的原始数据),处理时间将会很长。Winters 表示:“这是我们接触过的最大的单细胞多模态数据集。”在处理过程中,由于会创建临时数据,数据总大小将增加到 0.5–0.75 PB。过去,对于这类数据集,Tune 选择与第三方云供应商合作。然而,该供应商的云端缺乏处理这种规模数据集所需的可扩展性和弹性。由于该限制,Tune 无法运行其偏好的单细胞数据处理软件 Cell Ranger。

接下来,Tune 尝试在单个实例上运行该解决方案。Winters 表示:“我们找到了我们能获得的最大机器,确实可以运行,但速度不够快。”该公司估计处理这些数据最多需要 12 周,这是不可接受的。Tune 生物信息学高级总监 Jason Dean 表示:“这一时间线不符合我们的里程碑要求,也不符合我们分析数据所需的速度。”

解决方案 | 将处理时间从长达 12 周缩短至 2–3 周

为了更快地处理数据和加速研究,该公司判断需要一个 HPC 解决方案。但是,Tune 对新解决方案有明确的标准,例如,与 Cell Ranger 无缝协同运行,并配置有一个 Slurm 集群,以便该公司可以并行运行其软件。Slurm 是一个可扩展的集群管理和作业调度系统,可以智能地平衡工作负载,使用它将有助于 Cell Ranger 高效地连接 HPC 环境。

在研究了不同选项后,Tune 选择 AWS 作为其解决方案的云提供商,并选择了 AWS PCS,因为它满足所有选择标准,包括动态可扩展性、弹性和易用性。该托管服务可以简化 Slurm 集群操作并为许多应用程序提供支持,包括 Cell Ranger。Winters 表示:“我们正在寻找能够以最低工程开销帮助我们运行 Slurm 集群的解决方案。”“我们之前曾使用过 AWS 上的 HPC 服务,而且 AWS PCS 的托管性质很有吸引力。完全不需要管理。它是开箱即用的。”

使用 AWS PCS 来支持 Cell Ranger,该公司能够将其数据处理速度提高 4 到 6 倍,从使用单个实例时估计的 12 周缩短至 2–3 周,其中包括开发人员时间。Winters 表示:“这使得快速获取读数成为可能。”“使用 AWS PCS,我们可以更快地做出决策,这对生物技术公司至关重要。”

Tune 现在可以更快地发现新靶点,加速其分析工作流程。Dean 表示:“在生物技术领域使用人工智能或机器学习的瓶颈之一在于数据处理。”“数据工程环节通常是生物技术的整个人工智能生命周期中最困难的部分之一。新解决方案填补了该过程中的一个巨大缺口。”

成果 | 加速研究以帮助改变人生

Tune 期待在未来的研究中使用 AWS PCS,以利用 AWS PCS 的独特功能,使用该托管服务来加快公司的产品开发和上市速度。Winters 表示:“每当我们有了这些开创性的单细胞数据集或者需要加快 Cell Ranger 的运行速度时,我就会再次使用 AWS PCS。”

通过使用 AWS PCS,该公司在目标时间范围内完成了数据处理。这解放了 Tune 的科学家,使他们有时间开发新的、可能改变人生的肝脏相关疾病治疗方法。重要的是,该公司已经创建了一个框架,其生物机器学习模型可以将该框架用于其他应用,以在创纪录的时间内找到新靶点。

Winters 表示:“在短短几周内得到答案,而不是几个月,最终会对患者的人生产生巨大影响。”

Missing alt text value
使用 AWS PCS,我们可以更快地做出决策,这对生物技术公司至关重要。

Harry Winters

Tune Therapeutics 高级软件工程师

找到今天要查找的内容了吗?

请提供您的意见,以便我们改进网页内容的质量