23andMe 徽标

23andMe 使用 AWS 上的 HPC 来实现药物和治疗发现方面的创新

2022 年

基因组学和生物技术公司 23andMe 提供直接面向客户的基因检测,为客户提供有关其遗传学的宝贵见解。23andMe 需要提高其高性能计算(HPC)的可扩展性和灵活性,以高效管理数 PB 的数据。该公司从 2016 年开始使用 Amazon Web Services(AWS)来存储重要数据,但在这之前一直在使用本地解决方案。2021 年,该公司全面迁移到云,这一过程仅用了 4 个月。自采用 AWS HPC 服务(包括为几乎所有工作负载提供安全且可调整大小的计算容量的 Amazon Elastic Compute Cloud(Amazon EC2)和允许开发人员、科学家和工程师在 AWS 上轻松高效地运行数十万个批处理计算任务的 AWS Batch)以来,23andMe 提高了其可扩展性和灵活性并优化了成本。

case-study-600x300
kr_quotemark

为了在规模上带给大家不同的感受,我们运行了一次峰值计算任务,同时运行的虚拟 CPU 超过 8 万个。“使用 Amazon EC2 消除了 23andMe 研究人员的资源争用。”

Arnold de Leon
23andMe高级项目经理

 

采用云实现安全数据存储

23andMe 总部位于加利福尼亚州,以其家用 DNA 采集套件而闻名。该公司还利用其遗传信息数据库来增进对生物学和疗法的理解,以开发新药物和疗法。23andMe 成立于 2006 年,已经收集了大量数据,并为其研究和治疗生成了数百万行代码。他们使用这些数据进行回归分析、全基因组关联研究和跨数据集的一般相关性研究。在过去的 16 年中,由于遗传病患病率上升,公众愈发认识到早期检测的益处,加之基因测序成本的下降,基因检测市场的势头一直在增强。
 
23andMe 最初使用本地设施,但随着其数据存储和计算需求的增长,该公司开始将目光转向云以获得更高的可扩展性和灵活性。此外,该公司还力求通过过渡到云来降低设施维护的人力运营成本,并提高其采用新硬件和技术的能力。该公司于 2016 年开始使用 Amazon Simple Storage Service(Amazon S3),这是一种提供可扩展性、数据可用性、安全性和性能的对象存储服务。23andMe 负责云支出的项目经理 Arnold de Leon 表示:“如果我们很关注某段数据,就会将其存储在 Amazon S3 中。”“这是确保数据持久性的绝佳方法。” 当访问模式发生改变时,23andMe 会使用 Amazon S3 智能分层存储类自动将数据移动到最具成本效益的访问层。
 
在开始使用云服务时,23andMe 尝试使用了混合解决方案,在其数据中心和 AWS 上同时运行工作负载。该解决方案提供了一定的可扩展性,但在本地数据中心和云之间来回迁移数据会产生相关成本。为了更好地实现成本优化,同时获得更高的灵活性和可扩展性,23andMe 决定在 2021 年完全迁移到 AWS。

优化在 AWS 上运行 HPC 的价值

23andMe 使用 AWS 迁移加速计划(AWS MAP),这是一项全面且经过验证的云迁移计划,基于 AWS 将数以千计的企业客户迁移到云中的经验开发。使用 AWS MAP,23andMe 可以在短短 4 个月内实现平稳迁移。de Leon 表示:“AWS MAP 能够帮助我们实现快速、大规模的迁移。一般情况下,迁移成本很高,但是 AWS MAP 解决了这个问题。” 23andMe 将所有内容从其数据中心迁移到 AWS 上的云中。由于团队在采用 AWS 服务时所做出的努力,迁移到 AWS 一年后,随着 AWS MAP 计划结束,23andMe 也实现了持平乃至更高的性价比。

另一项挑战是管理科学家基于文件的主目录。为了解决这个问题,23andMe 求助于了 AWS 的合作伙伴Weka。WekaIO 并行文件系统功能强大、经济高效且与 Amazon S3 兼容。这有助于 23andMe 的内部团队在不干扰客户体验的情况下实施变更。迁移完成后,23andMe 开始利用适用于 HPC 的 AWS 服务,例如 Amazon EC2 C5 实例,这些服务经济高效且具备高性能,单次计算价格比率较低,适合运行高级计算密集型工作负载。之所以选择这种类型的 Amazon EC2 实例,是因为它最接近其此前的计算资源。

23andMe 很快发现,拥有各种可用的 Amazon EC2 实例类型好处多多。23andMe 基础设施工程组经理 Justin Graham 表示:“我们有可用的 Amazon EC2 产品的完整菜单,而提高效率的一种方法就是找到最适合资源利用的方案。”自 2022 年起,该公司灵活使用多种实例类型,包括 Amazon EC2 X2i 实例,这是下一代内存优化型实例,可提高内存密集型工作负载的性能、性价比和成本。23andMe 还使用 AWS Batch 来合理调整大小并匹配资源,以确定要使用的实例类型,这有助于优化性价比。

23andMe 可以按需扩展以匹配实际工作负载的计算容量,然后缩减。de Leon 表示:“为了在规模上带给大家不同的感受,我们运行了一次峰值计算任务,同时运行的虚拟 CPU 超过 8 万个。”此外,使用 Amazon EC2 实例消除了 23andMe 研究人员的资源争用。Graham 表示:“最近,我们为期 3 周的生产工作量已经提前完成 33%。自从迁移到 AWS 以来,我们向研究人员提供计算资源的能力无与伦比。”

23andMe 既能享有在 AWS 上使用 HPC 服务带来的益处,也不必在初始支出目标上妥协。de Leon 表示:“我们的目标是在保持成本不变的前提下,获得灵活性、能力和价值。节省成本与其说是底线问题,不如说是付出与收获的问题。”23andMe 通过使用各种 AWS 服务实现了成本优化,包括 Amazon Relational Database Service(Amazon RDS),便于在云中设置、操作和扩展数据库的一系列托管服务,以及 Amazon EC2。23andMe 全面采用 AWS,旨在继续为其工作负载寻求性价比优化。

利用 AWS 的灵活性探索未来的可能性

23andMe 可以在几乎不做任何更改的情况下迁移现有环境,并逐渐开始将更多 AWS 服务整合到解决方案中。该公司正在寻找使用 AWS 进一步优化成本的方法,探索 AWS Graviton 处理器等服务,为在 Amazon EC2中运行的云工作负载提供出色的性价比。该公司正在寻找机会实现成本最优化,同时保留按需计算所需的资源。de Leon 表示:“我们的迁移已经花了约 10 个月,最终目标是加快进程,让想法得到验证。我们的研究人员速度更快、效率更高,我们希望获得重大的研究突破。” 


关于 23andMe

23andMe 是一家总部位于加利福尼亚州的基因组学和生物技术公司,为客户提供遗传信息,并众包了数十亿个数据点用于研究,从而促进了科学发现。

AWS 的优势

  • 在 4 个月内顺利迁移到云
  • 消除了研究人员之间的计算资源争用
  • 提高了可扩展性,支持同时运行 8 万多个虚拟 CPU 的计算任务
  • 提高了效率,面对为期 3 周的生产工作量,完成时间提前了 33%。
  • 优化成本

使用的 AWS 服务

Amazon EC2

Amazon Elastic Compute Cloud(Amazon EC2)提供最广泛、最深入的计算平台,拥有超过 500 个实例,可选择最新的处理器、存储、网络、操作系统和购买模型,以帮助您最好地满足工作负载的需求。

了解更多 »

Amazon S3

Amazon Simple Storage Service (Amazon S3) 是一种对象存储服务,提供行业领先的可扩展性、数据可用性、安全性和性能。

了解更多 »

Amazon MAP

AWS 迁移加速计划(MAP)是一项全面且经过验证的云迁移计划,基于 AWS 将数以千计的企业客户迁移到云中的经验开发。

了解更多 »

AWS Batch

AWS Batch 让开发人员、科学家和工程师能够轻松高效地在 AWS 上运行成千上万个批处理计算作业。

了解更多 »


开始使用

不同行业和规模的组织都在使用 AWS 进行转型,以实现其愿景。
联系我们的专家,立即踏上您的 AWS 云之旅。