客戶案例/生命科學

2022 年
Vertex 標誌

Vertex Pharmaceuticals 使用 AWS 將 Cryo-EM 資料儲存和處理的成本降低 50%

了解 Vertex Pharmaceuticals 如何透過在 AWS 上執行其 Cryo-EM 工作流程來加速藥物開發。

2 倍

效能提升

>50%

成本降低

數天

資料處理時間改善

3 個月

完成新架構的原型

強化

可擴展性並提高生產力

概觀

Vertex Pharmaceuticals (Vertex) 是一家全球性的生物技術公司,致力於科學創新,為重病患者創造革命性藥物。Vertex 使用低溫電子顯微鏡 (Cryo-EM) 技術來產生精密的影像和對蛋白質的 3D 結構以及潛在藥物靶標結構的深入見解。經由該流程,公司的化學家可以透過將藥物分子結構最佳化以與其目標黏結,從而設計出更好的藥物分子。
 
不過,Cryo-EM 工作流程需要數量龐大的運算和儲存資源。在多個研究地點進行分析的科學家會產生 PB 級的資料量。Vertex 需要使其基礎架構可擴展以支援其不斷成長的需求,同時提供足夠的處理能力來加速研究。
 
Vertex 將其資料儲存和處理遷移到 Amazon Web Services (AWS)。該公司使用過多種 AWS 服務,包括 Amazon Elastic Compute Cloud (Amazon EC2),該服務提供安全且可調整大小的運算容量,幾乎可支援任何工作負載。Vertex 提高了高效能運算 (HPC) 工作負載的效能,加速了資料分析,並使其系統具備可擴展性,同時將整體儲存和運算成本降低 50% 以上。
Scientist Working on Computer In  Modern LaboratoryNOTE TO INSPECTOR: all graps, dna models, charts are made by me

機會 | 加速 Cryo-EM 工作流程的處理效能,以更快速地產生深入見解 

Vertex 使用 Cryo-EM 以透過分析潛在藥物靶標的分子結構來探索疾病的治療方法。Vertex Pharmaceuticals 的首席研究科學家 David Posson 表示:「Cryo-EM 協助我們獲得足夠的解決方案,以深入了解蛋白質結構,幾年前我們還無法對此進行研究。
 
然而,儘管這項先進技術已開啟新發現和治療的可能性,但儲存和運算容量的需求也有所增加。Vertex Pharmaceuticals 的軟體工程資深總監 Roberto Iturralde 表示:「執行 Cryo-EM 顯微鏡每天都會產生 TB 級的資料量。「一年內產生 1 PB 的資料量很常見。」 此外,科學家需要快速的深入見解。Vertex 用於執行其 Cryo-EM 工作負載的內部部署基礎架構正努力跟上其快速成長的運算和儲存需求。
 
Vertex 最初必須使用硬碟將所有資料從外部設施的顯微鏡轉移到其資料中心,這會花費數週的時間。當新資料匯入時,公司的內部部署 HPC 叢集無法有效地處理活動中的突發情況。它們也無法在低活動期間縮減規模。
 
長期儲存資料帶來了另一個挑戰。幾週後,科學家即很少存取較舊的顯微鏡資料。但是,Vertex 的內部部署環境並未經過最佳化,無法根據使用方式和存取模式來節省成本。隨著領域快速發展,若要持續進行硬體、軟體、網路和安全性升級以符合管理內部部署的 Cryo-EM 基礎架構所需,成本變得越來越高昂。在 2022 年初,Vertex 意識到它需要更有彈性並具備更優異效能的解決方案。
 
自 2015 年以來,Vertex 即一直使用 AWS 來處理不同的工作負載。受 AWS re:Invent 2021 大會的啟發,Vertex 將其整個 Cryo-EM 工作負載重新設計並遷移到 AWS。該公司僅在短短 3 個月內就建立了新架構的原型。Iturralde 表示:「AWS 擁有我們想要在 Vertex 使用的最廣泛且最深入的雲端原生技術組合。「使用 AWS,我們可以迅速切換到新的設計,更能滿足科學家不斷變化的需求。
kr_quotemark

透過使用 AWS,我們得以將更多時間專注於如何創新。我們可以發揮創造力,並利用雲端來加速發展我們的科學。」

Roberto Iturralde
Vertex Pharmaceuticals 軟體工程資深總監

解決方案 | 使用 AWS ParallelCluster 降低資料儲存成本並加速處理 

透過遷移至 AWS,Vertex 將其工作負載遷移到 Amazon Simple Storage Service (Amazon S3) 中更靠近資料到達的位置,這是一種物件儲存服務,可提供業界領先的可擴展性、資料可用性、安全性和效能。Vertex 也使用 Amazon FSx for Lustre,這是一個全受管的共用儲存空間,建置於全球最受歡迎的高效能檔案系統之一,為科學家提供主動分析期間所需的準確儲存資源量。

處理完畢後,Vertex 會將資料傳送回 Amazon S3。該公司使用 Amazon S3 生命週期政策 (定義 Amazon S3 套用至一組物件之動作的規則集) 有效率地將資料進行排序。「使用 Amazon S3 生命週期政策,我們可以將資料放入不同的層級,以降低儲存成本」,Iurralde 表示。該公司還能順暢無礙地擴展其儲存空間,從而限制資料中心的開銷。

為了管理資料處理的運算,Vertex 使用 AWS ParallelCluster,這是一種開放原始碼叢集管理工具,可讓您易於在 AWS 上部署和管理彈性 HPC 叢集。它會根據分析軟體的需求擴展和縮減 HPC 節點。「當上述作業完成時,我們幾乎不用花一毛錢」,Iturralde 表示,「我們不必擔心科學的發展速度將耗盡我們的資源,或迫使我們需要分心維護基礎設施。」

透過讓運算成本與工作負載需求相符,Vertex 已將成本降低了 50%。此外,它所實現的效能比以前的架構要好兩倍。而且,Vertex 已經消除了 Cryo-EM 團隊在與其他群組共享資源時在內部部署環境中所面臨的瓶頸,這種情況以前經常會發生。Posson 表示:「以前,即使沒有其他人使用資源,分析 Cryo-EM 資料也需要幾週的時間。現在,我們有把握不到 1 週就能使用 AWS 交付資料。」

Vertex 使用 Amazon Cognito 新增了原生單一登入支援,企業可以使用這些功能快速輕鬆地為 Web 和行動應用程式新增註冊、登入和存取控制。「使用 Amazon Cognito 讓我們備感安心,因為只有具備權限的員工才能存取該軟體」,Iurralde 表示。除此之外,Vertex 還使用 Application Load Balancer (負載會透過針對現代應用程式交付的進階要求路由來平衡 HTTP 和 HTTPS 流量),以保護其網路功能安全。

在 AWS 上,Vertex 使其流程有效率、可擴展且符合成本效益,同時減少手動維護。在 AWS 上建置也使該公司可存取最新的運算和 GPU 資源,免去採購資料中心硬體相關的數個月冗長前置期。例如,Vertex 正在執行 Amazon EC2 G5 執行個體,這些執行個體可提供 CPU、主機記憶體和 GPU 容量的強大組合。透過在雲端中執行 Cryo-EM 流程,科學家可以進行近乎即時的分析。Vertex 更有效地使用昂貴的顯微鏡時間,並推動科學突破。

成果 | 使用 Amazon EC2 加速資料處理以加快研究速度 

Vertex 已經縮短了交付分析結果所需的時間,並期盼進一步加速分析結果。Posson 表示:「透過即時處理功能,我們可以從顯微鏡下取得資料後立即開始分析。「我們也許能將 1 週的時間縮短至一半。」
 
Vertex 還計劃繼續使其 HPC 基礎架構更具彈性,並使雲端原生,以節省成本。Iurralde 表示:「透過使用 AWS,我們得以將更多時間專注於如何創新。」「我們可以發揮創造力,並利用雲端來加速發展我們的科學。」

關於 Vertex Pharmaceuticals

Vertex 是一家總部位於波士頓的製藥公司,致力於研究複雜分子,並使用世界各地最新的顯微鏡技術研究重病的治療方法。

使用的 AWS 服務

Amazon S3

Amazon Simple Storage Service (Amazon S3) 是一種物件儲存服務,提供領先業界的可擴展性、資料可用性、安全性及效能。

進一步了解 »

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) 提供安全且可調整大小的運算容量,可支援幾乎所有工作負載。

進一步了解 »

AWS ParallelCluster

AWS ParallelCluster 是一種開放原始碼叢集管理工具,可讓您在 AWS 上輕鬆部署和管理高效能運算 (HPC) 叢集。

進一步了解 »

Amazon FSx for Lustre

Amazon FSx for Lustre 備有全受管的共用儲存空間,可善用最受歡迎的 Lustre 檔案系統的可擴展性和效能。

進一步了解 »

開始使用

各行各業各種規模的組織每天都在使用 AWS 來變革其業務和履行其使命。聯絡我們的專家,立即開始您的專屬 AWS 雲端之旅。