
AstraZeneca 的基因體學資料處理解決方案在 AWS 上 1 天內執行 510 億次測試
2021
在第一個人類基因體發表大約 20 年後,基因體學正從一項研究密集型實作轉變為個人化醫療的驅動者。參與這一轉變的全球生物製藥公司 AstraZeneca 正加速基因體學在精準醫療中的應用,並推動基因體學的轉化以改變藥物探索。
AstraZeneca 使用數 PB 的基因體定序資料為藥物研究和發展提供資訊。為了快速處理大規模資料,AstraZeneca 使用 Amazon Web Services (AWS) 建置了一個快速、有效率的解決方案,以提取有影響力的基因體學見解。

我們使用這些能力為 AstraZeneca 2020 年的 40 多個藥物探索專案提供了遺傳學輸入。」
Slavé Petrovski
AstraZeneca 基因體學研究研發中心的基因體分析和資訊學負責人、副總裁
建置一個讓科學家能夠自由創新的解決方案
除了從基因體資料中快速收集見解外,AstraZeneca 還希望將資源重新分配給科學探索,並避免將生物資訊學時間花費在執行相對低價值的資料管理活動上。由於該公司透過多個來源大量收集數 PB 的資料,因此需要強大、可擴展的運算能力。
AstraZeneca 之前在 AWS 上進行了建置,因此決定擴大其對 AWS 工具的使用範圍,來開發以雲端為基礎的生物資訊學解決方案,用於快速基因體處理和分析。
在 AWS 上自動化以產出快速見解
AstraZeneca 的高輸送量解決方案執行基因體資料處理和分析的許多步驟。基因體二次分析著眼於原始定序讀數以重建基因體,並識別可在後期進一步分析的基因體變異。為了自動化這些步驟的資料協同運作,該架構使用 AWS Lambda,這是一種無伺服器運算服務,使用者無需預置或管理伺服器即可執行程式碼。為了建置任務執行層,該架構使用 AWS Batch,其會根據提交的批次任務所需的容量和特定資源需求,動態佈建優化的運算資源數量和類型 (如 CPU 或記憶體優化執行個體)。在此過程中,該架構使用目標儲存服務 Amazon Simple Storage Service (Amazon S3),將資料分類到儲存貯體中。
在 AWS 上,AstraZeneca 透過規模、運算能力和對豐富技術服務的存取加快並改善了生產力。因為該公司可以在需要時執行大規模分析,所以資料可以更快地用於分析。AstraZeneca 基因體學研究中心的基因體分析和資訊學負責人、副總裁 Slavé Petrovski 表示:「我們現在可以在 24 小時內執行超過 510 億次統計測試,研究單個突變或單個基因的影響,每個突變或基因都有廣泛的表現型。」該公司的努力正在取得成效。Petrovski 表示:「我們使用這些能力為 AstraZeneca 2020 年的 40 多個藥物探索專案提供了遺傳學輸入。」
促進科學創新
AstraZeneca 生產了一條快速、高效的基因體學生物資訊學管道,為其科學家提供了追求創新的時間和資源。因此,該公司的基因體學研究中心正朝 2026 年分析兩百萬個基因體的目標邁進。
關於 AstraZeneca
AstraZeneca 是一家全球性生物製藥公司,在一系列治療領域開發創新藥物。基因體學研究中心是 AstraZeneca 的一項計劃,企圖到 2026 年可以分析兩百萬個基因體。
AWS 的優勢
- 支援在 24 小時內執行超過 510 億次統計測試
- 在 2020 年協助向 40 多個藥物探索專案提供基因體見解
- 縱向擴展或縮小規模以適應基因體定序的無規律需求
- 為科學探索釋放資源
使用的 AWS 服務
AWS Lambda
AWS Lambda 是一種無伺服器的運算服務,可讓您執行程式但不必佈建或管理伺服器、建立工作負載感知叢集擴展邏輯、維護事件整合或管理執行階段。
AWS Batch
AWS Batch 可讓開發人員、科學家和工程師在 AWS 上輕鬆且有效率地執行數十萬批次運算任務。
Amazon S3
Amazon Simple Storage Service (Amazon S3) 物件儲存服務提供領先業界的可擴展性、資料可用性、安全性及效能。
入門
各行各業、各種規模的公司每天都在使用 AWS 來轉型業務。聯絡我們的專家,立即開始使用 AWS 雲端服務。