AstraZeneca 的基因體學資料處理解決方案在 AWS 上 1 天內執行 510 億次測試

2021

在第一個人類基因體發表大約 20 年後,基因體學正從一項研究密集型實作轉變為個人化醫療的驅動者。參與這一轉變的全球生物製藥公司 AstraZeneca 正加速基因體學在精準醫療中的應用,並推動基因體學的轉化以改變藥物探索。

AstraZeneca 使用數 PB 的基因體定序資料為藥物研究和發展提供資訊。為了快速處理大規模資料,AstraZeneca 使用 Amazon Web Services (AWS) 建置了一個快速、有效率的解決方案,以提取有影響力的基因體學見解。

AWS 上的 AstraZeneca 基因體學:從數 PB 的資料到新藥的旅程 (1:19)
kr_quotemark

我們使用這些能力為 AstraZeneca 2020 年的 40 多個藥物探索專案提供了遺傳學輸入。」

Slavé Petrovski
AstraZeneca 基因體學研究研發中心的基因體分析和資訊學負責人、副總裁

建置一個讓科學家能夠自由創新的解決方案

除了從基因體資料中快速收集見解外,AstraZeneca 還希望將資源重新分配給科學探索,並避免將生物資訊學時間花費在執行相對低價值的資料管理活動上。由於該公司透過多個來源大量收集數 PB 的資料,因此需要強大、可擴展的運算能力。

AstraZeneca 之前在 AWS 上進行了建置,因此決定擴大其對 AWS 工具的使用範圍,來開發以雲端為基礎的生物資訊學解決方案,用於快速基因體處理和分析。

在 AWS 上自動化以產出快速見解

AstraZeneca 的高輸送量解決方案執行基因體資料處理和分析的許多步驟。基因體二次分析著眼於原始定序讀數以重建基因體,並識別可在後期進一步分析的基因體變異。為了自動化這些步驟的資料協同運作,該架構使用 AWS Lambda,這是一種無伺服器運算服務,使用者無需預置或管理伺服器即可執行程式碼。為了建置任務執行層,該架構使用 AWS Batch,其會根據提交的批次任務所需的容量和特定資源需求,動態佈建優化的運算資源數量和類型 (如 CPU 或記憶體優化執行個體)。在此過程中,該架構使用目標儲存服務 Amazon Simple Storage Service (Amazon S3),將資料分類到儲存貯體中。

在 AWS 上,AstraZeneca 透過規模、運算能力和對豐富技術服務的存取加快並改善了生產力。因為該公司可以在需要時執行大規模分析,所以資料可以更快地用於分析。AstraZeneca 基因體學研究中心的基因體分析和資訊學負責人、副總裁 Slavé Petrovski 表示:「我們現在可以在 24 小時內執行超過 510 億次統計測試,研究單個突變或單個基因的影響,每個突變或基因都有廣泛的表現型。」該公司的努力正在取得成效。Petrovski 表示:「我們使用這些能力為 AstraZeneca 2020 年的 40 多個藥物探索專案提供了遺傳學輸入。」

促進科學創新

AstraZeneca 生產了一條快速、高效的基因體學生物資訊學管道,為其科學家提供了追求創新的時間和資源。因此,該公司的基因體學研究中心正朝 2026 年分析兩百萬個基因體的目標邁進。


關於 AstraZeneca

AstraZeneca 是一家全球性生物製藥公司,在一系列治療領域開發創新藥物。基因體學研究中心是 AstraZeneca 的一項計劃,企圖到 2026 年可以分析兩百萬個基因體。

AWS 的優勢

  • 支援在 24 小時內執行超過 510 億次統計測試
  • 在 2020 年協助向 40 多個藥物探索專案提供基因體見解
  • 縱向擴展或縮小規模以適應基因體定序的無規律需求
  • 為科學探索釋放資源

使用的 AWS 服務

AWS Lambda

AWS Lambda 是一種無伺服器的運算服務,可讓您執行程式但不必佈建或管理伺服器、建立工作負載感知叢集擴展邏輯、維護事件整合或管理執行階段。

進一步了解 »

AWS Batch

AWS Batch 可讓開發人員、科學家和工程師在 AWS 上輕鬆且有效率地執行數十萬批次運算任務。

進一步了解 »

Amazon S3

Amazon Simple Storage Service (Amazon S3) 物件儲存服務提供領先業界的可擴展性、資料可用性、安全性及效能。

進一步了解 »


入門

各行各業、各種規模的公司每天都在使用 AWS 來轉型業務。聯絡我們的專家,立即開始使用 AWS 雲端服務。