genomics-england-logo

Genomics England 在 AWS 上開發基因體和健康資訊平台,將科學轉化為醫療保健

2021 年

癌症是全球死亡的主要原因,每年有近 1,000 萬人死亡。罕見疾病影響著全球 4 億多人,其中 95% 的人沒有接受經核准的治療方法。在絕大多數情況下,癌症和罕見疾病都是基因體疾病,由單基因或多基因變異引起。世界各地的組織都將基因體作為診斷和治療患者的關鍵。

雖然每個人都有獨特的基因體密碼,但研究人員需要來自疾病患病和健康患者的強大資料同類群組,以確定基因體致病區域的相似性和差異。在全球各個角落,治理機構、研究組織和公司已經建立全民基因體專案,旨在增加對疾病起源的了解,確定新的治療方法,並將基因體從研究實務推向醫療保健環境。

Genomics England (GEL) 於 2013 年 7 月正式成立,這是國家衛生服務 (NHS) 65 歲生日慶祝活動的一部分。GEL 由衛生和社會保健部全資擁有,負責對來自 NHS 罕見疾病患者及其家屬,以及常見癌症患者的 100,000 個全基因體進行測序。在 2018 年試點專案成功完成後,NHS 宣佈將與 GEL 和英國生物銀行合作,在 5 年內對多達 500 萬個基因體進行測序,並提供相關資料進行研究。

為了讓基因體醫療保健成為現實,GEL 正在從專案過渡到平台,使用 Amazon Web Services (AWS) 工具為研究人員提供對這些大量資料集進行可靠、全面且符合隱私權的存取。透過安全的協作和分析,此計劃將為診斷提供資訊,推動藥物開發,並開啟精準醫學的未來。

工作中的基因體研究人員
kr_quotemark

「隨著我們繼續推進工作並產生更強大的資料集,對彈性儲存和運算服務的存取將使我們的組織和研究界能夠安全且經濟高效地存取和分析資料。透過在 AWS 上託管,我們可以使資料存取民主化。」

Pete Sinden
Genomics England 資訊長

為日益增長的基因體資料集實現可擴展性

僅透過 100,000 基因體計劃,GEL 就積累了 50 PB 的資料,大約是整個國會圖書館大小的三倍。為了讓研究界能夠存取資料,GEL 正在將其資料遷移至 AWS 以實現民主化存取。

「我們深知,將 100,000 個基因體專案產生的資料交到研究界手中,將在加速科學突破方面發揮至關重要的作用,我們正在竭力將我們的資料遷移至 AWS 以實現這一目標,」GEL 資訊長 Peter Sinden 說道。

為了更全面地了解患者基因體,該組織將把「長讀」基因體格式與目前的「短讀」格式相結合。長讀基因體包含的資料大約是短讀的五倍,這將為研究人員提供有關其研究的基因體每個部分的詳細資訊,可能會發現以前可能未被注意到的細微差別。

「隨著我們繼續推進工作並產生更強大的資料集,對彈性儲存和運算服務的存取將使我們的組織和研究界能夠安全且經濟高效地存取和分析資料。」Sinden 補充道。「透過在 AWS 上託管,我們可以使資料存取民主化。研究人員只需一小筆預算即可資助運算成本和運算存取。」

透過技術將科學轉化為醫療保健

GEL 的使命是建立可擴展且持久的資料基礎設施,可以隨著科學和技術的進步而演進。安全、合規和民主化存取是研究平台不可或缺的一部分,GEL 選擇 AWS 合作夥伴 Lifebit 在 AWS 上開發該平台。他們與 AWS 一起建立了受信任的研究環境 (TRE),讓研究人員能夠協作工作,並使用進階雲端運算工具從基因體資料中收集洞察。

「我們的目標是讓生態系統能夠提供資料驅動型醫療保健和進行基因體研究,而 AWS 讓我們能夠安全地實現這一使命,」Sinden 說道。「透過使用最新的 GPU 和其他服務,我們可以推動技術發展並加速基因體在醫療保健領域的運用。」

GEL 與 AWS 專業服務 和 AWS 合作夥伴 Kainos 合作,作為 Migration Acceleration Program (MAP)的一部分。 透過將 PB 級基因體資料和內部部署研究環境遷移至 AWS,GEL 可協助加速實現科學成果。在雲端使用分析和工具還可以讓資料更加安全。存放在 Amazon Simple Storage Service (Amazon S3) 中的基因體資料提供 99.999999999% 的耐久性。

對於基因體分析和相關運算需求,GEL 正在使用 Amazon Elastic Compute Cloud (Amazon EC2),在雲端中釋放可靠、可調整大小的運算容量。這可讓研究人員和資料科學家隨需調整其運算容量,這會更具成本效益。Sinden 還指出,依用量計費模式非常適合學術和政府資助的研究,因為它可以靈活地適應撥款資金的波動。GEL 在其合作夥伴的協助下在 AWS 上建置,最佳化其高效能運算架構的成本和速度,讓研究人員能夠在 23 秒內執行之前需要 25 小時的常見任務。

在 AWS 上建置雲端基因體的未來

雖然許多大數據問題涉及管理大量小型檔案,但基因體分析通常涉及相對較少數量的超大型檔案。因此,雲端基因體需要獨特的資料分佈模型。GEL 正在與 AWS 合作,利用壓縮技術和其他進階工具,根據該領域的特定需求最佳化基因體資料的雲端儲存和分析。這間產業領先的企業將在未來幾年為高效、研究友好型基因體資料管理鋪平道路。

進一步了解

了解 AWS 如何支援雲端基因體,來解鎖全球生命科學研究中的發現。


關於 Genomics England

Genomics England (GEL) 的成立宗旨是在英國開展 100,000 基因體計劃,目前正致力於推動基因體研究在人類健康方面的運用。GEL 歸英國衛生和社會保健部擁有。

AWS 的優勢

  • 研究人員執行常見任務的時間減少了 99%
  • 確保數十萬基因體資料樣本的安全性和耐久性
  • 最佳化資料管理平台,滿足基因體資料集的獨特需求
  • 民主化基因體研究存取

使用的 AWS 服務

AWS 專業服務

AWS 專業服務組織是一個由專家組成的全球團隊,可協助您使用 AWS 雲端實現所需的業務成果。

進一步了解 »

Amazon S3

Amazon Simple Storage Service (Amazon S3) 物件儲存服務提供領先業界的可擴展性、資料可用性、安全性及效能。

進一步了解 »

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) 是一種 Web 服務,可在雲端提供安全、可調整大小的運算容量。該服務旨在降低開發人員進行 Web 規模雲端運算的難度。

進一步了解 »

MAP

AWS Migration Acceleration Program (MAP) 是一項全方位且久經驗證的雲端遷移計劃,借鑑了 AWS 成千上萬企業客戶遷移至雲端的經驗。企業遷移可能既複雜又耗時,但 MAP 可以透過成果驅動型方法協助您加速雲端遷移和現代化之旅。

進一步了解 »


開始使用

各行各業、各種規模的公司每天都在使用 AWS 來轉型業務。聯絡我們的專家,立即開始使用 AWS 雲端服務。