Peter Tonellato 博士在哈佛醫學院生物醫學資訊學中心的個人化醫學實驗室 (LPM) 利用 Amazon Web Services (AWS) 的高輸送量序列和生物醫學資料收集技術和彈性,以最快的速度開發創新的完整基因體分析測試模型。「我們的生物醫學運算方法與 AWS 能力結合讓我們能將時間和精力專注在模擬開發而非技術,因此可更快速地獲得結果。」Tonellato 表示。「要是沒有 AWS 提供的這些優點,我們絕對無法達到現在的成果。」

Tonellato 實驗室的研究主力放在個人化醫學,這是根據個人的基因特徵制訂預防性保健的一門學科,實驗室建立模型和模擬來評估新的基因檢測臨床價值。

其他計劃包括模擬大量病患群體,以協助臨床試驗的模擬和預測。要尋找足夠的實際病人資料量來建立模型有一定的難度,為了克服此問題,LPM 建立病人虛擬人物,是真正的「虛擬」病人。實驗室可為不同的基因檢測建立各組虛擬人物,然後根據醫院病人的特徵,複製大量的病人。Tonellato 需要尋找一個有效的方式來操作許多虛擬人物,有時候一次就會有 1 億個之多。「除了能夠處理極大量的資料以外,」他表示,「我想要設計一個系統,讓博士後研究人員可以控制基因風險情況、決定適當的模擬及分析來建立虛擬人物,然後迅速地建立 Web 應用程式執行模擬,而不是將時間花在排除運算技術的故障。」

2006 年,Tonellato 轉為使用雲端運算來解決複雜且高度變化的運算需求。他表示:「我評估好幾種替代選項,但是沒有一種像 Amazon Web Services 一樣靈活和強大。」因為先前已建立資料中心,所以 Tonellato 無法再花更多時間設定伺服器和編寫程式碼。於是他決定進行一項測試,看看他的團隊能夠多快組合一系列自訂 Amazon Machine Images (AMI),以建立適用於研究人員 Web 應用程式的優化開發環境。

現在,Tonellato 實驗室已將競價型執行個體整合到工作流程,讓他們可以更充分地利用補助金。Tonellato 表示:「我們在執行 Amazon Elastic Cloud Compute (Amazon EC2) 叢集時使用競價型執行個體來分析整個基因體。使用競價型執行個體,我們有機會以更少的成本執行更多的工作者節點,所以節省了很多的金錢和時間。為了充分利用這些省下的部分,我們只花了 1 天的時間建造,就已節省約 50% 的成本。」Tonellato 實驗室使用 MIT 的 StarCluster 工具,它有內建的功能可管理競價型執行個體上的 Oracle Grid Engine 叢集。Erik Gafni 是 Tonellato 實驗室的程式設計人員,由他操作將 StarCluster 整合到我們的工作流程。Gafni 表示:「使用 StarCluster,不到 10 分鐘的時間就能非常輕鬆地設定、啟動並開始使用執行中的競價型叢集。」

除此之外,LPM 還認知到必須在學術環境中發佈有關如何有效使用雲端運算的資源,並在 PLoS 計算生物學中發佈入門教材來解決這個需求。「我們相信這篇文章清楚說明學術實驗室如何有效地使用 AWS 來管理他們的運算需求。其中示範如何根據 AWS 成本及運算資源來考慮運算問題。」LPM 主要作者和資源研究員 Vincent Fusaro 表示。

「AWS 解決方案穩定、健全、靈活,而且成本低廉。」Tonellato 評論,「它擁有完備功能,絕對值得推薦。」

Tonellato 在 Amazon EC2 上執行模擬,為客戶在雲端中提供可擴展的運算容量。Amazon EC2 旨在讓開發人員更輕鬆地進行 Web 規模運算,只需幾分鐘即可在雲端建立和佈建運算容量。

Tonellato 實驗室對他們的 AWS 解決方案非常滿意。Tonellato 解釋說:「為醫生和醫院提供的基因檢測數量不斷增加,而且也非常昂貴,而我們在乎的是判斷哪些檢測結果能夠提供更好的病人照護並獲得最佳的成效。」他進一步說明:「我們相信此模型可大幅縮短時間,以協助我們找出值得積極取得 FDA 核准和臨床使用的檢測、標準和試驗。」

要進一步了解 AWS 如何協助您的大數據需求,請瀏覽我們的大數據詳細資訊頁面

要進一步了解雲端中的基因體資料處理,請瀏覽 AWS 基因體詳細資訊頁面