常見問答集

問:使用 AWS Glue 和 Amazon Athena 解決方案的基因體第三級分析和資料湖有什麼作用?

答︰該解決方案可在 AWS 中建立可擴展的環境,以為大規模分析準備基因體資料,並針對基因體資料湖執行互動式查詢。該解決方案示範了如何建置、封裝和部署用於基因體資料轉換的庫;如何佈建用於基因體資料準備和分類的資料擷取管道;以及如何針對基因體資料湖執行互動式查詢。

問:是否可以修改解決方案,以便與我自己的基因體資料、查詢和筆記本搭配使用?

答:是,您可以修改解決方案以滿足您的特定需求,例如,透過新增 AWS Glue 任務和爬取程式來擷取、準備和分類資料;以及使用新的 Jupyter 筆記本和 Amazon Athena 查詢來執行資料分析。CI/CD 管道將追蹤每個變更,以促進變更控制管理、復原和稽核。

問:資料準備使用哪些生物資訊學工具?

答:該解決方案示範了如何使用第三方生物資訊學工具,來準備要擷取至基因體資料湖中的資料。提供的範例使用 Broad Institute 的 Hail,將 Variant Call File (VCF) 格式的基因體變體資料讀取至 Spark 資料框架以進行處理。該解決方案還示範了如何使用 AWS CodeBuild,從來源程式碼建置第三方工具 (例如 Hail),並將其部署至 Amazon S3 儲存貯體以用於 AWS Glue 任務。

問:解決方案中使用哪些生物資訊學資料集?

答:該解決方案將 ClinVar 資料集、1000 Genomes 資料集的一部分,以及個別 1000 Genomes VCF 部署至解決方案資料湖儲存貯體中。這些資料集用於示範如何使用 AWS Glue 和 Amazon Athena 擷取、準備和分析基因體資料。最後提供了 Jupyter 筆記本,其示範了如何從 Jupyter 筆記本中建立藥物反應報告。

問:是否可以在任何 AWS 區域中部署解決方案?

答:否,該解決方案使用 AWS CodePipeline 服務,目前僅在特定 AWS 區域中可用。因此,您必須在提供此服務的 AWS 區域中啟動該解決方案。關於最新的區域可用性,請參閱依區域提供的 AWS 服務方案

培訓與認證

AWS Training and Certification 透過實用的雲端技能讓您提升能力、信心和可信度,助您實現創新並構建自己的未來。  進一步了解 »

AWS CodeCommit 簡介

本課程將向您介紹 AWS CodeCommit,這是一種全受管來源程式碼控制服務,可讓您輕鬆地託管安全和可高度擴展的私有 Git 儲存庫。在整個課程中,您將進一步了解該服務的功能和優勢,以及如何最好地使用 CodeCommit 滿足您自己的開發需求。我們還將示範如何建立新的儲存庫。

立即報名 »

AWS CodeBuild 簡介

在本入門課程中,我們討論了什麼是 AWS CodeBuild 及其工作方式,並回顧一些常見的使用案例和最佳實務。

立即報名 »

AWS Certified Solutions Architect – Associate

這個考試可驗證您是否能夠有效展現採用 AWS 技術架構和部署安全和穩固應用程式的知識。

安排您的考試 »

合作夥伴資源

AWS 合作夥伴網路 (APN) 專注在協助合作夥伴建立成功的 AWS 業務,為客戶提供最優質的解決方案和客戶體驗。APN 合作夥伴重視客戶的成功,可協助您充分利用 AWS 具備的所有商業優點。APN 合作夥伴憑藉他們在 AWS 方面的高度專業知識而具有獨特的優勢,可以在您公司採用雲端過程的任何階段提供協助,並協助解決一些最複雜的問題。

請瀏覽以下頁面,進一步了解我們用於建置此 AWS 解決方案的服務。

需要更多資源以開始使用 AWS?

請瀏覽入門資源中心,尋找開始使用 AWS 的教學課程、專案及影片。

進一步了解 »