Peter Tonellato 박사가 이끄는 하버드 의과 대학 생의학 정보 센터의 LPM(Laboratory for Personalized Medicine)에서는 높은 처리량의 시퀀싱, 생의학 데이터 수집 기술 및 Amazon Web Services(AWS)의 유연성을 활용하여 기록적으로 짧은 시간 내에 혁신적인 전장 유전체 분석 테스팅 모델을 개발했습니다. Tonellato는 "생의학 컴퓨팅에 대한 우리의 접근 방식과 AWS의 조합으로 우리는 기술에 시간과 노력을 쏟는 대신 시뮬레이션 개발에 집중하여 신속히 결과물을 얻을 수 있었습니다."라고 말하며 "AWS의 장점이 없었다면 여기까지 오지 못했을 겁니다."라고 덧붙였습니다.

Tonellato의 연구실에서는 새로운 유전자 검사의 임상 값을 평가하는 모델과 시뮬레이션을 만들어 개인의 유전적 특성에 따라 병을 예방할 수 있는 맞춤형 의료를 집중적으로 연구하고 있습니다.

그 밖의 프로젝트에는 임상 시험 시뮬레이션 및 예측을 지원하기 위한 대규모 환자 모집단 시뮬레이션이 포함됩니다. LPM에서는 모델링에 필요한 실제 환자 데이터를 충분히 수집하기가 어렵다는 문제점을 해결하기 위해 "가상" 환자라 할 수 있는 환자의 아바타를 만듭니다. 이 연구실은 병원에 있는 환자의 특성을 기반으로 다양한 유전자 검사를 위한 다양한 아바타 세트를 만든 다음 엄청난 수로 복제할 수 있습니다. Tonellato에는 최대 1억 개의 아바타를 동시에 조작할 수 있는 효율적인 방법이 필요했습니다. 그는 "엄청난 양의 데이터를 처리할 수 있을 뿐만 아니라 컴퓨팅 기술 문제 해결에 시간을 소모하지 않고 박사 후 과정 연구원들이 유전적 위험 상황을 살펴보고 아바타 생성에 적절한 시뮬레이션과 분석을 결정한 다음 시뮬레이션을 실행하기 위한 웹 애플리케이션을 신속하게 구축하는 시스템을 고안하고 싶었습니다."라고 말했습니다.

2006년, Tonellato는 복잡하고 매우 가변적인 컴퓨팅 요구를 해결하기 위해 클라우드 컴퓨팅으로 전환했습니다. "몇 가지 대안을 평가해 봤지만 Amazon Web Services보다 유연하고 강력한 서비스는 없었습니다."라고 그는 말합니다. 과거 데이터 센터를 구축했던 경험을 통해 서버 설정과 코드 작성에 시간이 얼마나 필요한지 알고 있었던 Tollellato는 도저히 그만한 시간을 낼 수 없었습니다. 그 대신 자신의 팀에서 연구원의 웹 애플리케이션에 최적인 개발 환경이 반영된 사용자 지정 Amazon 머신 이미지(AMI) 모음을 얼마나 빨리 만들 수 있는지 테스트하기로 결정했습니다.

현재 Tonellato의 연구실에서는 스팟 인스턴스를 워크플로에 통합하는 작업을 확대했고, 이로 인해 보조금을 더욱 절약할 수 있었습니다. Tonellato는 "Amazon Elastic Compute Cloud(Amazon EC2) 클러스터를 실행할 때 스팟 인스턴스를 활용해 전체 게놈을 분석합니다. 스팟 인스턴스를 사용하면 저렴한 비용으로 훨씬 더 많은 작업자 노드를 실행할 수 있어 시간과 비용을 크게 절감할 수 있습니다. 이런 절감을 활용한 결과 엔지니어링에는 겨우 하루가 소요되었고 대략 50%의 비용을 절감할 수 있었습니다."라고 말했습니다. Tonellato의 연구실에서는 스팟 인스턴스에서 Oracle Grid Engine Cluster를 관리하는 기능이 탑재된 MIT의 StarCluster 도구를 사용하고 있습니다. Tonellato 연구실의 프로그래머 Eric Gafni는 StarCluster를 워크플로에 통합하는 작업을 수행했습니다. Gafni에 따르면 "StarCluster를 사용했더니 실행 중인 스팟 클러스터를 10분 안에 구성하고 시작해 사용이 가능할 정도로 엄청나게 쉬웠습니다."

뿐만 아니라 LPM은 연구 환경에서 클라우드 컴퓨팅을 효율적으로 사용하는 방법에 대한 공개 리소스가 필요하다고 판단했으며, 이 요구를 해결하기 위해 PLoS Computational Biology에 이와 관련된 기본 지침을 발표했습니다. LPM의 주요 저자이자 선임 연구원인 Vincent Fusaro는 "우리는 연구실에서 컴퓨팅 요구 관리에 AWS를 효율적으로 활용하는 방법을 이 논문에서 명확히 제시하고 있다고 생각합니다. AWS 비용과 컴퓨팅 리소스 측면에서 컴퓨팅 문제를 바라보는 방법 또한 설명되어 있습니다."라고 말합니다.

Tonellato는 "AWS 솔루션은 안정적이고 강력하며 비용도 저렴합니다."라고 말하면서 "추천할 만한 장점은 모두 갖추고 있습니다."라고 덧붙였습니다.

Tonellato가 시뮬레이션을 실행하는 Amazon EC2는 고객에게 클라우드에서 확장 가능한 컴퓨팅 파워를 제공합니다. 개발자의 웹 규모 컴퓨팅을 보다 쉽게 만들어 주도록 설계된 Amazon EC2는 몇 분 이내에 클라우드에서 컴퓨팅 파워를 생성하고 프로비저닝할 수 있습니다.

Tonellato의 연구실은 AWS 솔루션에 대한 만족감을 감추지 않습니다. Tonellato는 "의사와 병원이 할 수 있는 유전자 검사는 계속 증가하는 추세입니다. 하지만 비용이 아주 많이 들 수 있죠. 우리는 어떤 검사가 환자의 치료에 가장 도움이 되고 좋은 결과를 내는지 알아내는 데 관심을 가지고 있습니다."라고 밝혔습니다. 또한 "우리 모델을 통해 FDA 승인과 임상 사용을 적극 추진할 만한 검사, 프로토콜, 시험을 파악하는 데 일반적으로 소요되는 시간을 크게 줄일 수 있을 것으로 기대합니다."라고 덧붙였습니다.

AWS가 빅 데이터 요구에 어떤 도움을 줄 수 있는지 자세히 알아보려면 빅 데이터 세부 정보 페이지()를 방문하십시오.

클라우드의 유전체학에 대해 자세히 알아보려면 AWS 유전체학 세부 정보 페이지를 방문하십시오.