O Laboratório para medicina personalizada (LPM) do Centro de informática biomédica da Escola de medicina de Harvard, comandado pelo Dr. Peter Tonellato, usou o poder das tecnologias de sequenciamento com alta taxa de transferência e coleta de dados biomédicos e a flexibilidade da Amazon Web Services (AWS) para desenvolver modelos de teste completos e inovadores para a análise de genomas em tempo recorde. “A combinação de nossa abordagem à computação biométrica e a AWS permitiram que concentrássemos nosso tempo e energia no desenvolvimento de simulação, em vez de tecnologia, para obter os resultados rapidamente”, disse Tonellato. “Sem os benefícios da AWS, certamente não estaríamos tão avançados quanto estamos.”

O laboratório de Tonellato concentra-se em medicina personalizada, ou seja, assistência médica preventiva para indivíduos com base em suas características genéticas, criando modelos e simulações para analisar o valor clínico de novos testes genéticos.

Outros projetos incluem simular grandes populações de pacientes para auxiliar nas simulações e previsões clínicas. Para superar a dificuldade de obter dados reais de pacientes suficientes para modelagem, a LPM cria pacientes personagens (que são, realmente, pacientes virtuais). O laboratório pode criar diferentes conjuntos de personagens para testes genéticos distintos e, em seguida, replicar grandes números com base nas características das populações em hospitais. Tonellato precisou encontrar uma maneira eficiente de lidar com tantos personagens, número que, algumas vezes, chegou a 100 milhões por vez. “Além de poder lidar com quantidades enormes de dados”, ele disse, “eu quis criar um sistema no qual os pesquisadores de pós-doutorado pudessem delimitar uma situação de risco genético, determinar a simulação e a análise adequadas para criar os personagens e, em seguida, desenvolver rapidamente aplicativos da web para executar as simulações, em vez de perder tempo solucionando problemas de tecnologia de computação.”

Em 2006, Tonellato voltou-se para a computação em nuvem para lidar com a completa e altamente variável necessidade computacional. “Avaliei diversas alternativas, mas não encontrei nada tão flexível e robusto quanto a Amazon Web Services”, ele disse. Como já havia montado datacenters anteriormente, Tonellato não podia arcar com o tempo necessário para a montagem dos servidores e, só então, gravar o código. Em vez disso, ele decidiu realizar um teste para verificar qual a rapidez da sua equipe para montar uma série de imagens de máquina da Amazon (AMIs) personalizadas, que refletiriam o ambiente de desenvolvimento ideal para os aplicativos da web dos pesquisadores.

Agora, o laboratório de Tonellato ampliou seus esforços para integrar instâncias spot em seus fluxos de trabalho, para que pudessem otimizar ainda mais o uso dos recursos de doações. De acordo com Tonellato, "Utilizamos instâncias spot executando clusters do Amazon Elastic Compute Cloud (Amazon EC2) para analisar genomas inteiros. Temos potencial para executar ainda mais nós de operador a um custo menor usando instâncias spot, o que é uma grande economia em tempo e dinheiro. Para aproveitar essas economias, foi necessário apenas um dia de engenharia, e pudemos observar aproximadamente 50% de economia no custo.” O laboratório de Tonellato usa as ferramentas StarCluster do MIT, que possuem recursos integrados para gerenciar um Oracle Grid Engine Cluster em instâncias spot. Erik Gafni, um programador no laboratório de Tonellato, realizou a integração do StarCluster em nosso fluxo de trabalho. De acordo com Gafni, “Usando o StarCluster, foi incrivelmente fácil configurar, lançar e começar a usar um cluster de spot em execução em menos de 10 minutos.”

Além disso, o LPM reconheceu a necessidade por recursos publicados sobre como usar de maneira eficaz a computação em nuvem em um ambiente acadêmico, e publicou um livro de instruções sobre Biologia computacional PLoS para lidar com essa necessidade. “Acreditamos que esse artigo mostra de maneira clara como um laboratório acadêmico pode usar a AWS de maneira eficiente para gerenciar suas necessidades de computação. Além disso, ele também demonstra como pensar sobre problemas computacionais com relação aos custos da AWS e os recursos computacionais”, disse Vincent Fusaro, autor e pesquisador sênior no LPM.

“A solução AWS é estável, robusta, flexível e de baixo custo”, comentou Tonellato. “Ela tem todos os quesitos necessários para ser recomendada.”

Tonellato executa suas simulações no Amazon EC2, que fornece aos clientes capacidade computacional escalável na nuvem. Projetado para facilitar a computação na escala da web para desenvolvedores, o Amazon EC2 possibilita a criação e o fornecimento de capacidade computacional na nuvem em minutos.

O laboratório de Tonellato está extremamente animado com sua solução AWS. “O número de testes genéticos disponíveis para médicos e hospitais está cada vez maior”, explicou Tonellato, “e pode ser extremamente caro. Estamos interessados em determinar quais testes resultarão em melhor cuidado de pacientes e melhores resultados.” Ele incluiu: “Nós acreditamos que nossos modelos reduziram muito o tempo necessário para identificar os testes, protocolos e as avaliações que devem ser realizados para obter a aprovação da FDA e o uso clínico.”

Para saber mais sobre como a AWS pode atender a necessidades relacionadas a big data, acesse a página de detalhes sobre big data.

Para saber mais sobre genômica na nuvem, acesse a página de detalhes sobre genômica da AWS.