Il Laboratory for Personalized Medicine (LPM), che fa parte del Center for Biomedical Informatics alla Harvard Medical School, diretto dal Dott. Peter Tonellato, ha scelto la potenza delle tecnologie di sequenziamento a throughput elevato e di raccolta di dati biomedici e la flessibilità di Amazon Web Services (AWS) per lo sviluppo di modelli innovativi di test di analisi di genomi completi in tempo record. "La combinazione del nostro approccio all'elaborazione biomedica e AWS ci ha permesso di concentrare il nostro tempo e le nostre energie sullo sviluppo della simulazione, piuttosto che sulla tecnologia, per ottenere risultati rapidi", dichiara Tonellato. "Senza i vantaggi di AWS, non saremmo certamente arrivati così lontano".

Il laboratorio di Tonellato è specializzato in medicina personalizzata, una profilassi basata sulle caratteristiche genetiche degli individui, e crea modelli e simulazioni per determinare il valore clinico dei nuovi test genetici.

Fra gli altri progetti c'è la simulazione di grandi popolazioni di pazienti per supportare le simulazioni e predizioni di esperimenti clinici. Per ovviare alla difficoltà di trovare una quantità sufficiente di dati di pazienti reali per la creazioni di modelli, l'LPM crea avatar di pazienti, praticamente dei pazienti "virtuali". Il laboratorio può creare diversi gruppi di avatar per diversi test genetici e quindi replicarne grandissimi numeri in base alla caratteristiche delle popolazioni negli ospedali. Tonellato doveva trovare un modo efficiente di manipolare molti avatar, fino a 100 milioni alla volta. "Oltre ad essere in grado di gestire enormi quantità di dati", dice, "volevo escogitare un sistema nel quale i ricercatori post-dottorato possono esaminare una situazione di rischio genetico, determinare la simulazione e l'analisi appropriata per creare gli avatar e quindi creare rapidamente applicazioni Web per eseguire le simulazioni, piuttosto che perdere tempo a risolvere problemi di tecnologia di elaborazione".

Nel 2006, Tonellato ha scelto il cloud computing per gestire la complessità e la variabilità elevata delle esigenze di elaborazione. "Ho valutato diverse opzioni ma non ne ho trovata nessuna così flessibile e solida come Amazon Web Services", afferma. Tonellato, che ha creato data center in passato, non poteva permettersi il lusso di aspettare il tempo necessario alla configurazione dei server e alla creazione del codice. Allora ha deciso di fare un test per vedere con quale velocità il suo team era in grado di mettere insieme una serie di Amazon Machine Images (AMI) personalizzate che rappresentassero l'ambiente di sviluppo ottimale per le applicazioni Web dei ricercatori.

Adesso il laboratorio di Tonellato ha proseguito gli sforzi integrando istanze Spot nei carichi di lavoro in modo da ottimizzare ulteriormente i fondi di sovvenzione. Spiega Tonellato: "Utilizziamo le istanze Spot quando eseguiamo cluster Amazon Elastic Cloud Compute (Amazon EC2) per analizzare genomi completi. Abbiamo il potenziale per eseguire anche più nodi di lavoro a costo inferiore quando usiamo le istanze Spot, quindi è un grande risparmio di tempo e denaro per noi. Per approfittare di questi risparmi, ci è voluto un solo giorno di progettazione e abbiamo visto una riduzione all'incirca del 50% dei costi'. Il laboratorio di Tonellato utilizza gli strumenti StarCluster dell'MIT, che hanno capacità integrate di gestione di un cluster Oracle Grid Engine sulle istanze Spot. Erik Gafni, programmatore nel laboratorio di Tonellato, ha effettuato l'integrazione di StarCluster nel nostro flusso di lavoro. Secondo Gafni, "Utilizzando StarCluster, è stato incredibilmente facile configurare, lanciare e avviare con un cluster Spot in esecuzione in meno di 10 minuti".

Inoltre l'LPM ha identificato il bisogno di pubblicazioni su come usare in modo efficiente il cloud computing in ambiente accademico e ha pubblicato un manuale pedagogico in PLoS Computational Biology per soddisfare questa necessità. "Questo articolo mostra chiaramente che un laboratorio accademico può usare in modo efficiente AWS per gestire le esigenze di elaborazione. Inoltre spiega come pensare ai problemi di elaborazione relativamente ai costi di AWS e delle risorse di calcolo", afferma Vincent Fusaro, autore principale e ricercatore senior all'LPM.

"La soluzione AWS è stabile, solida, flessibile ed economica", commenta Tonellato. "È da raccomandare da ogni punto di vista".

Tonellato esegue simulazioni su Amazon EC2, che fornisce ai clienti capacità di elaborazione scalabile nel cloud. Progettato per rendere l'elaborazione su scala Web più agevole per gli sviluppatori, Amazon EC2 consente di creare ed effettuare il provisioning di capacità di elaborazione nel cloud in pochi minuti.

Il laboratorio di Tonellato è entusiasta della soluzione AWS. "I test genetici disponibili per i medici e gli ospedali sono in costante aumento", spiega Tonellato, " e possono essere molto costosi. Noi vogliamo determinare quali sono i test che possono curare meglio i pazienti e con i migliori risultati". E aggiunge: "Siamo convinti che i nostri modelli possono ridurre in modo spettacolare il tempo impiegato a identificare i test, i protocolli e gli esperimenti per i quali vale la pena battersi perché siano approvati dalla FDA e vengano utilizzati in ambiente clinico".

Per ulteriori informazioni su come AWS può aiutarti con i Big Data, visita la pagina dei dettagli sui Big Data.

Per ulteriori informazioni sulla genomica nel cloud, visita la pagina dei dettagli sulla genomica in AWS.