Tonellatos Labor ist auf Pharmakogenomik/Gesundheitsvorsorge auf Grundlage der genetischen Merkmale eines Menschen spezialisiert. Zur Beurteilung des klinischen Werts neuer Gentests werden Modelle angefertigt und Simulationen durchgeführt.
Andere Projekte umfassen die Simulation großer Patientenpopulationen zur Unterstützung von Simulationen und Vorhersagen klinischer Studien. Da es schwierig ist, ausreichend Daten von realen Patienten zur Modellierung zu bekommen, erstellt das LPM Patientenavatare, im Grunde also "virtuelle" Patienten. Das Labor kann für verschiedene Gentests verschiedene Sätze von Avataren erschaffen und diese anhand der Merkmale von Krankenhauspopulationen in großen Stückzahlen replizieren. Tonellato benötigte eine effiziente Methode, um viele Avatare zu manipulieren, manchmal sogar bis zu 100 Millionen. "Ich wollte nicht nur enorme Datenmengen bewältigen können, sondern ein System entwickeln, mit dem promovierte Wissenschaftler eine genetische Risikosituation einschätzen, die geeignete Simulation und Analyse zur Erstellung der Avatare bestimmen und anschließend in kurzer Zeit Webanwendungen zur Ausführung der Simulationen erstellen können, anstatt ihre Zeit mit der Fehlerbehebung bei der Computertechnologie zu verschwenden", so Tenellato.
2006 entschied sich Tonellato für Cloud-Computing, um die komplexen und sehr variablen Rechenanforderungen zu meistern. "Ich habe mehrere Alternativen verglichen, aber nichts gefunden, was so flexibel und zuverlässig ist wie Amazon Web Services", erklärt er. Tonellato hatte schon früher Rechenzentren aufgebaut und konnte sich den Zeitaufwand, der für die Einrichtung von Servern und das Schreiben von Code erforderlich sein würde, einfach nicht leisten. Stattdessen beschloss er, mit einem Test herauszufinden, wie schnell sein Team eine Reihe benutzerdefinierter Amazon Machine Images (AMIs) zusammenstellen konnte, die der optimalen Entwicklungsumgebung für die Webanwendungen der Wissenschaftler entsprachen.
Heute hat Tonellatos Labor zusätzlich Spot-Instances in die Arbeitsabläufe integriert, um Fördergelder noch besser zu nutzen. Tonellato meint dazu: "Wir nutzen Spot-Instances bei der Ausführung von EC2-Clustern für die Analyse ganzer Genome. Durch die Verwendung von Spot-Instances haben wir die Möglichkeit, noch mehr Knotenpunkte zu niedrigeren Kosten zu nutzen. Das bedeutet für uns eine erheblich Kosten- und Zeitersparnis. Um diese Vorteile zu nutzen, war nur ein Tag Arbeit notwendig. Und wir sparen fast 50 % an Kosten." Tonellatos Labor verwendet die StarCluster-Tools von MIT, die über eine integrierte Funktion zur Verwaltung eines Oracle Grid Engine Clusters auf Spot-Instances verfügen. Erik Gafni, ein Programmierer in Tonellatos Labor, kümmerte sich um die Integration von StarCluster in den Arbeitsablauf. Gafni berichtet: "Dank StarCluster konnten wir auf unglaublich einfache Weise innerhalb von nur 10 Minuten ein Spot-Cluster konfigurieren, starten und in Betreib nehmen."
Darüber hinaus erkannte das LPM den Bedarf für Publikationen zum effektiven Einsatz von Cloud-Computing in einem akademischen Umfeld und brachte daraufhin eine Art Leitfaden in der Fachzeitschrift "PLoS Computational Biology" heraus. "Wir glauben, dass dieser Artikel deutlich zeigt, wie ein akademisches Labor effektiv AWS für seine Rechenanforderungen einsetzen kann. Er verdeutlicht ebenfalls, wie IT-Probleme in Relation zu den Kosten und Rechenressourcen von AWS zu betrachten sind", so Vincent Fusaro, Hauptautor des Artikels und Forschungsgruppenleiter im LPM.
"Die AWS-Lösung ist stabil, robust, flexibel und kostengünstig", beschreibt Tonellato. "Sie weist alle Merkmale für eine Empfehlung auf."
Tonellato führt seine Simulationen auf Amazon Elastic Compute Cloud (Amazon EC2) aus, die Kunden eine skalierbare Rechenkapazität in der Cloud bietet. Damit web-basiertes Computing für Entwickler einfacher wird, ermöglicht Amazon EC2 innerhalb von wenigen Minuten die Erstellung und Bereitstellung von Rechenkapazität in der Cloud.
Tonellatos Labor ist von der AWS-Lösung begeistert. "Die Anzahl der Gentests, die Ärzten und Krankenhäusern zur Verfügung stehen, nimmt kontinuierlich zu", erläutert Tonellato, "und sie können sehr teuer sein. Wir möchten herausfinden, welche Tests zu einer besseren Patientenversorgung und besseren Ergebnissen führen." Er ergänzt: "Wir sind davon überzeugt, dass unsere Modelle den Zeitaufwand zur Bestimmung der Tests, Protokolle und Studien, deren intensive Verfolgung sowohl für die FDA-Zulassung als auch für die klinische Anwendung sinnvoll ist, drastisch reduzieren können."
Weitere Informationen zu Amazon EC2-Spot-Instances finden Sie auf der Seite Amazon EC2-Spot-Instance.
Aktualisiert: 21. September 2011