Das Laboratory for Personalized Medicine (LPM), das zum Center for Biomedical Informatics an der Harvard Medical School gehört und von Dr. Peter Tonellato geleitet wird, hat sich die Leistung von Hochdurchsatzsequenzierungsmethoden und Technologien zur Erfassung von biomedizinischen Daten sowie die Flexibilität von Amazon Web Services (AWS) zunutze gemacht, um in Rekordzeit innovative Modelle für die Analyse ganzer Genome zu entwickeln. "Durch die Kombination aus unserem Ansatz für biomedizinische Rechenanwendungen und AWS konnten wir unsere Zeit und Energie der Simulationsentwicklung widmen anstatt der Technologie. So konnten wir schnell Ergebnisse erzielen", so Tonellato. "Ohne die Vorteile von AWS wären wir ganz sicher noch nicht so weit wie jetzt."

Tonellatos Labor ist auf Pharmakogenomik/Gesundheitsvorsorge auf Grundlage der genetischen Merkmale eines Menschen spezialisiert. Zur Beurteilung des klinischen Werts neuer Gentests werden Modelle angefertigt und Simulationen durchgeführt.

Andere Projekte umfassen die Simulation großer Patientenpopulationen zur Unterstützung von Simulationen und Vorhersagen klinischer Studien. Da es schwierig ist, ausreichend Daten von realen Patienten zur Modellierung zu bekommen, erstellt das LPM Patientenavatare, im Grunde also "virtuelle" Patienten. Das Labor kann für verschiedene Gentests verschiedene Sätze von Avataren erschaffen und diese anhand der Merkmale von Krankenhauspopulationen in großen Stückzahlen replizieren. Tonellato benötigte eine effiziente Methode, um viele Avatare zu manipulieren, manchmal sogar bis zu 100 Millionen. "Ich wollte nicht nur enorme Datenmengen bewältigen können, sondern ein System entwickeln, mit dem promovierte Wissenschaftler eine genetische Risikosituation einschätzen, die geeignete Simulation und Analyse zur Erstellung der Avatare bestimmen und anschließend in kurzer Zeit Webanwendungen zur Ausführung der Simulationen erstellen können, anstatt ihre Zeit mit der Fehlerbehebung bei der Computertechnologie zu verschwenden", so Tenellato.

2006 entschied sich Tonellato für Cloud Computing, um die komplexen und sehr variablen Rechenanforderungen zu meistern. "Ich habe mehrere Alternativen verglichen, aber nichts gefunden, was so flexibel und zuverlässig ist wie Amazon Web Services", erklärt er. Tonellato hatte schon früher Rechenzentren aufgebaut und konnte sich den Zeitaufwand, der für die Einrichtung von Servern und das Schreiben von Code erforderlich sein würde, einfach nicht leisten. Stattdessen beschloss er, mit einem Test herauszufinden, wie schnell sein Team eine Reihe benutzerdefinierter Amazon Machine Images (AMIs) zusammenstellen konnte, die der optimalen Entwicklungsumgebung für die Webanwendungen der Wissenschaftler entsprachen.

Mittlerweile hat Tonellatos Labor zusätzlich Spot-Instances in die Arbeitsabläufe integriert, um Fördergelder noch besser zu nutzen. Dazu Tonellato: "Wir nutzen Spot-Instances bei der Ausführung von Amazon Elastic Cloud Compute (Amazon EC2)-Clustern, um ganze Genome zu analysieren. Durch die Verwendung von Spot-Instances haben wir die Möglichkeit, noch mehr Knotenrechner zu niedrigeren Kosten zu nutzen. Das bedeutet für uns eine erheblich Kosten- und Zeitersparnis. Um diese Vorteile zu nutzen, war nur ein Tag Arbeit notwendig. Und wir sparen fast 50 % an Kosten." Tonellatos Labor verwendet die StarCluster-Tools von MIT, die über eine integrierte Funktion zur Verwaltung eines Oracle Grid Engine Clusters auf Spot-Instances verfügen. Erik Gafni, ein Programmierer in Tonellatos Labor, kümmerte sich um die Integration von StarCluster in den Arbeitsablauf. Gafni berichtet: "Dank StarCluster konnten wir auf unglaublich einfache Weise innerhalb von nur 10 Minuten ein Spot-Cluster konfigurieren, starten und in Betreib nehmen."

Darüber hinaus erkannte das LPM den Bedarf für Publikationen zum effektiven Einsatz von Cloud Computing in einem akademischen Umfeld und brachte daraufhin eine Art Leitfaden in der Fachzeitschrift "PLoS Computational Biology" heraus. "Wir glauben, dass dieser Artikel deutlich zeigt, wie ein akademisches Labor effektiv AWS für seine Rechenanforderungen einsetzen kann. Er verdeutlicht ebenfalls, wie IT-Probleme in Relation zu den Kosten und Rechenressourcen von AWS zu betrachten sind", so Vincent Fusaro, Hauptautor des Artikels und Forschungsgruppenleiter im LPM.

"Die AWS-Lösung ist stabil, robust, flexibel und kostengünstig", beschreibt Tonellato. "Sie weist alle Merkmale für eine Empfehlung auf."

Tonellato führt seine Simulationen in Amazon EC2 aus, das Kunden eine skalierbare Rechenkapazität in der Cloud bietet. Damit web-basiertes Computing für Entwickler einfacher wird, ermöglicht Amazon EC2 innerhalb von wenigen Minuten die Erstellung und Bereitstellung von Rechenkapazität in der Cloud.

Tonellatos Labor ist von der AWS-Lösung begeistert. "Die Anzahl der Gentests, die Ärzten und Krankenhäusern zur Verfügung stehen, nimmt kontinuierlich zu", erläutert Tonellato, "und sie können sehr teuer sein. Wir möchten herausfinden, welche Tests zu einer besseren Patientenversorgung und besseren Ergebnissen führen." Er ergänzt: "Wir sind davon überzeugt, dass unsere Modelle den Zeitaufwand zur Bestimmung der Tests, Protokolle und Studien, deren intensive Verfolgung sowohl für die FDA-Zulassung als auch für die klinische Anwendung sinnvoll ist, drastisch reduzieren können."

Weitere Informationen, wie AWS Ihnen beim Erfüllen Ihrer Big Data-Anforderungen helfen kann, finden Sie auf unserer Detailseite zu Big Data: http://aws.amazon.com/big-data/.