Die Icahn School of Medicine at Mount Sinai in New York City (USA) ist international führend in der medizinisch-wissenschaftlichen Ausbildung, in der biomedizinischen Forschung wie auch in der Patientenversorgung. Mit seinen Forschungsarbeiten will das Institut das Wissen im Bereich der Biomedizin erweitern, um im Dienste des Gemeinwesens eine herausragende und wissenschaftlich fundierte klinische Behandlung bereitstellen zu können. In enger Partnerschaft mit dem Mount Sinai Hospital dient die Icahn School of Medicine einer der komplexesten und vielfältigsten Patientenpopulationen der Welt.

Forscher und Ärzte der Icahn School of Medicine versuchen die genetischen Geheimnisse um Brust- und Ovarialkarzinom zu entschlüsseln. Drs. John A. Martignetti und Peter R. Dottino at Mount Sinai und ihre Kollegen von Station X durchforsten die über 2 000 vom The Cancer Genome Atlas Consortium (TCGA) generierten DNA-Sequenzen zu Brust- und Eierstocktumoren und deren Keimbahnen. Der TCGA-Atlas ist ein umfassender und koordinierter Ansatz zur Beschleunigung der Kenntnisse über die molekulare Basis verschiedener Krebsformen mittels Genomanalyseverfahren wie der groß angelegten Genomsequenzierung. TCGA ist ein gemeinsames Projekt des National Cancer Institute (NCI) und des National Human Genome Research Institute (NHGRI), zwei der 27 Institute und Zentren, die unter dem Dach des National Institutes of Health, U.S. Department of Health and Human Services, operieren.

Dies scheint eine nahezu undurchführbare Aufgabe, ist doch für die Analyse von mehr als 100 TB an Daten, die nach jeder Aufstellung einer neuen Hypothese erneut analysiert werden müssen, eine ungeheure Computerleistung erforderlich. Bei etwa der Hälfte aller Frauen mit einem vererbten Risiko für eine der beiden Krebsformen sind für die tatsächliche Entstehung dieser Tumore Keimbahnmutationen der Gene BRCA1 oder BRCA2 verantwortlich. Die Forscher versuchen nun die fehlenden genetischen Zusammenhänge bei denjenigen Frauen aufzudecken, die keine BRCA1/2-Mutation aufweisen.

Gemeinsam mit Station X gelang es Drs. Martignetti und Dottino, die Unterstützung eines Lösungsanbieters heranzuziehen, der für ihre Forschungsarbeiten eine zuverlässige und sichere Analyseplattform bereitstellte. Station X arbeitet an der Entwicklung von GenePool™, einer Softwareplattform mit einer Genomdatenbank für Wissenschaftler und Ärzte, die sowohl in der Grundlagenforschung als auch im klinischen Betrieb menschliche Genomdaten analysieren.

Das Durchsuchen von Terabyte von Genomdaten – und das Sicherstellen der Datensicherheit – setzt eine flexible und hochleistungsfähige Plattform mit Speicherlösungen für Big Data und strenger Zugriffskontrolle voraus. Eindeutig ein Fall für Cloud Computing.

Amazon Web Services (AWS) bildet die Grundlage für die Genetik-Plattform GenePool von Station X, die durch dynamisches Skalieren in der Lage ist, Tausende von Genomen innerhalb von wenigen Minuten zu analysieren. "AWS eignet sich perfekt für die Einrichtung einer Softwareumgebung", sagt Sandeep Sanga, Vice President of Products bei Station X. "Wir haben GenePool auf AWS entwickelt, um Forschern einen Ort bereitzustellen, an dem sie riesige Datenmengen verwalten und analysieren können. Und wir wählten AWS, weil die verfügbare Anzahl von Services so überzeugend ist." Die Nutzung von AWS erlaubte es Station X, sich auf die Entwicklung der GenePool-Plattform zu konzentrieren, sodass Forscher ihre sequenzierten Daten schnell und sicher analysieren konnten.

Für die Forscher am Mount Sinai-Institut ist eine der wichtigsten Voraussetzungen der Schutz der Patientendaten. "Der Schutz und die vertrauliche Behandlung der Daten unserer Patienten steht bei uns an erster Stelle – dies ist gerade bei der enormen Menge der generierten Daten eine unverzichtbare Voraussetzung", erklärt Martignetti. "Und dabei geht es keinesfalls um eine Kleinigkeit. Mit AWS und GenePool erfüllen wir aber die erforderlichen Datenschutzstandards." In AWS kann Station X zugelassenen Forschern kontrollierten Datenzugriff auf den TCGA-Atlas bereitstellen. "Autorisierte Benutzer können so somatische und Keimbahnmutationen bei Patienten mit Brust- oder Eierstockkrebs untersuchen und interpretieren," so Sanga.

Für die Benutzerauthentifizierung verwendet Mount Sinai AWS Identity and Access Management (IAM). Dies ermöglicht die Kontrolle und Verwaltung der Kontenzugriffe mittels AWS-Zugriffskontrolllisten (ACLs) sowie eine sichere und zentrale Verwaltung der Benutzer und Anmeldeinformationen. Amazon Simple Notification Service (Amazon SNS) und Amazon Simple Email Service (Amazon SES) stellen abgehende Messagingdienste für Administratoren und Endbenutzer bereit, die Benachrichtigungen und Warnungen wünschen.

Elastic Load Balancing gewährleistet, dass Station X in seiner Amazon VPC-Umgebung – die Datenspeicher und Middle-Tiers vor einer Exposition im Internet schützt – immer eine ausreichend skalierte, sowohl zuverlässige als auch sichere Web- und API-Architektur zur Verfügung steht. "Durch die Isolation unserer Datenspeicher und Middle-Tiers vor einer Exposition im Internet halten wir alle unsere Server streng abgeschlossen und privat. Unser Sicherheitsaufwand reduziert sich dadurch an anderen Stellen enorm", erklärt Sanga.

Die Forscher bei Mount Sinai nutzen die AWS Cloud zur Verwaltung und Extrahierung relevanter Informationen aus einer ungeheuren Menge an Genomdaten, die in Amazon Simple Storage Service (Amazon S3), erweitert durch Amazon Glacier, gespeichert werden.

Station X verwendet zum Speichern seiner sensiblen und äußerst wertvollen Daten Amazon Elastic Block Store (Amazon EBS). Damit steht der Station ein flexibles und hochleistungsfähiges Speichersystem zur Verfügung, das riesige Mengen an vorab berechneten Daten für die Echtzeitanalyse von Genomdaten speichern kann.

Amazon Elastic Compute Cloud (Amazon EC2) unterstützt die integrierten statistischen Modelle von GenePool, seine visuellen Filterfunktionen, eine umfassende Integration mit Genomdatenbanken und Datenbanken mit klinischen Annotationen sowie die Integration via RESTful-Webservices. "Die Elastizität von Amazon EC2 ermöglicht uns groß angelegte Datenverarbeitungen und Analysen – und dies hochgradig skalierbar und zu einem erschwinglichen Preis", zeigt sich Sanga zufrieden. Mount Sinai nutzt dedizierten Amazon S3-Speicher zur Gewährleistung, dass seine Genom-Patientendaten sicher gespeichert und für die Analyse in GenePool bereitgestellt werden. Abbildung 1 zeigt die Architektur der Icahn School of Medicine at Mount Sinai.

mount-sinai-arch-diag

Abbildung 1. Architektur der Forschungsgruppe an der Icahn School of Medicine at Mount Sinai

Zur Überwachung seiner Systeme und Sicherstellung eines effizienten Betriebs verwendet GenePool Amazon CloudWatch. Amazon ElastiCache stellt einen zentralen Cache-Mechanismus bereit, durch den die Analyseergebnisse der riesigen Datensätze schnell zurückgegeben werden können. "Dank unserer Genomik-Softwareplattform, die wir auf AWS erstellt haben, erhalten unsere Wissenschaftler innerhalb weniger Minuten, wenn nicht sogar Sekunden, Antworten auf ihnen wichtige Fragen," so Sanga.

Durch AWS und GenePool können Drs. Martignetti und Dottino nun Tausende von Patientendatensätzen des The Cancer Genome Atlas-Projekts auswerten. Auf diese Weise können sie genetische Abweichungen in zahlreichen Kandidatengenen ermitteln, die ihre wissenschaftlichen Hypothesen stützen. Durch Quervergleiche dieser Kandidatengene mit anderen Genomikdaten konnten Drs. Martignetti und Dottino die Liste der Kandidatengene enorm erweitern und sind nun auf der Spur neuer. potenzieller Marker für vererbte Brust- und Ovarialkarzinome.

"Vor dem Umstieg in die AWS Cloud waren wir mit unseren externen Partnern schlicht nicht in der Lage, derart große Datensätze zu analysieren," so Martignetti. "Es wäre einfach nicht möglich gewesen, die Daten sinnvoll zu durchforsten, sie zu analysieren und neu zu filtern – dies alles aber ist in unserer Bemühung, den "Missing Link" zu finden, entscheidend."

"Durch die Entwicklung von GenePool auf AWS erhielt Station X auch die Möglichkeit, die Datensätze für unsere translationalen und klinischen Genomikkunden zu speichern", meint Sanga. "AWS verschafft uns ganz klar einen Wettbewerbsvorteil: schneller Datenzugriff, ausreichend Speicher und eine gewaltige Rechenleistung", fügt er hinzu. "Bei Forschungsprojekten wie diesem kommt man eigentlich nie an ein Ende. Es gibt immer noch mehr Daten, die analysiert werden müssen. Selbst, wenn unsere Forscher wissenschaftliche Schlüsse ziehen, gibt es immer noch Neues zu erfahren und zu lernen. Durch AWS sind wir für diese Herausforderung sehr gut aufgestellt."

Ohne die Möglichkeit der Analyse in einem sicheren Umfeld, das die AWS Cloud bietet, könnten die Forscher und Ärzte am Mount Sinai-Institut ihre Forschungsarbeiten nicht vorantreiben. "Dank AWS können wir die Quelldateien sicher und kostengünstig bei hervorragender Beständigkeit und Zugänglichkeit speichern. Ohne diese Möglichkeit könnten wir unsere Forschung nicht betreiben", meint Martignetti. "Mit AWS und GenePool hoffen wir aber, Mutationen zu entdecken, die der "Missing Link" sind, weshalb einige Frauen ein erhöhtes Risiko für diese Krebsarten haben."

Weitere Informationen zur Genomforschung in der Cloud finden Sie auf unserer Detailseite zur Genomforschung auf AWS.