Die High Performance Computing Facility des New York University (NYU) Center for Health Informatics and Bioinformatics wurde im Jahr 2009 gegründet und bietet eine herausragende Rechenleistung für Forscher am NYU Langone Medical Center. Die Einrichtung ermöglicht Forschern in der medizinischen Informatik und in der Bioinformatik ein Vorantreiben von Entdeckungen und Innovationen durch den Zugang zu Rechenleistung, Datenspeicher, Supercomputing-Ressourcen und Datenfreigabe für Kollegen auf der ganzen Welt.

Dr. Stratos Efstathiadis, Technischer Leiter der High Performance Computing Facility, beschreibt die Hauptaktivitäten der Fakultät: "Unsere Fakultät erfasst massive Datenmengen von Sequenziergeräten der nächsten Generation, Mikroskopen, Diascannern, Massenspektrometern und anderen Forschungsinstrumenten. Diese Daten müssen gespeichert, organisiert, verwaltet und unterstützt werden. Außerdem muss die Analyse dieser Daten möglich sein und die Fakultät muss Forschern Ressourcen bieten, die das Ausführen von Simulationen und Erstellen von Modellen ermöglichen.

Diese Analyse- und Simulationsaufgaben müssen häufig über mehrere Tage oder sogar Wochen ausgeführt werden. Obwohl die Fakultät für ein medizinisches Zentrum eine der größten ihrer Art ist, besteht gelegentlich Bedarf für zusätzliche Rechenressourcen, damit Forscher Daten schneller analysieren können.

Dabei gestaltet sich die Übermittlung der Daten zeitmäßig sogar noch problematischer als deren Analyse. Efstathiadis erklärt: "Die Übertragung der Daten stellt eine große Engstelle dar; unsere Datensätze sind extrem groß, und es dauert oft länger, Daten zu übertragen, als sie zu erzeugen. Unsere Kollegen sind auf der ganzen Welt verstreut, das heißt, wenn wir die Daten nicht verschieben können, können sie sie nicht nutzen."

Die AWS Cloud, kombiniert mit Globus Online, einem kostenfreien Datei-Übertragungsservice, der von AWS gehostet und unterstützt wird, bietet eine zuverlässige Methode für die Übertragung großer Datensätze in Amazon EC2. Bei dieser Lösung können Dateien parallel mit Geschwindigkeiten von bis zu 50 Megabyte pro Sekunde übertragen werden. Efstathiadis merkt an: "Dies ist mit unseren Übertragungsraten vor Ort vergleichbar – es besteht im Grunde keine Verlangsamung."

Dr. Efstathiadis hat entschieden, AWS aufgrund der Instance-Auswahl von Amazon EC2 zu nutzen, und weil Forscher des Zentrums bereits vertraut mit dem Service waren. "Außerdem", so Efstathiadis weiter, "ist mit Globus Online die problemlose Übertragung von Daten in Amazon EC2 möglich; es ist ein attraktiver Weg, um unsere großen Datensätze in die Cloud-Umgebung zu übertragen, in der Forscher darauf Zugriff haben und sie nutzen können." Andere Tools, wie SCP, brauchen laut Efstathiadis "zu viel Zeit oder werden von den Firewalls verschiedener Institutionen blockiert, was die Art von Tools einschränkt, die wir nutzen können. Globus Online steht für verbesserten Durchsatz ohne dabei die Nutzbarkeit einzuschränken."

Die Fakultät nutzt außerdem Amazon S3 zur Datenspeicherung. Dr. Efstathiadis erklärt: "Globus Online ermöglicht das problemlose Verschieben von Daten aus einem lokalen Speicher in den Speicher von Amazon S3 durch das Bereitstellen eines Serverabbilds, Installieren eines Globus Online Endpunkts und das Verschieben der Daten dorthin."

Durch die Verwendung der Cloud erweiterte die HPC-Einrichtung ihr Service-Angebot für NYU-Forscher, die nun Zugang zu den Ressourcen haben, die sie brauchen, und zwar dann, wann sie sie brauchen. Die Cloud hilft den Forschern bei der Zusammenarbeit; durch die Verwendung von Amazon S3 können sie problemlos ihre Erkenntnisse und Datensätze mit Forschern auf der ganzen Welt teilen.

Das Freigeben von Daten ist ein wichtiger Bestandteil. Efstathiadis erklärt: "Unsere Forscher haben viele Mitarbeiter an anderen Standorten. Durch das Hochladen von Daten in Amazon S3 können Forscher an anderen Orten darauf für ihre Zwecke zugreifen. Mit dieser Lösung können Forscher ihre eigenen Analyse-Pipelines vorantreiben und außerdem anderen Forschern dabei helfen, dasselbe zu tun."

Die HPC-Einrichtung des NYU Center for Health Informatics and Bioinformatics sucht permanent nach Wegen, um Forschungen einfacher und kostengünstiger durchführen zu können. Die Verwendung der Cloud hilft der Einrichtung, ihrem Ziel von skalierbaren Rechenressourcen jenseits der Grenzen, die jede lokale Einrichtung alleine mit sich bringen würde, näher zu kommen.

Für weitere Informationen zu Genomik in der Cloud, besuchen Sie bitte unsere Detailseite zu AWS Genomics.

Um mehr darüber zu erfahren, wie AWS Sie bei Ihren High Performance-Rechenanforderungen unterstützen kann, besuchen Sie bitte unsere Detailseite zu HPC.