Fallstudie zum New York University Langone Medical Center
2014
Die High Performance Computing Facility des New York University (NYU) Center for Health Informatics and Bioinformatics wurde im Jahr 2009 gegründet und bietet eine herausragende Rechenleistung für Forscher am NYU Langone Medical Center. Die Einrichtung ermöglicht Forschern in der medizinischen Informatik und in der Bioinformatik ein Vorantreiben von Entdeckungen und Innovationen durch den Zugang zu Rechenleistung, Datenspeicher, Supercomputing-Ressourcen und Datenfreigabe für Kollegen auf der ganzen Welt.
"Unsere Forscher haben viele Mitarbeiter an anderen Standorten. Durch das Hochladen von Daten in Amazon S3 können Forscher an anderen Orten darauf für ihre Zwecke zugreifen."
Dr. Stratos Efstathiadis
Technical Director, New York University Langone Medical Center
Die Herausforderung
Dr. Stratos Efstathiadis, Technischer Leiter der High Performance Computing Facility, beschreibt die Hauptaktivitäten der Fakultät: "Unsere Fakultät erfasst massive Datenmengen von Sequenziergeräten der nächsten Generation, Mikroskopen, Diascannern, Massenspektrometern und anderen Forschungsinstrumenten. Diese Daten müssen gespeichert, organisiert, verwaltet und unterstützt werden. Außerdem muss die Analyse dieser Daten möglich sein und die Fakultät muss Forschern Ressourcen bieten, die das Ausführen von Simulationen und Erstellen von Modellen ermöglichen.
Diese Analyse- und Simulationsaufgaben müssen häufig über mehrere Tage oder sogar Wochen ausgeführt werden. Obwohl die Fakultät für ein medizinisches Zentrum eine der größten ihrer Art ist, besteht gelegentlich Bedarf für zusätzliche Rechenressourcen, damit Forscher Daten schneller analysieren können.
Dabei gestaltet sich die Übermittlung der Daten zeitmäßig sogar noch problematischer als deren Analyse. Efstathiadis erklärt: "Die Übertragung der Daten stellt eine große Engstelle dar; unsere Datensätze sind extrem groß, und es dauert oft länger, Daten zu übertragen, als sie zu erzeugen. Unsere Kollegen sind auf der ganzen Welt verstreut, das heißt, wenn wir die Daten nicht verschieben können, können sie sie nicht nutzen."
Gründe für Amazon Web Services
Die AWS Cloud, kombiniert mit Globus Online, einem kostenfreien Datei-Übertragungsservice, powered by AWS, bietet eine zuverlässige Methode für die Übertragung großer Datensätze in Amazon EC2. Bei dieser Lösung können Dateien parallel mit Geschwindigkeiten von bis zu 50 Megabyte pro Sekunde übertragen werden. Efstathiadis merkt an: "Dies ist mit unseren Übertragungsraten vor Ort vergleichbar – es besteht im Grunde keine Verlangsamung."
Dr. Efstathiadis hat entschieden, AWS aufgrund der Instance-Auswahl von Amazon EC2 zu nutzen, und weil Forscher des Zentrums bereits vertraut mit dem Service waren. "Außerdem", so Efstathiadis weiter, "ist mit Globus Online die problemlose Übertragung von Daten in Amazon EC2 möglich; es ist ein attraktiver Weg, um unsere großen Datensätze in die Cloud-Umgebung zu übertragen, in der Forscher darauf Zugriff haben und sie nutzen können." Andere Tools, wie SCP, brauchen laut Efstathiadis "zu viel Zeit oder werden von den Firewalls verschiedener Institutionen blockiert, was die Art von Tools einschränkt, die wir nutzen können. Globus Online steht für verbesserten Durchsatz ohne dabei die Nutzbarkeit einzuschränken."
Die Fakultät nutzt außerdem Amazon S3 zur Datenspeicherung. Dr. Efstathiadis erklärt: "Globus Online ermöglicht das problemlose Verschieben von Daten aus einem lokalen Speicher in den Speicher von Amazon S3 durch das Bereitstellen eines Serverabbilds, Installieren eines Globus Online Endpunkts und das Verschieben der Daten dorthin."
Die Vorteile
Durch die Verwendung der Cloud erweiterte die HPC-Einrichtung ihr Service-Angebot für NYU-Forscher, die nun Zugang zu den Ressourcen haben, die sie brauchen, und zwar dann, wann sie sie brauchen. Die Cloud hilft den Forschern bei der Zusammenarbeit; durch die Verwendung von Amazon S3 können sie problemlos ihre Erkenntnisse und Datensätze mit Forschern auf der ganzen Welt teilen.
Das Freigeben von Daten ist ein wichtiger Bestandteil. Efstathiadis erklärt: "Unsere Forscher haben viele Mitarbeiter an anderen Standorten. Durch das Hochladen von Daten in Amazon S3 können Forscher an anderen Orten darauf für ihre Zwecke zugreifen. Mit dieser Lösung können Forscher ihre eigenen Analyse-Pipelines vorantreiben und außerdem anderen Forschern dabei helfen, dasselbe zu tun."
Die HPC-Einrichtung des NYU Center for Health Informatics and Bioinformatics sucht permanent nach Wegen, um Forschungen einfacher und kostengünstiger durchführen zu können. Die Verwendung der Cloud hilft der Einrichtung, ihrem Ziel von skalierbaren Rechenressourcen jenseits der Grenzen, die jede lokale Einrichtung alleine mit sich bringen würde, näher zu kommen.
Über das New York University Langone Medical Center
Die High Performance Computing Facility des New York University (NYU) Center for Health Informatics and Bioinformatics wurde im Jahr 2009 gegründet und bietet eine herausragende Rechenleistung für Forscher am NYU Langone Medical Center.
Vorteile von AWS
- Die NYU konnte das Serviceangebot für Forscher erweitern
- Hilft Forschern, effektiver zusammenzuarbeiten
- Ermöglicht Forschern, ihre Ergebnisse und Datensätze mit anderen auf der ganzen Welt zu teilen
Genutzte AWS-Services
Amazon S3
Amazon Simple Storage Service (Amazon S3) ist ein Objektspeicherservice, der branchenführende Skalierbarkeit, Datenverfügbarkeit, Sicherheit und Leistung bietet.
Amazon EC2
Der Web-Service Amazon Elastic Compute Cloud (Amazon EC2) stellt sichere, skalierbare Rechenkapazitäten in der Cloud bereit. Der Service ist darauf ausgelegt, Cloud Computing für Entwickler zu erleichtern.
Genomik in der Cloud
Sie vereinfachen und skalieren Ihre genomischen Analysen sicher mit AWS.
Erste Schritte
Unternehmen jeder Größe und aus jeder Branche transformieren ihr Geschäft mit AWS. Kontaktieren Sie unsere Experten und beginnen Sie noch heute damit, AWS Cloud kennen zu lernen.