Caso di studio New York University Langone Medical Center

2014

La High Performance Computing Facility del Center for Health Informatics and Bioinformatics della New York University (NYU) è stata fondata nel 2009 per offrire funzioni di elaborazione all'avanguardia ai ricercatori che operano nel NYU Langone Medical Center. La struttura permette ai ricercatori informatici e bioinformatici nella campo della medicina di velocizzare la scoperta e l'innovazione attraverso l'accesso a potenza di elaborazione, storage di dati, risorse di supercalcolo e condivisione dei dati con collaboratori in tutto il mondo.

Shot of two young women using a laptop together in a college library
kr_quotemark

I nostri ricercatori hanno molti collaboratori in altri centri; caricare i dati in Amazon S3 permette loro di accedere agli stessi dati".

Dottor Stratos Efstathiadis
Direttore tecnico, New York University Langone Medical Center

La sfida

Il dottor Stratos Efstathiadis, direttore tecnico della High Performance Computing Facility, descrive le attività principali della struttura: "La struttura acquisisce enormi volumi di dati da sequenziatori, microscopi, scanner, spettrometri di massa e altri strumenti di ricerca. Deve memorizzare, curare, supportare e attivare l'analisi dei dati, oltre a fornire risorse che gli scienziati possano usare per eseguire simulazioni e generare modelli.

Queste attività di analisi e simulazione spesso devono rimanere in esecuzione per giorni, addirittura settimane. Perciò, nonostante la struttura sia una delle più grandi nel suo genere per un centro medico, talvolta sono necessarie risorse aggiuntive che consentano ai ricercatori di analizzare dati più rapidamente.

Ancora più problematico del tempo necessario per l'analisi dei dati è il tempo necessario per trasferirli. Così spiega Efstathiadis: "Il trasferimento dei dati rappresenta un collo di bottiglia; i nostri set di dati sono di grandi dimensioni e spesso serve più tempo per spostarli che per generarli. Abbiamo collaboratori in tutto il mondo, se non riusciamo a farlo, non possono utilizzarli".

Perché Amazon Web Services

AWS Cloud, in collaborazione con Globus Online, un servizio di trasferimento file gratuito in hosting e gestito da AWS, offre un metodo affidabile per trasferire grandi set di dati in Amazon EC2. La soluzione permette così di trasferire file in parallelo con una velocità massima di 50 MB al secondo. Efstathiadis osserva: "La velocità è paragonabile a quella che abbiamo internamente, non c'è ombra di rallentamento!".

Il dottor Efstathiadis ha così deciso di utilizzare AWS per sfruttare i diversi tipi di istanze Amazon EC2 e perché i ricercatori del centro avevano già acquisito familiarità con il servizio. "Inoltre", aggiunge Efstathiadis, "poiché Globus Online semplifica il trasferimento di dati in Amazon EC2, è un metodo interessante per spostare i dati in ambiente cloud, dove i ricercatori potranno accedervi e utilizzarli". Gli altri strumenti disponibili, ad esempio SCP, secondo Efstathiadis "richiedono troppo tempo o vengono bloccati dai firewall. Globus Online consente throughput elevati senza comprometterne la praticità".

La struttura impiega inoltre Amazon S3 per lo storage dei dati. Il dottor Efstathiadis spiega: "Globus Online semplifica il trasferimento di dati dallo storage locale in Amazon S3 attraverso la distribuzione di un'immagine di server, l'installazione di un endpoint Globus Online e il trasferimento dei dati in quella destinazione".

I vantaggi

Sfruttando il cloud, la struttura di HPC ha permesso di espandere la gamma di servizi che può offrire ai ricercatori della NYU, i quali possono ora accedere alle risorse di cui hanno bisogno, quando ne hanno bisogno. Il cloud ha semplificato inoltre la collaborazione; utilizzando Amazon S3 i ricercatori possono condividere i risultati e i set di dati con i colleghi di tutto il mondo.

La condivisione dei dati è il componente più importante. !I nostri ricercatori hanno molti collaboratori in altri centri; caricare i dati in Amazon S3 permette loro di accedere agli stessi dati", afferma Efstathiadis. "Grazie a questa soluzione, quindi, i ricercatori della NYU velocizzano non solo le loro pipeline di analisi, ma anche quelle degli altri collaboratori".

La struttura di HPC del Center for Health Informatics and Bioinformatics della NYU cerca sempre nuovi modi per semplificare la ricerca e ridurne i costi. L'utilizzo del cloud permette di raggiungere una quantità di risorse di elaborazione scalabili ben oltre le capacità di una struttura in locale.


Informazioni sullo New York University Langone Medical Center

La High Performance Computing Facility del Center for Health Informatics and Bioinformatics della New York University (NYU) è stata fondata nel 2009 per offrire funzioni di elaborazione all'avanguardia ai ricercatori che operano nel NYU Langone Medical Center.

Vantaggi di AWS

  • Ha consentito alla NYU di espandere i servizi rivolti ai ricercatori
  • Agevola la collaborazione dei ricercatori
  • Consente ai ricercatori di condividere i risultati e i set di dati con i colleghi di tutto il mondo

Servizi AWS utilizzati

Amazon S3

Amazon Simple Storage Service (Amazon S3) è un servizio di storage di oggetti che offre scalabilità, disponibilità dei dati, sicurezza e prestazioni all'avanguardia nel settore. 

Ulteriori informazioni »

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) è un servizio Web che fornisce capacità di elaborazione sicura e scalabile nel cloud. È concepito per rendere più semplice il cloud computing su scala Web per gli sviluppatori.

Ulteriori informazioni >>

Genomica nel cloud

Semplifica e dimensiona le analisi genomiche in sicurezza con AWS.

Ulteriori informazioni >>


Nozioni di base

Le aziende di tutte le taglie e di tutti i settori stanno trasformando ogni giorno la propria attività grazie ad AWS. Contatta i nostri esperti e inizia subito il tuo viaggio in AWS Cloud.