distribuzione di riferimento

Hail in AWS

Analisi genomica semplificata su Amazon EMR

Questo Quick Start, creato in collaborazione con Goldfinch Bio, Inc. e Privo IT, consente di semplificare la creazione, la gestione e interazione con i cluster Hail nel tuo account Amazon Web Services (AWS). Hail è una libreria open-source creata per Apache Spark per fornire l'esplorazione e l'analisi dei dati scalabili, con particolare enfasi sulla genomica.

Utilizzando Hail, i ricercatori possono eseguire l'analisi genomica in modo più rapido ed efficiente. Hail semplifica l'utilizzo delle tecniche di programmazione Spark per l'elaborazione dei dati genetici (frame di dati genomici). Consente inoltre di semplificare la gestione di più formati di input creando una struttura di dati comune (Hail MatrixTable). 

Questa distribuzione utilizza Amazon EMR in combinazione con Apache Spark per dimensionare set di dati di grandi dimensioni attraverso le istanze, ad esempio, genome‐wide association studies (GWAS) su scala di produzione e processi ad hoc a singolo nodo.

Logo Privo

Questo Quick Start è stato sviluppato da Goldfinch Bio, Inc. e Privo IT in collaborazione con AWS.
Privo è un Partner APN.

  •  Attività che realizzerai
  • Il Quick Start configura quanto segue:

    • Un portfolio Hail 0.2 AWS Service Catalog, che consente di creare e gestire i tuoi cluster Hail.
    • Quattro pipeline AWS CodeBuild per supportare la creazione di varie combinazioni di release di Hail 0.2.x, versioni di Variant Effect Predictor (VEP) e plug-in di Loss-Of-Function Transcript Effect Estimator (LOFTEE).
    • Un'istanza Amazon SageMaker che consente di creare e rimuovere ambienti di notebook JupyterLab che si integrano con i cluster Hail (attraverso Sparkmagic e Livy).
    • Un cluster Amazon EMR che consente di creare e rimuovere i cluster Hail 0.2 in base alle esigenze.
    • Un bucket Amazon Simple Storage Service (Amazon S3) Sagemaker per eseguire il backup di ambienti notebook avviati.
    • Un bucket Amazon S3 per la gestione temporanea di artefatti Hail.
    • Un Virtual Private Cloud (VPC) facoltativo configurato con una sottorete privata, secondo le best practice AWS, per fornirti la tua rete virtuale in AWS.
  •  Come effettuare la distribuzione
  • Per distribuire Hail, segui le istruzioni nella guida alla distribuzione. Il processo di distribuzione richiede circa 10 minuti e comprende i seguenti passaggi:

    1. Se non disponi ancora di un account AWS, registrati su https://aws.amazon.com e accedi al tuo account.
    2. Avvia Quick Start scegliendo tra le seguenti opzioni. Entrambe le opzioni sono basate su un modello singolo.
    3. Prova la distribuzione.

    Amazon può condividere informazioni relative all'implementazione con il Partner AWS che ha collaborato con AWS a questa Partner Solution.  

  •  Costi e licenze
  • Ti saranno addebitati i costi dei servizi AWS utilizzati per eseguire questa distribuzione di riferimento Quick Start. Non sono previsti costi aggiuntivi per l'utilizzo del Quick Start. 

    Il modello AWS CloudFormation per questo Quick Start include alcuni parametri di configurazione personalizzabili. Alcune di queste impostazioni, ad esempio il tipo di istanza, incideranno sul costo della distribuzione. Per una stima dei costi di ogni servizio AWS utilizzato, consulta la pagina dei prezzi. I prezzi sono soggetti a modifiche.

    Suggerimento: dopo la distribuzione di Quick Start ti consigliamo di abilitare AWS Cost and Usage Report. Questo report invia i parametri di fatturazione in un bucket S3 all'interno del tuo account. Fornisce stime sui costi basate sull'utilizzo mensile e completa i dati al termine del mese. Per maggiori informazioni sul report, consulta la documentazione AWS.

    Hail 0.2 viene rilasciato con la licenza MIT.