implementazione di riferimento

Illumina DRAGEN su AWS

Analisi dei dati di sequenziamento di nuova generazione

Questa soluzione del partner implementa la piattaforma Illumina Bio-IT DRAGEN (Dynamic Read Analysis for GENomics) nel cloud Amazon Web Services (AWS).

La piattaforma Bio-IT DRAGEN consente di eseguire un'analisi ultrarapida dei dati di sequenziamento di prossima generazione (NGS), riduce, in modo significativo, il tempo di analisi dei dati genomici e ne migliora la precisione. Include pipeline di bioinformatica che forniscono algoritmi ottimizzati per la mappatura, l'allineamento, l'ordinamento, la marcatura duplicata e la chiamata di varianti di aplotipi. Queste pipeline includono Linea germiale, Cellule somatiche (tumorali e tumorali/normali), RNA, RNA di singole cellule, Metilazione, Genotipizzazione congiunta e DRAGEN-GATK.

La soluzione del partner crea un ambiente AWS che si estende su due zone di disponibilità molto elevata e fornisce due ambienti di calcolo batch AWS per istanze Spot e istanze on demand. Questi ambienti includono istanze DRAGEN F1 collegate ad array programmabili sul campo (FPGA) che consentono l'accelerazione hardware.

Logo Illumina

Questa soluzione dei partner è stata sviluppata da Illumina in collaborazione con AWS. Illumina è un partner AWS.


Gli amministratori di AWS Service Catalog possono aggiungere questa architettura al proprio catalogo.  

  •  Attività che realizzerai
  • Utilizza questa soluzione dei partner per l'impostazione del seguente ambiente configurabile su AWS:

    • Un'architettura ad alta disponibilità che si estende su due zone di disponibilità.*
    • Un cloud privato virtuale (VPC, Virtual Private Cloud) configurato con sottoreti pubbliche e private in conformità con le best practice di AWS. Questo ambiente offre l'infrastruttura di rete per la distribuzione.*
    • Un Internet gateway per offrire accesso a Internet.*
    • Nelle sottoreti pubbliche, gateway NAT gestiti per consentire accesso a Internet in uscita per le risorse nelle sottoreti private.*
    • Una pipeline AWS CodePipeline che crea un'immagine Docker e la carica in un repository Amazon Elastic Container Registry (Amazon ECR).
    • Due ambienti di calcolo AWS Batch: uno per le istanze Spot di Amazon Elastic Compute Cloud (Amazon EC2) e l'altra per le istanze on demand.
    • Una coda di lavori di AWS Batch che assegna la priorità all'invio di istanze Spot all'ambiente di lavoro per ottimizzarne i costi.
    • Una definizione di lavoro AWS Batch per eseguire DRAGEN.
    • Policy e ruoli di AWS Identity and Access Management (IAM) per i lavori di AWS Batch da eseguire.

    * Il modello che implementa la soluzione dei partner su un VPC esistente non include le attività contrassegnate con asterisco e richiede la configurazione del VPC esistente.

  •  Come effettuare l'implementazione
  • Per implementare Illumina DRAGEN, segui le istruzioni nella guida all'implementazione. Il processo di implementazione prevede le seguenti fasi:

    1. Se non disponi ancora di un account AWS, registrati su https://aws.amazon.com.
    2. Iscriviti alla piattaforma Bio-IT DRAGEN in Marketplace AWS.
    3. Avvia la soluzione del partner. Ciascuna implementazione dura circa 15 minuti. Puoi scegliere tra due opzioni:
    4. Prova l'implementazione eseguendo un processo DRAGEN.

    Per personalizzare l'implementazione, puoi configurare l'architettura di rete, impostare il numero desiderato di CPU virtuali per l'ambiente batch AWS, specificare una percentuale di offerta per istanze Spot e impostare un numero di tentativi di processo batch AWS.

    Amazon può condividere informazioni relative all'implementazione con il Partner AWS che ha collaborato con AWS a questa soluzione.  

  •  Costi e licenze
  • Questa soluzione del partner richiede la sottoscrizione all'Amazon Machine Image (AMI) per la piattaforma Bio-IT DRAGEN, disponibile su Marketplace AWS con un listino prezzi basato sulle ore di utilizzo.

    Verranno addebitati i costi dei servizi AWS e di qualsiasi licenza di terze parti utilizzati per eseguire questa soluzione. Non sono previsti costi aggiuntivi per l'utilizzo della soluzione.

    Questa soluzione include alcuni parametri di configurazione personalizzabili. Alcune di queste impostazioni, ad esempio il tipo di istanza, incideranno sul costo dell'implementazione. Per una stima dei costi di ogni servizio AWS utilizzato, consulta la pagina dei prezzi. I prezzi sono soggetti a modifiche.

    Suggerimento: dopo l'implementazione della soluzione, crea report di costi e utilizzo di AWS per monitorare i costi associati. Questi report forniscono i parametri di fatturazione a un bucket Amazon Simple Storage Service (Amazon S3) nel tuo account. Inoltre, essi forniscono i costi stimati in base al consumo con cadenza mensile e aggregano i dati alla fine del mese. Per ulteriori informazioni, consulta Che cosa sono i report di costi e utilizzo AWS?