déploiement de référence

Illumina DRAGEN sur AWS

Analyse des données de séquençage nouvelle génération

Cette solution partenaire permet de déployer Illumina DRAGEN (Dynamic Read Analysis for GENomics) Bio-IT Platform dans le cloud Amazon Web Services (AWS).

DRAGEN Bio-IT Platform permet de réaliser une analyse ultra-rapide de données de séquençage nouvelle génération (NGS), de réduire significativement le temps nécessaire à l'analyse de données génomiques et d'améliorer la précision. La suite comprend des pipelines bio-informatiques fournissant des algorithmes optimisés pour le mappage, l'alignement, le tri, le marquage dupliqué et l'appel de variante haplotype. Ces pipelines incluent Germline, Somatic (avec et sans tumeur), RNA, Single Cell RNA, Methylation, Joint Genotyping et DRAGEN-GATK.

La solution partenaire crée un environnement AWS qui s'étend sur deux zones de disponibilité pour une disponibilité élevée et provisionne deux environnements de calcul AWS Batch pour les instances Spot et à la demande. Ces environnements incluent les instances DRAGEN F1 connectées à des réseaux de portes programmables in situ (FPGA ou Field-programmable gate array) pour favoriser l'accélération matérielle.

Logo Illumina

Cette solution partenaire a été développée par Illumina, en collaboration avec AWS. Illumina est un partenaire AWS.


Les administrateurs AWS Service Catalog peuvent ajouter cette architecture à leur propre catalogue.  

  •  Votre projet de création
  • Utilisez cette solution partenaire pour configurer l’environnement suivant sur AWS :

    • Une architecture hautement disponible couvrant deux zones de disponibilité*.
    • Un virtual private cloud (VPC) configuré avec des sous-réseaux publics et privés conformément aux bonnes pratiques AWS. Cela fournit l'infrastructure réseau nécessaire pour votre déploiement.*
    • Une passerelle Internet pour permettre l'accès à Internet.*
    • Dans les sous-réseaux publics, des passerelles NAT gérées pour autoriser l'accès Internet sortant pour les ressources des sous-réseaux privés.*
    • Un pipeline AWS CodePipeline qui crée une image Docker et la télécharge dans un référentiel Amazon Elastic Container Registry (Amazon ECR).
    • Deux environnements de calcul AWS Batch : un pour les instances Spot Amazon Elastic Compute Cloud (Amazon EC2) et l'autre pour les instances à la demande.
    • Une file d'attente de tâches AWS Batch qui priorise les soumissions à l'environnement de calcul pour que les instances Spot soient optimisées au moindre coût.
    • Une définition de tâche AWS Batch pour exécuter DRAGEN.
    • Des rôles et politiques AWS Identity and Access Management (IAM) pour que les tâches AWS Batch s'exécutent.

    * Le modèle qui déploie la solution partenaire dans un VPC existant ignore les tâches marquées d'un astérisque et vous demande d'indiquer la configuration de votre VPC existant.

  •  Procédure de déploiement
  • Pour déployer Illumina DRAGEN, suivez les instructions du guide de déploiement. Le processus de déploiement comprend les étapes suivantes :

    1. Si vous n'avez pas encore de compte AWS, créez-en à l'adresse https://aws.amazon.com.
    2. Abonnez-vous à DRAGEN Bio-IT Platform sur AWS Marketplace.
    3. Lancez la solution partenaire. Chaque déploiement prend environ 15 minutes. Vous pouvez choisir entre deux options :
    4. Testez le déploiement en exécutant une tâche DRAGEN.

    Pour personnaliser votre déploiement, configurez l'architecture réseau, définir le nombre de processeurs virtuels souhaités pour l'environnement AWS Batch, spécifier un pourcentage d'enchère pour les instances Spot et définir le nombre de tentatives de tâches AWS Batch.

    Amazon peut être amené à partager les informations relatives au déploiement des utilisateurs avec le partenaire AWS qui a élaboré cette solution en collaboration avec AWS.  

  •  Coût et licences
  • Cette solution partenaire nécessite un abonnement à une Amazon Machine Image (AMI) pour DRAGEN Bio-IT Platform, disponible avec tarification à l'heure sur AWS Marketplace.

    Vous êtes responsable du paiement du coût des services AWS et des licences tierces utilisées lors de l'exécution de cette solution. Aucun frais supplémentaire ne vous sera facturé pour l'utilisation de la solution.

    Cette solution propose des paramètres de configuration que vous pouvez personnaliser. Certains de ces paramètres, tel que le type d'instance, affectent le coût du déploiement. Reportez-vous aux pages de tarification pour les estimations de coûts de chaque service AWS que vous utilisez. Les prix sont susceptibles d'être modifiés.

    Astuce : après avoir déployé une solution, créez des Rapports de coût et d'utilisation AWS afin de suivre les coûts afférents à la solution. Ces rapports fournissent des métriques de facturation à un compartiment Amazon Simple Storage Service (Amazon S3) dans votre compte. Ils fournissent des estimations de coûts basées sur l'utilisation mensuelle et agrègent les données à la fin du mois. Pour en savoir plus, consultez la section Qu'est-ce que les rapports de coût et d'utilisation AWS ?