Le Centre de biologie quantitative mène de nouvelles recherches sur les génomes plus rapidement grâce à AWS

QuadX

Analyse des différences d'expression génétique

Chaque jour, des chercheurs du Centre de biologie quantitative (QBiC) ont recours à des plateformes de calcul haute performance (HPC) pour analyser des données génomiques et pour déterminer, par exemple, les différences d'expression génétique entre des tissus malades et normaux. Le QBiC est situé à l'université de Tübingen en Allemagne. Il contribue à la recherche en génomique au sein de l'université et d'autres organismes de recherche dans le monde.

Les charges de travail HPC du QBiC sont principalement hébergées dans un centre de données sur site. Toutefois, comme le volume des données de recherche continue d'augmenter rapidement, le QBiC prévoit des difficultés à se mettre à l'échelle rapidement et de manière rentable. « Au fur et à mesure que notre volume de données augmentait, nous avons réalisé que vous avions besoin d'une capacité de calcul bien supérieure à celle que notre infrastructure sur site pouvait fournir », explique Alex Peltzer, chercheur principal en bioinformatique au QBiC. « Les chercheurs qui utilisent notre plateforme avaient également besoin de meilleures performances, afin de pouvoir analyser davantage de données et terminer leurs recherches plus rapidement. » La plus grande force du QBiC est le traitement des données selon les principes des données FAIR : faciles à trouver, accessibles, interopérables et réutilisables. « Répondre aux exigences du traitement FAIR implique la nécessité d'une mise à l'échelle efficace, ce qui nous était difficile », précise M. Peltzer.

« La configuration évaluée peut potentiellement réduire de 50 % le temps de nos recherches en génomique grâce à l'automatisation et l'orchestration dont nous bénéficions avec AWS Batch. »

Alex Peltzer, chercheur principal en bioinformatique, Centre de biologie quantitative, université de Tübingen

  • À propos du Centre de biologie quantitative
  • Le Centre de biologie quantitative (QBiC) est une unité de recherche qui fait partie de l'université de Tübingen en Allemagne. Le QBiC héberge une plateforme de recherche HPC qui permet aux chercheurs internes et externes d'analyser et de traiter des données génomiques.

  • Avantages
    • Peut traiter jusqu'à 100 000 échantillons génétiques lors d'un seul projet de recherche
    • Réduit de 50 % le temps de recherche en génomique
    • Accélère la recherche des différences d'expression génétique
    • Réduit le coût d'analyse
  • Services AWS utilisés

Exploitation d'une plateforme de recherche HPC et du cloud computing basé sur AWS

Les besoins du QBiC en matière de mise à l'échelle et de performance l'ont conduit vers le cloud Amazon Web Services (AWS). « Nous savions que le cloud répondrait à nos besoins, et AWS offre une technologie plus avancée que les autres fournisseurs que vous avons examinés », indique M. Peltzer. AWS s'intègre également aux cadres Nextflow et nf-core, qui prennent en charge des flux de travail scientifiques évolutifs à l'aide de conteneurs logiciels. « AWS fonctionne très bien avec Nextflow, et aucun autre fournisseur de cloud ne pouvait le faire », précise M. Peltzer. « Sans cette intégration, nous aurions dû consacrer beaucoup de temps et d'argent à réécrire nous-mêmes les fonctionnalités de planification. »

Le QBiC a choisi de tirer parti des instances Amazon Elastic Compute Cloud (Amazon EC2) alimentées par des processus Intel Xeon Scalable, pour son infrastructure existante sur site. Le QBiC exécute désormais Nextflow sur AWS pour la gestion des flux de travail et utilise AWS Batch pour l'automatisation et l'orchestration des tâches par lots de Nextflow.

L'organisation utilise également les instances Spot Amazon EC2 pour réduire les coûts d'analyse. Les instances Spot EC2 sont des capacités de calculs inutilisées sur AWS, disponibles avec des réductions allant jusqu'à 90 % par rapport aux prix des instances à la demande. « Nous réduisons les coûts d'analyse en utilisant les instances Spot Amazon EC2 », déclare Alex Peltzer. « Cela nous permet de faire des économies et mettre plus d'argent dans la recherche. »

Traitement de 100 000 échantillons génétiques

En exécutant ses charges de travail d'analyse dans Nextflow sur AWS, le QBiC peut tirer parti du traitement en parallèle et s'adapter à la demande. « Grâce à AWS, nous pouvons augmenter ou diminuer rapidement les ressources de notre plateforme HPC, qu'il s'agisse de traiter 30 ou 100 000 échantillons génétiques dans le cadre d'un projet de recherche », précise M. Peltzer De plus, le QBiC et ses clients chercheurs bénéficient d'une fiabilité accrue pour les travaux de séquençage génomique. « Nous n'avons plus à nous soucier des pannes de système et des ralentissements de performances dus au fait que trop de personnes font la queue pour le traitement des tâches », explique M. Peltzer. Bien que la configuration soit actuellement utilisée dans le cadre de projets de recherche technique, les résultats actuels laissent entrevoir une utilisation potentielle en production.

Réduire de 50 % le temps de recherche en génomique

Dans ses projets d'évaluation comparative, le QBiC a réduit son temps de recherche et de traitement pour toutes les tâches en utilisant Amazon EC2 et AWS Batch, tant pour l'université que pour les organismes de recherche privés qui partagent des ressources avec le centre. La configuration évaluée peut potentiellement réduire de 50 % le temps de nos recherches en génomique grâce à l'automatisation et l'orchestration dont nous bénéficions avec AWS Batch », indique Alex Peltzer. « Nous pouvons tout effectuer beaucoup plus rapidement par rapport à notre environnement sur site. »

Par conséquent, le QBiC et d'autres institutions de recherche en Allemagne voient un énorme potentiel dans l'utilisation d'applications cloud AWS. L'infrastructure distribuée peut aider le QBiC à terminer plus rapidement les recherches portant sur l’analyse de l'expression génétique afin de trouver des mutations susceptibles d'être impliquées dans le cancer. « En effectuant le séquençage génomique sur AWS, nous examinons les données relatives aux plantes et aux animaux pour voir comment les traitements expérimentaux modifient l'expression de certains gènes », indique M. Peltzer.

Le QBiC continuera d'évaluer l'utilisation des services AWS au fur et à mesure que ses besoins en recherche augmenteront. « Dans les prochaines années, nous espérons faire partie de l'un des plus grands centres publics de séquençage génomique en Allemagne », déclare Alex Peltzer. « AWS nous aidera à rendre cela possible. »

En savoir plus

Pour en savoir plus, consultez le site aws.amazon.com/hpc.