Grâce à AWS, Illumina fait passer la génomique des échantillons aux réponses

2021

Au cours de la dernière décennie, la génomique est passée du statut de domaine de recherche spécialisé à celui d'outil clinique puissant, ouvrant la voie à une nouvelle ère de soins médicaux axés sur le patient. Le séquençage et l'analyse du génome sont devenus plus simples, moins chers et plus complets, ce qui permet aux cliniciens de demander des tests génétiques pour leurs patients et aux chercheurs d'examiner des milliers d'échantillons pour établir des liens entre les variations génétiques et les maladies humaines. Alors qu'il a fallu des décennies pour séquencer le premier génome humain, les scientifiques peuvent désormais séquencer efficacement un génome humain entier en moins de 24 heures.

La mission d'Illumina est de révéler le pouvoir du génome pour améliorer la santé humaine. En tant que partenaire AWS, l'entreprise a été un moteur de l'avancée technologique en génomique, évoluant d'un vendeur d'instruments de séquençage à un fournisseur de solutions génomiques complètes et déployant des solutions logicielles sur Amazon Web Services (AWS) depuis 2013. Les solutions logicielles d'Illumina basées sur AWS réduisent les difficultés à l'entrée et aident les chercheurs à faire de nouvelles découvertes chaque jour, ce qui favorise la découverte de médicaments et plus encore. 

« L'industrie de la génomique se développe dans toutes les directions, des tests grand public aux vaccins personnalisés contre le cancer », explique Susan Tousi, directrice commerciale d'Illumina. « L'objectif d'Illumina est de démocratiser l'accès aux technologies génomiques dans le monde entier. Dès le début, nous nous sommes associés à AWS pour donner à nos clients les réponses dont ils ont besoin. Au cours de la dernière décennie, nous avons élargi notre éventail de logiciels disponibles sur AWS afin de fournir une suite complète et transparente de solutions pouvant être déployées telles quelles ou personnalisées pour répondre à des besoins spécifiques. »

AWS Healthcare & Life Sciences Virtual Symposium 2021: Illumina
kr_quotemark

Nous fournissons un flux de travail complet (de la préparation des échantillons à l'analyse tertiaire) dans l'environnement AWS sécurisé, ce qui permet de regrouper et d'analyser toutes les informations générées avant et après le séquençage. »

Rami Mehio
Vice-présent de la bioinformatique et des logiciels d'instrumentation chez Illumina

Un flux de travail complet en génomique de nouvelle génération commence par la collecte, la préparation et le séquençage des échantillons, mais ce n'est que le début. Après cela, le gros du travail de bioinformatique commence avec le contrôle de la qualité des lectures brutes, le prétraitement des données et l'alignement. Les scientifiques peuvent ensuite passer à des analyses secondaires comme l'appel de variantes, et enfin, effectuer des analyses tertiaires avancées en fonction de leurs besoins. Ces analyses tertiaires peuvent inclure l'annotation phylogénétique, les associations génotype-phénotype, etc. Pour les chercheurs et les cliniciens qui ne sont pas des experts en bioinformatique, l'exécution de chaque étape sur une plateforme distincte peut rapidement les dépasser.

Illumina facilite l'ensemble de ce flux de travail génomique pour les clients, en offrant des solutions intégrées à chaque étape. Depuis le début, BaseSpaceTM Clarity LIMS (systèmes de gestion des informations de laboratoire) aide les clients en génomique à suivre les échantillons et à optimiser les flux de travail de séquençage. Les instruments de séquençage peuvent charger des données directement dans la plateforme Illumina Connected Analytics (ICA), où les utilisateurs peuvent gérer les jeux de données et tirer parti des outils analytiques de la plateforme sur AWS. La plateforme DRAGENTM Bio-IT fournit des résultats d'analyse secondaire précis et ultrarapides. En parallèle, le moteur de corrélation BaseSpace intègre les jeux de données et les requêtes des individus dans un référentiel de jeux de données publics en accès libre et en accès contrôlé afin de permettre une grande variété d'analyses tertiaires.

Les données de ces plateformes sont stockées sur Amazon Simple Storage Service (Amazon S3), un service de stockage d'objets évolutif. Les clients d'Illumina alimentent et accélèrent considérablement leurs analyses avec DRAGEN s'exécutant sur Amazon Elastic Compute Cloud (Amazon EC2), un service web qui fournit une capacité de calcul sécurisée et ajustable dans le cloud.

« Nous fournissons un flux de travail complet (de la préparation des échantillons à l'analyse tertiaire) dans l'environnement AWS sécurisé, ce qui permet de regrouper et d'analyser toutes les informations générées avant et après le séquençage », explique Rami Mehio, vice-président de la bioinformatique et des logiciels d'instrumentation chez Illumina. « C'est un atout pour les clients qui souhaitent suivre des échantillons dans le temps, croiser leurs données avec des bases de données publiques et recueillir des informations pour obtenir des résultats plus rapidement. »

Si les utilisateurs avancés ont la possibilité de personnaliser des outils tels qu'ICA et DRAGEN pour effectuer des recherches de niche, Illumina propose également des solutions cloud de bout en bout avec des fonctionnalités prêtes à l'emploi pour des utilisations spécifiques. Ces fonctionnalités incluent la suite logicielle TruSightTM, une solution logicielle d'analyse des variations permettant d'obtenir des informations sur des maladies rares, et TruSight Oncology 500, un test de séquençage précis pour l'analyse des tumeurs et l'identification de biomarqueurs immuno-oncologiques.

« Nous nous servons de la puissance des outils AWS comme base, ce qui nous permet de nous concentrer sur la conception d'algorithmes spécifiques à la génomique », explique M. Mehio. « À mesure que les besoins des chercheurs et des cliniciens évoluent, nous pouvons facilement déployer de nouvelles fonctionnalités et versions de nos produits. »

Réduire les coûts en faisant des économies sur AWS

Depuis sa création, Illumina a réduit le coût de la technologie génomique à un rythme supérieur au postulat de la loi de Moore. Le séquençage d'un seul génome humain coûtait plus de 100 millions de dollars en 2001. 20 ans plus tard, il peut s'élever à 600 dollars seulement.

« Nous voulons démocratiser l'accès aux technologies de la génomique. Réduire les prix pour nos clients constitue une part importante de tous ces efforts », explique Mme Tousi. « Le coût ne devrait pas être un facteur décisif pour la recherche ou les applications cliniques. Les professionnels devraient effectuer le séquençage et l'analyse seulement en fonction de la façon dont ils prévoient d'utiliser les données. »

Les classes de stockage Amazon S3 peuvent être personnalisées en fonction des différents besoins en données, ce qui permet à Illumina d'optimiser facilement les coûts. En stockant des pétaoctets de données rarement consultées dans Amazon S3 Glacier Deep Archive, les clients Illumina économisent plus de 90 % sur les coûts de stockage. De même, DRAGEN s'exécute sur des instances F1 Amazon EC2, qui offrent une capacité de calcul accélérée et abordable, capable de prendre en charge les processus parallèles dont Illumina a besoin. Les instances F1 permettent une accélération personnalisable du matériel avec une matrice de portes programmables sur site (FPGA) DRAGEN. Pour mettre DRAGEN à l'échelle sur des instances F1, l'entreprise a utilisé AWS Batch un service de traitement par lots entièrement géré qui planifie, programme et exécute des charges de travail de calcul par lots.

« AWS nous offre la possibilité d'optimiser la vitesse, la flexibilité et le coût et de répondre au cas d'utilisation et aux besoins du client final », explique M. Mehio. « Certains utilisateurs souhaitent effectuer des analyses génétiques aussi rapidement que possible, tandis que certains utilisateurs universitaires choisissent de sacrifier un peu de vitesse pour réduire les coûts et économiser des fonds de recherche. En tirant parti de différents types d'instances F1 et d'options de stockage, nos utilisateurs conservent une certaine souplesse et la possibilité d'augmenter ou de diminuer les ressources selon les besoins. »

Illumina réduit également les coûts pour ses clients en exécutant un grand nombre de tâches de calcul pour ses plateformes sur des instances Spot Amazon EC2, qui sont accessibles avec une réduction qui peut aller jusqu'à 90 % par rapport à la tarification à la demande.  « Rien que l'année dernière, nos clients ont utilisé des centaines de milliers d'heures d'instances Spot, ce qui leur a permis de réaliser d'importantes économies », indique Mme Tousi.

Les économies et les avantages techniques peuvent être combinés. Illumina a récemment migré son moteur de corrélation d'analyse tertiaire vers AWS, ce qui lui a permis de réaliser des économies tout en multipliant par six les pipelines d'ingestion de données afin d'accélérer la croissance et la puissance de la base de connaissances.

Solutions sécurisées pour le développement de la génomique mondiale

Les données génomiques humaines peuvent être associées à des informations médicales très personnelles, et les violations de données constituent un risque croissant pour les organismes de santé du monde entier. Par conséquent, la sécurité est une préoccupation majeure pour Illumina et ses clients, dont beaucoup doivent respecter des réglementations de plus en plus strictes en matière de gestion des données.

« La sécurité est à la base de tout ce que nous faisons », explique Susan Tousi. « Nous pouvons compter sur le Modèle de responsabilité partagée d'AWS pour garantir que notre infrastructure cloud sous-jacente maintient une sécurité et une conformité de niveau entreprise. En tirant parti des régions Amazon EC2 au niveau mondial, nous apportons le calcul aux données, en soutenant les clients dans toutes les régions tout en leur permettant de maintenir la souveraineté des données. »

AWS prend en charge des milliers de normes de sécurité et de certifications de conformité, notamment HIPAA, GDPR, ISO 27001 et ISO 13485, ce qui aide les clients à respecter les exigences de conformité tout au long de leurs flux de travail génomiques. Illumina offre à ses clients une tranquillité d'esprit supplémentaire en proposant la gestion des données dans Amazon Virtual Private Cloud (Amazon VPC), qui lance d'autres ressources AWS dans un réseau virtuel personnel logiquement isolé qui sépare les données d'un client de celles d'un autre.

Cette capacité de mise à l'échelle et de déploiement à l'échelle mondiale facilitent une véritable collaboration, tant pour les projets à long terme que pour les interventions rapides en cas de crise. Des chercheurs du monde entier ont traité plus de 371 000 échantillons liés au COVID-19 sur les applications BaseSpace d'Illumina en 2020 et au cours de la première moitié de 2021. « Si les clients n’avaient pu le faire que dans nos locaux, cela aurait entraîné de sérieuses difficultés. C'est pour cela que le cloud a été essentiel à la réponse à la pandémie mondiale à cette échelle », explique Mme Tousi.

Bâtir l'avenir de la génomique et de la biotechnologie

Avec l'augmentation des projets de génétique des grandes populations et un accès croissant à de puissantes solutions logicielles d'analyse comme l'ICA, Illumina adopte pleinement le pouvoir du « big data » en génomique pour aider les clients à extraire de riches informations à partir de volumes massifs de données de séquençage. Ces projets alimenteront une nouvelle ère de génomique personnalisée, permettant aux chercheurs d'établir des liens entre les gènes et les résultats de santé qui n'étaient pas évidents dans des échantillons plus petits.

Les plateformes Illumina aident également la recherche à effectuer une transition en toute simplicité vers un avenir multiomique. Par exemple, le pipeline RNA à cellule unique DRAGEN basé sur le cloud permet aux scientifiques d'annoter l'expression de gènes dans des cellules individuelles. Avec l'accélération DRAGEN, la plateforme peut traiter trois échantillons simultanément en 53 minutes environ.

« Avec ICA, DRAGEN et d'autres outils déployés sur AWS, nous fournissons des solutions qui permettent aux clients de regrouper tous les types de données, y compris les données NGS et de santé, afin d'extraire de nouvelles informations de ces grandes collections et d'améliorer la santé humaine à plus grande échelle », explique M. Mehio.

En savoir plus

Découvrez comment AWS soutient d'autres grandes organisations de sciences de la vie dans leur volonté d'améliorer la santé humaine.   


À propos d'Illumina

Illumina développe, fabrique et commercialise des systèmes intégrés pour l'analyse des variations génétiques et des fonctions biologiques.

Avantages d'AWS

  • Accès facilité à des flux de travail simplifiés, unifiés et personnalisables, de l'échantillon à l'analyse
  • Réduction drastique des coûts de calcul et de stockage avec les instances Spot Amazon EC2 et Amazon S3 Glacier
  • Déploiement d'un vaste éventail de solutions génomiques à l'échelle mondiale dans un environnement sécurisé et conforme
  • Accélération de la recherche et promotion de la collaboration avec des clients du monde entier pour traiter plus de 371 000 échantillons liés au COVID-19

Services AWS utilisés

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) est un service Web qui fournit une capacité de calcul sécurisée et redimensionnable dans le cloud. Destiné aux développeurs, il est conçu pour faciliter l'accès aux ressources de cloud computing à l'échelle du Web.

En savoir plus »

Amazon S3

Amazon Simple Storage Service (Amazon S3) est un service de stockage d'objets offrant une évolutivité, une disponibilité des données, une sécurité et des performances de pointe.


En savoir plus »

AWS Virtual Private Cloud

Amazon Virtual Private Cloud (Amazon VPC) est un service qui vous permet de lancer des ressources AWS dans un réseau virtuel logiquement isolé que vous définissezi.

En savoir plus »

Instances Spot Amazon EC2

Les instances Spot Amazon EC2 vous permettent de profiter des capacités EC2 non utilisées dans le cloud AWS. Les instances Spot sont disponibles avec une réduction allant jusqu'à 90 % par rapport aux tarifs des instances à la demande.

En savoir plus »


Démarrer

Les entreprises de toute taille et de tous les secteurs d'activités transforment chaque jour leurs activités à l'aide d'AWS. Contactez nos spécialistes et commencez dès aujourd'hui votre transition vers le Cloud AWS.