L'Icahn School of Medicine at Mount Sinai, à New York, est un leader à la reconnaissance internationale dans la formation médicale et scientifique, la recherche biomédicale et les soins aux patients. L'institution travaille pour étendre les connaissances biomédicales, offrir des soins cliniques de qualité et être au service de la communauté. En collaborant étroitement avec le Mount Sinai Hospital, l'Icahn School of Medicine prend en charge une des populations de patients les plus diverses et complexes du monde.

Les chercheurs et les médecins de l'Icahn School of Medicine essaient de découvrir les secrets génétiques des cancers du sein et des ovaires. Les docteurs John A. Martignetti et Peter R. Dottino du Mount Sinai Hospital et leurs collaborateurs de Station X explorent plus de 2 000 séquences ADN de lignées germinales et de tumeurs du sein et des ovaires, générées par The Cancer Genome Atlas Consortium (TCGA). TCGA représente un effort coordonné et complet pour accélérer notre compréhension de la base moléculaire du cancer par l'application de technologies d'analyse du génome, notamment pour le séquençage de génome à grande échelle. Il s'agit d'un projet commun du National Cancer Institute (Institut national du cancer, ou NCI) et du National Human Genome Research Institute (institut national de recherche sur le génome humain, ou NHGRI), deux des vingt-sept instituts et centres des instituts nationaux de la santé du département américain de la Santé et des Services sociaux.

C'est un problème important qui exige une puissance de calcul considérable, car les scientifiques doivent analyser plus de 100 To de données, formuler de nouvelles hypothèses et analyser de nouveau les données. On retrouve des mutations de lignée germinale des gènes BRCA1 ou BRCA2 chez près de la moitié des femmes présentant un risque génétique héréditaire de développer un de ces cancers. Les chercheurs tentent de trouver les liens génétiques manquants chez celles qui ne sont pas porteuses d'une mutation BRCA1/2.

En collaborant avec Station X, les docteurs Martignetti et Dottino ont pu faire appel aux services d'un prestataire de solution capable de fournir une plate-forme d'analyse fiable et sécurisée sur laquelle travailler. Station X a développé GenePool™, une plate-forme logicielle de génomique pour les scientifiques et les cliniciens qui travaillent sur les données du génome humain, que ce soit à un stade de recherche précoce ou dans un contexte clinique.

Explorer des informations pesant quelques téraoctets de données génomiques, et vérifier que ces informations sont sécurisées, nécessite une plate-forme aussi performante que flexible, avec un stockage de type Big Data (données volumineuses) et un contrôle des accès très strict. L'ensemble de ces tâches s'accordait parfaitement avec le cloud computing.

Amazon Web Services (AWS) constitue le socle de la plate-forme de génomique de Station X, nommée GenePool, qui peut être mise à l'échelle de façon dynamique pour analyser des dizaines de milliers de génomes en quelques minutes. « AWS représente une solution naturelle pour l'élaboration d'environnements logiciels », indique Sandeep Sanga, vice-président de la section Produits pour Station X. « Nous avons construit GenePool sur AWS pour fournir aux chercheurs un emplacement leur permettant de gérer et d'analyser d'énormes quantités de données. Nous avons choisi AWS pour la quantité des services proposés et leur compétitivité. » L'utilisation d'AWS a permis aux équipes de Station X de se concentrer sur la conception de la plate-forme GenePool, destinée à aider les chercheurs à analyser rapidement et en toute sécurité leurs données séquencées.

Pour les chercheurs du Mount Sinai Hospital, il est essentiel que les données des patients soient en sécurité. « Le maintien de la confidentialité de nos patients est notre priorité, en particulier avec le grand volume de données généré, explique le Dr Martignetti. Ce n'est pas un simple point de détail. Cependant, en utilisant AWS et GenePool, nous respectons les standards en matière de confidentialité. » En utilisant AWS, Station X peut proposer aux chercheurs ayant reçu une approbation au préalable un accès aux données à accès contrôlé de The Cancer Genome Atlas, ce qui permet aux utilisateurs autorisés « de calculer et d'interpréter les mutations somatiques et de lignées germinales de patientes souffrant d'un cancer du sein ou des ovaires », explique Sandeep Sanga.

Le Mount Sinai Hospital utilise AWS Identity and Access Management (IAM) pour l'authentification des utilisateurs et traite le contrôle et la gestion des accès aux comptes AWS Access Control Lists (ACL) pour fournir une gestion des informations d'identification et des utilisateurs sécurisée et centralisée. Amazon Simple Notification Service (Amazon SNS) et Amazon Simple Email Service (Amazon SES) offrent des services de messagerie sortante pour les administrateurs comme les utilisateurs finaux qui ont besoin de notifications et d'alertes.

Elastic Load Balancing aide Station X à disposer d'une architecture web et API évolutive, sécurisée et solide dans son environnement Amazon VPC, en isolant les magasins de données et les niveaux intermédiaires de l'exposition du réseau à Internet. « Grâce à l'isolement de nos magasins de données et des niveaux intermédiaires de l'exposition du réseau à Internet, tous nos serveurs restent privés, ce qui nous permet d'alléger considérablement nos procédures de sécurité », explique Sandeep Sanga.

Les chercheurs du Mount Sinai Hospital utilisent le cloud AWS pour gérer et extraire des informations significatives des montagnes de données génomiques stockées sur Amazon Simple Storage Service (Amazon S3), avec un stockage supplémentaire sur Amazon Glacier.

Station X utilise le stockage de Amazon Elastic Block Store (Amazon EBS) pour les données critiques de grande valeur, afin d'arriver à un système de stockage haute performance et flexible, capable de traiter de grands volumes de données précalculés pour une analyse génomique en temps réel.

Amazon Elastic Compute Cloud (Amazon EC2) alimente les modèles statistiques, les fonctionnalités de filtrage visuelle et l'intégration riche avec les bases de données d'annotation génomique comme clinique de GenePool. De plus, Amazon EC2 prend en charge l'intégration grâce aux services web RESTful. « La nature élastique d'Amazon EC2 nous permet de traiter et d'analyser des données importantes d'une façon économique et avec une évolutivité dynamique », déclare Sandeep Sanga. Le Mount Sinai Hospital utilise un espace de stockage Amazon S3 dédié pour s'assurer que les données génomiques de ses patients sont stockées en toute sécurité et préparées pour une analyse dans GenePool. L'illustration 1 représente l'architecture du Mount Sinai Hospital.

mount-sinai-arch-diag

Illustration 1. Architecture de la recherche au Mount Sinai Hospital

Afin de s'assurer du bon fonctionnement de ses systèmes, GenePool utilise Amazon CloudWatch pour la surveillance. Amazon ElastiCache fournit un mécanisme de mise en cache centralisé qui permet aux résultats d'analyses de larges ensembles de données d'être renvoyés rapidement. « Les scientifiques sont capables de répondre à des questions critiques en quelques minutes ou secondes grâce à la plate-forme logicielle génomique que nous avons conçue sur AWS », explique Sandeep Sanga.

En utilisant AWS et GenePool, les docteurs Martignetti et Dottino peuvent maintenant exploiter rapidement des milliers de dossiers médicaux des projets de The Cancer Genome Atlas et identifier les aberrations génétiques dans des nouveaux gènes candidats qui correspondent à leur hypothèse scientifique. En croisant les données de ces gènes candidats avec d'autres données génomiques, les docteurs Martignetti et Dottino ont été capables d'enrichir la liste des gènes candidats pour un marqueur potentiel des cancers héréditaires du sein et des ovaires.

« Avant le cloud AWS, nous ne pouvions pas analyser un tel ensemble de données avec nos collaborateurs externes, affirme le Dr Martignetti. Il n'aurait pas été possible de trier les données d'une façon pertinente, de les analyser et de les refiltrer, alors que tout ce processus est nécessaire pour trouver les liens manquants. »

« La conception de GenePool sur AWS donne à Station X la capacité de stocker des ensembles de données pour nos clients génomiques translationnels et cliniques, déclare le Dr Sanga. Grâce à AWS, nous avons distancé nos concurrents avec un accès aux données rapide, un stockage d'envergure et une puissance de calcul importante. Les projets de recherche tels que celui-ci ne sont jamais finis. Il y aura toujours des données supplémentaires à analyser. Alors, même quand nous aidons les chercheurs à tirer des conclusions scientifiques, il y a toujours plus à apprendre. En utilisant AWS, nous sommes prêts à faire face à ce défi. »

Sans la capacité d'exécuter cette analyse d'une manière sécurisée sur le cloud AWS, les médecins du Mount Sinai Hospital n'auraient pas pu continuer leurs recherches. « Avec AWS, nous pouvons stocker les fichiers sources d'une manière sécurisée et économique, tout en bénéficiant d'une durabilité et d'une accessibilité importantes. Nous n'aurions pas été capables de réaliser nos recherches sans AWS, affirme le docteur Martignetti. En utilisant AWS et GenePool, nous espérons découvrir les mutations qui se révèlent être les liens manquants expliquant pourquoi certaines femmes ont plus de risques de développer ces cancers. »

Pour en savoir plus sur la génomique dans le cloud, consultez la page dédiée à la génomique sur AWS.