Le laboratoire de médecine personnalisée du Centre pour l'informatique biomédicale de la Faculté de médecine d'Harvard, dirigé par le Dr Peter Tonellato, a combiné les technologies de séquençage à haut débit et de collection de données biomédicales à la flexibilité d'Amazon Web Services (AWS) afin de développer, en un temps record, des modèles de tests portant sur l'analyse du génome complet. "La combinaison de notre approche de l'informatique biomédicale et d'AWS nous a permis de consacrer notre temps et notre énergie au développement de la simulation plutôt qu'à la technologie, ce qui nous a permis d'obtenir un résultat plus rapide," a déclaré Tonellato. “Sans les avantages de AWS, nous n'aurions certainement pas progressé autant.”

Le laboratoire de Tonellato se consacre à la médecine personnalisée (un programme de prévention médicale pour les individus basé sur leurs caractéristiques génétiques) en créant des modèles et des simulations permettant d'évaluer la valeur clinique des nouveaux tests génétiques.

D'autres projets incluent la simulation d'importantes populations de patients, pour aider les simulations d'essai clinique et les prédictions. Pour contourner la difficulté que représente l'impossibilité de trouver suffisamment de patients pour le modèle, LPM crée des avatars de patient ; littéralement des patients "virtuels". Le laboratoire créé différents ensembles d'avatar pour différents tests génétiques et multiplie ensuite un grand nombre d'entre eux sur la base des caractéristiques des populations hospitalières. Tonellato avait besoin de trouver un moyen efficace de manipuler de nombreux avatars, parfois jusqu'à 100 millions à la fois. "Non seulement nous avons besoin de traiter d'énormes quantités de données, "dit-il "mais je voulais aussi être capable de concevoir un système où les chercheurs postdoctorant puissent estimer une situation de risque génétique, déterminer la simulation et l'analyse appropriée pour créer les avatars et construire ensuite rapidement les applications web pour faire fonctionner les applications, plutôt que de perdre leur temps dépanner la technologie informatique."

En 2006, Tonellato s'est tourné vers le cloud computing pour répondre aux besoins informatiques complexes et à haute variabilité. "J'ai évalué plusieurs alternatives mais je n'ai rien trouvé d'aussi flexible et d'aussi robuste que Amazon Web Services," dit-il. Ayant précédemment construit des centres de données, Tonellato ne pouvait pas se permettre de prendre le temps qu'il savait nécessaire à la mise en place de serveurs pour ensuite écrire le code. Au lieu de cela, il a décidé d'effectuer un test pour voir à quelle vitesse son équipe pouvait assembler une série d'images machine Amazon (AMI) pour correspondre à l'environnement optimal de développement pour les applications Web des chercheurs.

Le laboratoire de Tonellato se concentre désormais sur l'intégration d'instances ponctuelles dans les flux de travail afin de pouvoir rentabiliser encore davantage sa subvention. Tonellato explique : « Nous avons recours à des instances ponctuelles lorsque nous exécutons des clusters Amazon Elastic Compute Cloud(Amazon EC2) afin d'analyser des génomes entiers. Nous avons le potentiel d'exécuter encore plus de nœuds de travail à moindre coût en utilisant des instances ponctuelles, ce qui constitue pour nous une énorme économie à la fois de temps et d'argent. Pour profiter de ces économies, il nous a juste fallu une journée d'ingénierie, et nous avons abaissé nos coûts d'environ 50 %. » Le laboratoire de Tonellato tire avantage des outils StarCluster du MIT, qui intègrent des fonctionnalités permettant de gérer un cluster de moteurs réseau Oracle sur les instances ponctuelles. Erik Gafni, programmeur dans le laboratoire de Tonellato, a effectué l'intégration de StarCluster dans notre flux de travail. Selon Gafni, « En utilisant StarCluster, il fut incroyablement facile de configurer, lancer et commencer à utiliser un cluster ponctuel en exécution en moins de 10 minutes. »

Le LPM a de plus identifié le besoin en ressources publiées sur comment utiliser le cloud computing efficacement dans un environnement académique et a publié une introduction éducative dans PloS Computational Biology pour répondre à ce besoin. "Nous croyons que cet article montre clairement comment une laboratoire académique peut utiliser AWS efficacement pour gérer ses besoins informatiques. Il démontre aussi comment penser les problèmes informatiques en rapport avec les coûts et les ressources informatiques d'AWS," explique Vincent Fusaro, auteur principal et directeur de recherche au LPM.

"La solution AWS est stable, robuste, flexible et économique," a commenté Tonellato. "On ne peut que la recommander".

Tonellato exécute sa simulation sur Amazon EC2, qui fournit aux clients des capacités de calcul évolutives dans le cloud. Conçue pour faciliter l'informatique à l'échelle d'internet pour les développeurs, Amazon EC2 rend possible la création et la mise en service de capacités informatiques dans le cloud en quelques minutes.

Le laboratoire de Tonellato est enchanté de sa solution AWS. "Le nombre de tests génétiques disponibles pour les docteurs et les hôpitaux est en constante augmentation" a expliqué Tonellato, "et ceux-ci peuvent être très chers. Nous cherchons à déterminer quels tests permettront d'obtenir de meilleurs soins pour le patient et de meilleurs résultats." Il a ajouté, "Nous pensons que nos modèles peuvent considérablement réduire le temps nécessaire pour identifier les tests, les protocoles et les essais qu'il faut accomplir pour obtenir l'homologation FDA et l'utilisation clinique."

Pour en savoir plus sur la façon dont AWS peut vous aider à répondre à vos besoins en matière de Big Data, consultez notre page dédiée au Big Data.

Pour en savoir plus sur la génomique dans le cloud, consultez la page dédiée à AWS pour la génomique.