Publié le: Jul 10, 2020

Genomics Tertiary Analysis and Data Lakes Using AWS Glue and Amazon Athena est une nouvelle implémentation de solutions AWS qui crée un environnement évolutif au sein d’AWS afin de préparer les données génomiques pour une analyse à grande échelle et d’effectuer des requêtes interactives dans un lac de données génomiques. La solution montre comment 1) développer, empaqueter et déployer des bibliothèques utilisées pour la conversion des données génomiques, 2) fournir des pipelines d'ingestion de données pour la préparation et le catalogage des données génomiques et 3) exécuter des requêtes interactives dans un lac de données génomiques. La solution utilise AWS CloudFormation pour automatiser son déploiement dans le Cloud AWS et comprend l'intégration et la livraison continues (IC/DC) à l'aide des référentiels de code source AWS CodeCommit et AWS CodePipeline afin de créer et de déployer des mises à jour pour les tâches de préparation des données, les analyseurs, les carnets d’analyse de données et l'infrastructure du lac de données. Cette solution tire parti des principes et des bonnes pratiques de l'infrastructure en tant que code (IaC) qui permettent une évolution rapide.

Pour en savoir plus sur la solution « Genomics Tertiary Analysis and Data Lakes Using AWS Glue and Amazon Athena », consultez la page d’implémentation des solutions Web AWS.

D'autres offres AWS Solutions sont disponibles sur la page d’implémentation des solutions Web AWS, où les clients peuvent parcourir les solutions par catégorie de produits ou par secteur d'activité pour trouver des implémentations de référence AWS automatisées et clés en main qui répondent à des besoins métier spécifiques.