Analyse secondaire génomique avec AWS Step Functions et AWS Batch

L'analyse secondaire génomique avec AWS Step Functions et AWS Batch crée un environnement évolutif sur AWS pour développer, créer, déployer et exécuter des pipelines d'analyse secondaire génomique, par exemple, le traitement de séquences brutes de génomes entiers en appels de variantes. Cette solution comprend l'intégration et la livraison continues (CI/CD) à l'aide des référentiels de code source AWS CodeCommit et d'AWS CodePipeline pour créer et déployer des mises à jour à la fois des flux de travail génomiques et de l'infrastructure qui prend en charge leur exécution. Cette solution tire parti des principes et des bonnes pratiques de l'Infrastructure as Code qui permettent une évolution rapide.

Des tableaux de bord opérationnels Amazon CloudWatch sont déployés pour surveiller le statut et les performances des pipelines et des outils. Déployez cette solution pour vos projets d'analyse et de recherche en génomique.

Présentation

Le diagramme ci-dessous présente l'architecture que vous pouvez créer à l'aide de l'exemple de code sur GitHub.

Architecture de l'analyse secondaire génomique avec AWS Step Functions et AWS Batch

Le code crée quatre piles CloudFormation dans votre compte AWS, notamment la pile setup pour installer la solution. Les autres piles comprennent une pile de zone de destination (zone) contenant les ressources et les artefacts courants de la solution, une pile de pipeline de déploiement (pipe) qui définit le pipeline CI/CD de la solution et une pile de code base (code) qui fournit les outils, les définitions de flux de travail et le code source de l'environnement d'exécution des tâches.

La pile setup crée un projet AWS CodeBuild contenant le script setup.sh. Ce script crée les piles restantes CloudFormation et fournit le code source du référentiel pipe et du référentiel code AWS CodeCommit une fois qu'ils ont été créés.

La pile de zone de destination (zone) crée le référentiel pipe CodeCommit, un évènement Amazon CloudWatch et le pipeline AWS CodePipeline pipe qui définit le pipeline d'intégration continue/diffusion continue (CI/CD) du flux de travail génomique. La pile de pipeline de déploiement (pipe) crée le référentiel code CodeCommit, un évènement Amazon CloudWatch et le pipeline code CodePipeline.

Le pipeline code CodePipeline déploie la pile CloudFormation de code base (code). Les ressources déployées dans votre compte comprennent des compartiments Amazon Simple Storage Service (Amazon S3), des référentiels CodeCommit pour le code source, des projets AWS CodeBuild, des pipelines AWS CodePipeline, des référentiels d'images Amazon Elastic Container Registry (Amazon ECR), un exemple de machine d'état AWS Step Functions et des environnements de calcul, des files d'attente de tâches et des définitions de tâche AWS Batch. Un exemple de tableau de bord Amazon CloudWatch permet de surveiller la charge de travail opérationnelle. Au total, cette solution permet de créer et de déployer les mises à jour à la fois des flux de travail génomiques et de l'infrastructure qui prend en charge leur exécution.

Analyse secondaire génomique avec AWS Step Functions et AWS Batch

Version 1.0.3
Dernière mise à jour : 05/2021
Auteur : AWS

Ce guide vous a-t-il été utile ?
Donner mon avis 

Fonctions

Fournir un environnement évolutif dans AWS pour exécuter des projets d'analyse et de recherche en génomique

Créez un environnement évolutif dans AWS pour développer, créer, déployer et exécuter des pipelines d'analyse secondaire génomique, tels que le traitement de séquences brutes de génome entier dans des appels de variantes.

Tirer parti de l'intégration et de la livraison continues (CI/CD)

Utilisez des référentiels de code source AWS CodeCommit et AWS CodePipeline pour créer et déployer les mises à jour des flux génomiques et de l'infrastructure qui soutient leur exécution.

Tirer parti des bonnes pratiques de l'Infrastructure as Code

Faites évoluer rapidement la solution en utilisant les principes et bonnes pratiques de l'Infrastructure as Code.

Modifier pour vos projets d'analyse et de recherche en génomique

Modifiez la solution pour l'adapter à vos besoins particuliers, par exemple, en ajoutant de nouveaux outils conteneurisés et en créant des flux de travail. Chaque changement sera suivi par le pipeline CI/CD, facilitant la gestion du contrôle des changements, les restaurations et l'audit.
Icône Créer
Déployez vous-même une solution AWS

Parcourez notre bibliothèque de solutions AWS pour obtenir des réponses aux problèmes architecturaux courants.

En savoir plus 
Trouver un partenaire APN
Trouvez une solution Partenaire AWS

Trouvez des partenaires AWS certifiés pour vous aider à démarrer.

Icône Explorer
Explorer les conseils

Trouvez des diagrammes d'architecture prescriptifs, des exemple de code et du contenu technique pour les cas d'utilisation courants.

En savoir plus