L'analyse secondaire génomique avec AWS Step Functions et AWS Batch crée un environnement évolutif sur AWS pour développer, créer, déployer et exécuter des pipelines d'analyse secondaire génomique, par exemple, le traitement de séquences brutes de génomes entiers en appels de variantes. Cette solution comprend l'intégration et la livraison continues (CI/CD) à l'aide des référentiels de code source AWS CodeCommit et d'AWS CodePipeline pour créer et déployer des mises à jour à la fois des flux de travail génomiques et de l'infrastructure qui prend en charge leur exécution. Cette solution tire parti des principes et des bonnes pratiques de l'Infrastructure as Code qui permettent une évolution rapide.
Des tableaux de bord opérationnels Amazon CloudWatch sont déployés pour surveiller le statut et les performances des pipelines et des outils. Déployez cette solution pour vos projets d'analyse et de recherche en génomique.
Présentation
Le diagramme ci-dessous présente l'architecture que vous pouvez créer à l'aide de l'exemple de code sur GitHub.

Architecture de l'analyse secondaire génomique avec AWS Step Functions et AWS Batch
Le code crée quatre piles CloudFormation dans votre compte AWS, notamment la pile setup pour installer la solution. Les autres piles comprennent une pile de zone de destination (zone) contenant les ressources et les artefacts courants de la solution, une pile de pipeline de déploiement (pipe) qui définit le pipeline CI/CD de la solution et une pile de code base (code) qui fournit les outils, les définitions de flux de travail et le code source de l'environnement d'exécution des tâches.
La pile setup crée un projet AWS CodeBuild contenant le script setup.sh. Ce script crée les piles restantes CloudFormation et fournit le code source du référentiel pipe et du référentiel code AWS CodeCommit une fois qu'ils ont été créés.
La pile de zone de destination (zone) crée le référentiel pipe CodeCommit, un évènement Amazon CloudWatch et le pipeline AWS CodePipeline pipe qui définit le pipeline d'intégration continue/diffusion continue (CI/CD) du flux de travail génomique. La pile de pipeline de déploiement (pipe) crée le référentiel code CodeCommit, un évènement Amazon CloudWatch et le pipeline code CodePipeline.
Le pipeline code CodePipeline déploie la pile CloudFormation de code base (code). Les ressources déployées dans votre compte comprennent des compartiments Amazon Simple Storage Service (Amazon S3), des référentiels CodeCommit pour le code source, des projets AWS CodeBuild, des pipelines AWS CodePipeline, des référentiels d'images Amazon Elastic Container Registry (Amazon ECR), un exemple de machine d'état AWS Step Functions et des environnements de calcul, des files d'attente de tâches et des définitions de tâche AWS Batch. Un exemple de tableau de bord Amazon CloudWatch permet de surveiller la charge de travail opérationnelle. Au total, cette solution permet de créer et de déployer les mises à jour à la fois des flux de travail génomiques et de l'infrastructure qui prend en charge leur exécution.
Analyse secondaire génomique avec AWS Step Functions et AWS Batch
Version 1.0.3
Dernière mise à jour : 05/2021
Auteur : AWS
Fonctions
Fournir un environnement évolutif dans AWS pour exécuter des projets d'analyse et de recherche en génomique
Tirer parti de l'intégration et de la livraison continues (CI/CD)
Tirer parti des bonnes pratiques de l'Infrastructure as Code
Modifier pour vos projets d'analyse et de recherche en génomique

Parcourez notre bibliothèque de solutions AWS pour obtenir des réponses aux problèmes architecturaux courants.

Trouvez des partenaires AWS certifiés pour vous aider à démarrer.

Trouvez des diagrammes d'architecture prescriptifs, des exemple de code et du contenu technique pour les cas d'utilisation courants.