Ce guide décrit la création et l’exécution des flux de travail bioinformatiques professionnels à grande échelle. L’utilisation des services AWS pour l’automatisation, l’analyse des flux de travail, le stockage ainsi que l’observabilité opérationnelle et des coûts vous permet de suivre les bonnes pratiques DevOps afin de gérer le cycle de vie de vos flux de travail bioinformatiques. Vous pouvez utiliser cette architecture comme socle de votre propre infrastructure et mettre à jour certains aspects si nécessaire afin de l’intégrer à votre environnement et de répondre à vos besoins.

Veuillez noter : [Clause de non-responsabilité]

Diagramme d’architecture

[Description du schéma d’architecture]

Télécharger le diagramme d’architecture au format PDF 

Piliers AWS Well-Architected

Le cadre AWS Well-Architected vous permet de comprendre les avantages et les inconvénients des décisions que vous prenez lors de la création de systèmes dans le cloud. Les six piliers du cadre vous permettent d'apprendre les bonnes pratiques architecturales pour concevoir et exploiter des systèmes fiables, sécurisés, efficaces, rentables et durables. Grâce à l'outil AWS Well-Architected Tool, disponible gratuitement dans la console de gestion AWS, vous pouvez examiner vos charges de travail par rapport à ces bonnes pratiques en répondant à une série de questions pour chaque pilier.

Le diagramme d'architecture ci-dessus est un exemple de solution créée en tenant compte des bonnes pratiques Well-Architected. Pour être totalement conforme à Well-Architected, vous devez suivre autant de bonnes pratiques Well-Architected que possible.

  • Ce guide utilise AWS CodeCommit, AWS CodeBuild et AWS CodePipeline pour créer un contrôle de versions et automatiser la génération et le déploiement du code source de vos flux de travail bioinformatiques. DynamoDB vous permet également de suivre les fichiers de sortie de HealthOmics et d’exécuter des métadonnées. Ce guide utilise les bonnes pratiques DevOps pour gérer le code de vos flux de travail et vous donner une visibilité sur les métadonnées d’exécution des flux de travail. Par conséquent, vous pouvez apporter des modifications incrémentielles afin d’obtenir des résultats précis. Grâce au suivi des métadonnées d’exécution des flux de travail, vous pouvez facilement trouver l’état d’exécution des flux de travail et les fichiers de sortie pertinents à des fins de rapports en aval ou d’analyses scientifiques.

    Lire le livre blanc Excellence opérationnelle 
  • Ce guide fournit le chiffrement au repos à l’aide d’AWS Key Management Service (AWS KMS) et le chiffrement en transit pour tout le trafic réseau au moyen de DataSync. En outre, la gestion des identités et des accès (IAM) fournit un contrôle d’accès précis aux données potentiellement sensibles afin que seuls les utilisateurs autorisés puissent effectuer des actions spécifiques pour les traiter et les analyser.

    Lire le livre blanc Sécurité 
  • Ce guide vous montre comment orchestrer des flux de travail bioinformatiques gourmands en calcul à grande échelle à l’aide de HealthOmics. Ce service comporte des quotas de services, tels que le nombre de processeurs virtuels, afin d’éviter tout surprovisionnement accidentel. En outre, Amazon S3 et DynamoDB offrent une haute disponibilité grâce à la sauvegarde intégrée. Ce guide utilise également EventBridge pour recueillir les événements, tels que les pannes. Par ailleurs, Amazon SNS peut fournir des notifications en temps réel en réponse afin que vous puissiez prendre les mesures appropriées. Vous pouvez examiner rapidement les événements à l’aide d’Amazon CloudWatch, qui fournit des journaux détaillés pour vous donner une visibilité sur vos flux de travail HealthOmics et les outils sous-jacents.

    Lire le livre blanc Fiabilité 
  • Ce guide vous permet d’exécuter des flux de travail simultanés avec différentes configurations de processeur et de mémoire pour des tâches spécifiques. Vous pouvez demander des ressources en spécifiant la quantité de processeur, de mémoire et de stockage dont vous avez besoin, et HealthOmics fournit l’infrastructure appropriée. Cela vous permet d’effectuer une mise à l’échelle en fonction des besoins de votre entreprise avec les bonnes ressources.

    Lire le livre blanc Efficacité des performances 
  • Ce guide utilise un magasin de séquences HealthOmics, qui vous permet de stocker et de partager des fichiers de données génomiques à l’échelle du pétaoctet de manière efficace et à un faible coût par gigabase, offrant des économies supplémentaires par rapport à Amazon S3. En outre, vous pouvez utiliser AWS CUR pour accéder aux informations les plus détaillées sur vos coûts et votre utilisation des services AWS, identifier les domaines à optimiser et comprendre les tendances de votre entreprise en fonction d’attributs tels que les projets, les départements ou les utilisateurs.

    Lire le livre blanc Optimisation des coûts 
  • Ce guide utilise des services gérés et sans serveur qui vous permettent d’éviter de provisionner et de gérer votre propre infrastructure, vous offrant la possibilité de réduire l’impact environnemental de vos projets. HealthOmics fournit des ressources uniquement lorsque vous demandez l’exécution d’un flux de travail, et les décompose une fois l’exécution terminée. De même, Lambda vous permet d’exécuter des tâches plus petites en tant que fonctions sans provisionner vos propres serveurs.

    Lire le livre blanc Durabilité 

Ressources d'implémentation

Un guide détaillé d'expérimentation et d'utilisation est fourni dans votre compte AWS. Chaque étape de la construction du guide, y compris le déploiement, l'utilisation et le nettoyage, est examinée pour le préparer au déploiement.

L'exemple de code est un point de départ. Il s'agit d'un document validé par l'industrie, prescriptif mais non définitif, et d'un aperçu pour vous aider à commencer.

Avis de non-responsabilité

Les exemples de code, les bibliothèques de logiciels, les outils de ligne de commande, les preuves de concept, les modèles ou toute autre technologie connexe (y compris tout ce qui précède qui est fourni par notre personnel) vous sont fournis en tant que contenu AWS en vertu du contrat client AWS ou de l'accord écrit pertinent entre vous et AWS (selon le cas). Vous ne devez pas utiliser ce contenu AWS dans vos comptes de production, ni sur des données de production ou autres données critiques. Vous êtes responsable des tests, de la sécurisation et de l'optimisation du contenu AWS, tel que les exemples de code, comme il convient pour une utilisation en production, en fonction de vos pratiques et normes de contrôle de qualité spécifiques. Le déploiement de contenu AWS peut entraîner des frais AWS pour la création ou l'utilisation de ressources payantes AWS, telles que l'exécution d'instances Amazon EC2 ou l'utilisation du stockage Amazon S3.

Les références à des services ou organisations tiers dans ce guide n'impliquent pas une approbation, un parrainage ou une affiliation entre Amazon ou AWS et le tiers. Les conseils fournis par AWS constituent un point de départ technique, et vous pouvez personnaliser votre intégration avec des services tiers lorsque vous déployez l'architecture.

Cette page vous a-t-elle été utile ?