Tarification AWS HealthOmics

Présentation

Avec AWS HealthOmics, vous ne payez que ce que vous utilisez. La facture est calculée suivant le volume de données stockées et les instances de calcul utilisées pour traiter vos flux de travail. Avec AWS HealthOmics, vous pouvez stocker des objets de données de séquence et de référence ou des données de variantes et d'annotation. Vous pouvez également exécuter des flux de travail bio-informatiques pour analyser et transformer des données omiques – génomiques, transcriptomiques, etc. AWS HealthOmics est optimisé pour le stockage et le calcul de données omiques et se combine avec d'autres services AWS, tels qu'Amazon SageMaker, Amazon Simple Storage Service (S3) et Amazon Athena.

Offre gratuite

Dans le cadre de l'offre gratuite d'AWS, vous pouvez commencer à utiliser AWS HealthOmics gratuitement. Votre offre gratuite commence à partir du premier mois où vous créez votre première ressource AWS HealthOmics. Les informations concernant l'offre gratuite d'AWS HealthOmics figurent dans le tableau ci-dessous.

 

Utilisation mensuelle de l'offre gratuite pendant les deux premiers mois

Stockage AWS HealthOmics 1 500 gigabases (Gb) par mois en classe de stockage actif et 1 500 gigabases (Gb) par mois en classe de stockage d'archives
Flux de travail AWS HealthOmics

275 heures d'instance omics.m.xlarge ou instances de calcul équivalentes, et 49 000 gigabases (Gb) par heure de stockage actif

Analytique AWS HealthOmics 200 gigaoctets (Go) par mois

Tarification du stockage AWS HealthOmics

Lorsque vous stockez des séquences génomiques dans le stockage AWS HealthOmics, le tarif de stockage est libellé en gigabases (Gb) par mois. Un gigabase (Gb) représente un milliard de bases de vos fichiers de séquence importés (p. ex. FASTQ, BAM et CRAM). Le stockage AWS HealthOmics stocke les bases, les scores de qualité, les alignements et d'autres métadonnées de vos fichiers source. Vous payez aux gigabases stockés, vous n'avez donc pas à vous soucier des formats de fichiers ou des techniques de compression optimaux. AWS HealthOmics s'en charge.

Les objets de séquence sont appelés « jeux de lectures » et sont l'équivalent logique d'un fichier FASTQ, BAM ou CRAM. Avec le stockage AWS HealthOmics, vous disposez d'une classe de stockage active et d'une classe de stockage d'archives pour vos jeux de lectures. Le coût mensuel du stockage des jeux de lecture dans la classe d'archives est inférieur à celui dans la classe active. Les jeux de lecture de la classe active sont accessibles en quelques millisecondes, tandis que les jeux de lecture de la classe archive doivent être activés avant d'être accessibles. Au bout de 30 jours, les jeux de lectures qui n'ont pas été lus sont automatiquement déplacés dans la classe de stockage d'archives, moins chère, jusqu'à ce qu'ils soient réactivés.

Les jeux de lectures n'entraînent pas de frais d'importation. Les données de stockage AWS HealthOmics sont facturées pour une durée de stockage minimale de 30 jours. Les données supprimées avant 30 jours engendrent des frais au prorata équivalant aux frais de stockage pour les jours restants. Le stockage AWS HealthOmics est conçu pour les données à longue durée de vie, consultées peu fréquemment et conservées pendant des années.

Vous payez les requêtes GET adressées à vos objets de jeux de lecture. Tous les autres types de demandes adressées aux jeux de lectures sont gratuite.

Tarification de l'analytique AWS HealthOmics

L'analytique AWS HealthOmics vous aide à préparer vos données de variantes génomiques et d'annotations génomiques pour les exploiter dans le large éventail de services d'analytique et de machine learning d'AWS, par exemple Amazon Athena et Amazon SageMaker. Vous pouvez stocker n'importe quelle quantité de données de variantes génomiques ; vous payez uniquement ce que vous stockez. La taille des données est définie comme la taille des données transformées. Toutefois, lorsque vous demandez et analysez les données dans d'autres services, vous payez pour l'utilisation de ces services.

Les données d'analytique AWS HealthOmics sont facturées pour une durée de stockage minimale de 30 jours. Les données supprimées avant 30 jours engendrent des frais au prorata équivalant aux frais de stockage pour les jours restants.

Tarification des flux de travail privés et Ready2Run d'AWS HealthOmics

AWS HealthOmics gère également l'exécution des flux de travail bio-informatiques avec des flux de travail privés et Ready2Run.

Les flux de travail privés vous permettent d'apporter vos propres scripts bio-informatiques écrits dans les langages de flux de travail les plus couramment utilisés. Vous pouvez exécuter des flux de travail privés en une seule exécution. Vous ne payez que pour ce que vous utilisez et êtes facturé séparément pour les types d'instances omiques et le stockage des exécutions. Toutes les tâches de votre flux de travail sont mappées à l'instance qui convient le mieux à ses ressources définies. Par exemple, une tâche définie pour utiliser 8 processeurs et 60 Go de RAM sera mappée au type d'instance omics.r.2xlarge pour son exécution.

Les flux de travail Ready2Run sont des flux de travail prédéfinis qui ont été regroupés par des éditeurs de logiciels tiers et des pipelines open source. Vous pouvez simplement utiliser les flux de travail Ready2Run pour traiter vos données avec les flux de travail les plus couramment utilisés tels que Germline et GATK-BP. Les flux de travail Ready2Run sont payants à l'exécution, ce qui signifie que le même prix vous est facturé pour chaque flux de travail.

Pour les flux de travail privés et Ready2Run, les journaux des flux de travail sont stockés dans Amazon CloudWatch Logs sur votre compte et facturés dans CloudWatch tant que vous décidez de les conserver. Vous pouvez configurer le service pour consigner l'utilisation des ressources par exécution pour simplifier la budgétisation, la planification et la comptabilité.

  • Flux de travail privés
  • Flux de travail Ready2Run

Exemples de tarification

Exemple 1

Une initiative de séquençage de la population est lancée pour séquencer des individus d'une biobanque préalablement collectée. Le programme concerne la région UE Ouest (Irlande). 100 000 individus sont concernés, à 130 gigabases chacun. Les données de séquence brutes sont stockées sur le stockage AWS HealthOmics. Au cours des cinq années suivantes, les données seront conservées dans la classe de stockage d'archives après les 30 jours suivant leur importation et seront lues deux fois, en moyenne, lorsqu'elles passeront dans la classe de stockage active pour 30 jours. Chaque génome est téléchargé en 500 fragments, et génère 500 appels d'API GET. Voici le calcul du coût total d'un seul génome pour cinq ans :
Classe de stockage active : 0,005769 USD gigabase/mois * 130 gigabases * 90 jours = 2,22 USD
Classe de stockage d'archives : 0,001154 USD gigabase/mois * 130 gigabases * (1825 – 90) jours = 8,56 USD.
API GET : 0,005 USD / 1 000 appels d'API * (2 * 500 appels d'API) = 0,005 USD
Coût total pour 5 ans : 2,22 USD + 8,56 USD + 0,005 USD = 10,79 USD (soit 2,16 USD/an)

Exemple 2

Une bio-informaticienne veut exécuter un flux de travail Nextflow dans les flux de travail AWS HealthOmics dans la région USA Est (Virginie du Nord). Son flux de travail contient trois tâches. La première réserve 16 vCPU et 30 Go de mémoire pour 3 heures d'exécution. La deuxième requiert 32 vCPU et 160 Go de mémoire pour 2 heures d'exécution. La troisième réserve 4 vCPU et 10 Go de mémoire pour 10 minutes d'exécution. Le client enregistre le flux de travail et appelle l'API StartRun avec le fichier système par défaut de 1 200 Go. Voici le calcul du coût total :
Tâche 1 (omics.c.4xlarge) : 0,9180 USD/h * 3 h = 2,754 USD
Tâche 2 (omics.r.8xlarge) :
2,7216 USD/h * 2 h = 5,4432 USD
Tâche 3 (omics.m.xlarge) : 0,2592 USD/h * 1/6 h = 0,0432 USD
Stockage : 0,0001918 USD/ Go-heure * (1 200Go*(3 h+2 h+1/6 h)) = 1,18916 USD
Total : 9,42956 USD

Exemple 3

Un scientifique des données souhaite analyser 3 202 fichiers au format Variant Call Format (VCF) dans Amazon Athena dans la région USA Est (Virginie du Nord). Il crée un stockage de variantes et ingère ces fichiers au moyen des API AWS HealthOmics. Les données ingérées ont un volume de 1,5 To. Au cours du mois suivant, il exécute 1 000 requêtes dans Athena, et calcule les fréquences alléliques pour différentes sous-populations, chacune consommant en moyenne 50 Go. Le calcul du coût mensuel total est le suivant :
Stockage de variant : 0,035 USD Gb/mois * (1 024 Go/To * 1,5 To) = 53,76 USD
Amazon Athena : 5 USD / To * 1 000 * 50 / 1 024 = 244,14 USD

Exemple 4

Un informaticien souhaite exécuter le flux de travail Ready2Run Ready2Run de la lignée germinale GATK-BP fq2vcf pour 30 génomes dans la région USA Est (Virginie du Nord) pour 3 échantillons. Le client saisit ses données et appelle l'API StartRun pour chaque échantillon. Le coût des 3 courses est de :
GATK-BP Germline fq2vcf pour le flux de travail Ready2Run à génome 30x : 10,00 USD/exécution * 3 = 30,00 USD
Total : 30,00 USD

Ressources de tarification supplémentaires

Calculateur de tarification AWS

Calculez simplement vos coûts mensuels avec AWS

Centre de ressources d'optimisation des coûts du cloud

Contacter les spécialistes AWS pour obtenir un devis personnalisé