Información general

Con AWS HealthOmics, solo paga por lo que usa. Se cobra en función de la cantidad de datos que se almacenan y de las instancias de computación que se utilizan para procesar el flujo de trabajo. Al utilizar AWS HealthOmics, se pueden almacenar objetos de datos de secuencias y referencias o variantes y datos de anotaciones. También se pueden ejecutar flujos de trabajo de biocomputación para analizar y transformar datos genómicos, transcriptómicos y otros datos ómicos. AWS HealthOmics está optimizado para el almacenamiento y la computación de datos ómicos y funciona con otros servicios de AWS, como Amazon SageMaker, Amazon Simple Storage Service (S3) y Amazon Athena.

Nivel gratuito

Como parte del nivel gratuito de AWS, puede comenzar a utilizar AWS HealthOmics sin cargo. El nivel gratuito comienza a partir del primer mes, al crear el primer recurso de AWS HealthOmics. En la siguiente tabla encontrará información detallada sobre el nivel gratuito de AWS HealthOmics.

 

Uso del nivel gratuito al mes durante los dos primeros meses

Almacenamiento de AWS HealthOmics 1500 gigabases-meses en la clase de almacenamiento activo y 1500 gigabases-meses en la clase de almacenamiento de archivo
Flujos de trabajo de AWS HealthOmics

275 horas de instancia omics.m.xlarge o instancias de computación equivalentes y 49 000 GB-horas de almacenamiento de ejecución

Análisis de AWS HealthOmics 200 gigabytes-meses

Precios de almacenamiento de AWS HealthOmics

El almacenamiento de secuencias genómicas en AWS HealthOmics se paga por gigabase al mes. Una gigabase equivale a mil millones de bases de los archivos de secuencia importados (como FASTQ, BAM y CRAM). El almacenamiento de AWS HealthOmics almacena las bases, las puntuaciones de calidad, las alineaciones y otros metadatos de los archivos de origen. Se paga por gigabase almacenada, por lo que no hay que preocuparse por formatos de archivo óptimos ni por técnicas de compresión. AWS HealthOmics se encarga de todo eso en su lugar.

Los objetos de secuencia se denominan conjuntos de lectura y son lógicamente equivalentes a un archivo FASTQ, BAM o CRAM. El almacenamiento de AWS HealthOmics ofrece una clase de almacenamiento activo y una clase de almacenamiento de archivo para los conjuntos de lectura. Almacenar conjuntos de lectura en la clase de almacenamiento de archivo cuesta menos al mes que hacerlo en la clase de almacenamiento activo. Se puede acceder a los conjuntos de lectura ubicados en la clase de almacenamiento activo en cuestión de milisegundos. En cambio, es necesario activar los conjuntos de lectura que se encuentran en el nivel de archivo para poder acceder a estos. Si no se accede a los conjuntos de lectura durante 30 días, estos se trasladan automáticamente a la clase de almacenamiento de archivo de menor costo hasta que se reactiven.

No se aplica ningún cargo por la importación de conjuntos de lectura. Los datos de almacenamiento de AWS HealthOmics se cobran por una duración mínima de almacenamiento de 30 días. Los datos eliminados antes de 30 días incurren en un cargo prorrateado equivalente al cargo de almacenamiento de los días restantes. El almacenamiento de AWS HealthOmics está diseñado para datos de larga duración pero a los que se accede con poca frecuencia y que se retienen durante años.

Pagará por las solicitudes GET realizadas a los objetos del conjunto de lectura. Todos los demás tipos de solicitudes respecto a los conjuntos de lectura son gratuitos.

Precios de análisis de AWS HealthOmics

Los análisis de AWS HealthOmics ayudan a preparar los datos de variantes y anotaciones genómicas antes de utilizarlos con el amplio conjunto de servicios de análisis y machine learning de AWS, como Amazon Athena y Amazon SageMaker. Puede almacenar cualquier cantidad de datos de variantes genómicas. Además, solo se pagará por lo que se almacena. El tamaño de los datos se define como el tamaño de los datos transformados. Sin embargo, al consultar y analizar los datos en otros servicios, se pagará por el uso de dichos servicios.

Los datos de análisis de AWS HealthOmics se cobran por una duración mínima de almacenamiento de 30 días. Los datos eliminados antes de 30 días incurren en un cargo prorrateado equivalente al cargo de almacenamiento de los días restantes.

Precios de los flujos de trabajo privados y Ready2Run de AWS HealthOmics

AWS HealthOmics también administra la ejecución de flujos de trabajo bioinformáticos con flujos de trabajo privados y Ready2Run.

Los flujos de trabajo privados le permiten incluir sus propios scripts bioinformáticos que estén escritos en los lenguajes de flujo de trabajo más utilizados. Puede ejecutar flujos de trabajo privados con una sola ejecución. Solo se paga por lo que se solicita y los tipos de instancias de Omics y el almacenamiento de las ejecuciones se facturan por separado. Todas las tareas del flujo de trabajo se asignan a la instancia que mejor se adapte en función de los recursos definidos. Por ejemplo, una tarea definida para utilizar 8 CPU y 60 GB de RAM se asignará al tipo de instancia omics.r.2xlarge para su ejecución.

Los flujos de trabajo Ready2Run son flujos de trabajo prediseñados que han sido empaquetados por compañías de software de terceros del sector y canalizaciones de código abierto. Puede utilizar los flujos de trabajo Ready2Run para procesar los datos con los flujos de trabajo más utilizados, como Germline y GATK-BP. Los flujos de trabajo Ready2Run se pagan por ejecución, lo que significa que se le cobra el mismo precio por cada flujo de trabajo.

Para los flujos de trabajo privados y Ready2run, los registros se almacenan en los registros de Amazon CloudWatch de la cuenta y se facturan en CloudWatch durante el tiempo que decida retenerlos. Puede configurar el servicio de manera que informe sobre el uso de recursos por ejecución para así simplificar la elaboración de presupuestos, la planificación y la contabilidad.

  • Flujos de trabajo privados
  • Flujos de trabajo Ready2Run

Ejemplos de precios

Ejemplo 1

Una iniciativa de secuenciación de poblaciones comienza a secuenciar individuos de un biobanco que han recopilado. Para ello, optan por la región UE Oeste (Irlanda). Secuencian 100 000 individuos, cada uno con 130 gigabases, y almacenan los datos de secuenciación sin procesar en el almacenamiento de AWS HealthOmics. Durante los siguientes cinco años, permanecen en la clase de almacenamiento de archivo después de los 30 días siguientes a la importación y se accede a estos dos veces, en promedio, cuando pasan a la clase de almacenamiento activo durante 30 días. Cada genoma se descarga en 500 partes, lo que genera 500 llamadas GET a la API. El costo total durante cinco años para un solo genoma es:
Clase de almacenamiento activo: 0,005769 USD gigabase/mes * 130 gigabases * 90 días = 2,22 USD
Clase de almacenamiento de archivo: 0,001154 USD gigabase/mes * 130 gigabases * (1825 – 90) días = 8,56 USD.
GET API: 0,005 USD / 1000 llamadas a la API * (2 * 500 llamadas a la API) = 0,005 USD
Costo total durante 5 años: 2,22 USD + 8,56 USD + 0,005 USD = 10,79 USD (o 2,16 USD/año)

Ejemplo 2

Una científica de biocomputación desea ejecutar un flujo de trabajo de Nextflow en los flujos de trabajo de AWS HealthOmics en la región del Este de EE. UU. (Norte de Virginia). Tiene tres tareas en el flujo de trabajo. La primera reserva 16 CPU virtuales y 30 GB de memoria y tarda 3 horas en ejecutarse. La segunda requiere 32 CPU virtuales y 160 GB de memoria y tarda 2 horas en ejecutarse. La tercera reserva 4 CPU virtuales y 10 GB de memoria y tarda 10 minutos en ejecutarse. El cliente registra el flujo de trabajo y llama a la API StartRun con el sistema de archivos de 1200 GB predeterminado. Los costos totales son:
Tarea 1 (omics.c.4xlarge): 0,9180 USD/hora * 3 horas = 2,754 USD
Tarea 2 (omics.r.8xlarge):
2,7216USD/hora * 2 horas = 5,4432 USD
Tarea 3 (omics.m.xlarge): 0,2592/hora * 1/6 horas = 0,0432 USD
Almacenamiento: 0,0001918 USD/ GB-hora * (1200GB*(3 horas+2 horas+1/6 horas)) = 1,18916 USD
Total: 9,42956 USD

Ejemplo 3

Un científico de datos tiene 3202 archivos de formato de llamado de variantes (VCF) que desea analizar en Amazon Athena en la región del Este de EE. UU. (Norte de Virginia). Crea un almacén de variantes e ingiere estos archivos con las API de AWS HealthOmics. El tamaño de los datos ingeridos es de 1,5 TB. En el transcurso del mes siguiente, ejecuta 1000 consultas en Athena, en las que calcula las frecuencias alélicas de diferentes subpoblaciones, cada una de las cuales consume en promedio 50 GB. Los gastos mensuales totales son:
Almacén de variantes: 0,035 USD GB/mes * (1024 GB/TB * 1,5 TB) = 53,76 USD
Amazon Athena: 5 USD / TB * 1000 * 50 / 1024 = 244,14 USD

Ejemplo 4

Un científico computacional quiere ejecutar el flujo de trabajo Ready2Run de GATK-BP Germline fq2vcf para 30 veces el genoma en la región Este de EE. UU. (Norte de Virginia) para 3 muestras. El cliente introduce sus datos y llama a la API StartRun para cada muestra. El costo de las 3 ejecuciones es:
Flujo de trabajo Ready2Run de GATK-BP Germline fq2vcf para 30 veces el genoma: 10,00 USD por ejecución * 3 = 30,00 USD
Total: 30,00 USD

Recursos con precios adicionales

Calculadora de precios de AWS

Calcule fácilmente los costos mensuales en AWS

Centro de recursos de economía en la nube

Contacte a especialistas de AWS para obtener una cotización personalizada