Visão geral

Com o AWS HealthOmics, você paga somente pelo que usa. Você paga conforme a quantidade de dados armazenados e as instâncias de computação usadas para processar o fluxo de trabalho. Com o AWS HealthOmics, é possível armazenar objetos de dados de sequência e de referência ou dados de variantes e anotações. Você também pode executar fluxos de trabalho de bioinformática para analisar e transformar dados genômicos, transcriptômicos e outros dados ômicos. O AWS HealthOmics é otimizado para armazenamento e computação de dados ômicos e funciona com outros serviços da AWS, como o Amazon SageMaker, o Amazon Simple Storage Service (S3) e o Amazon Athena.

Nível gratuito

Como parte do nível gratuito da AWS, você pode começar a usar o AWS HealthOmics gratuitamente. O nível gratuito começa no primeiro mês quando você cria o primeiro recurso no AWS HealthOmics. Os detalhes do nível gratuito do AWS HealthOmics estão na tabela abaixo.

 

Uso do nível gratuito por mês nos primeiros dois meses

Armazenamento do AWS HealthOmics 1500 gigabase-meses na classe de armazenamento ativo e 1500 gigabase-meses na classe de armazenamento de arquivo
Fluxos de trabalho do AWS HealthOmics

275 horas de instância omics.m.xlarge ou instâncias de computação equivalentes e 49 mil GB-horas de armazenamento de execuções

Análise do AWS HealthOmics 200 gigabyte-meses

Preço de armazenamento do AWS HealthOmics

Quando armazena sequências genômicas no armazenamento do AWS HealthOmics, você paga pelo armazenamento por gigabase por mês. Um gigabase é um bilhão de bases de arquivos de sequências importados (como FASTQ, BAM e CRAM). O armazenamento do AWS HealthOmics armazena as bases, os índices de qualidade, os alinhamentos e outros metadados dos arquivos de origem. Você paga por gigabase armazenado, para que não precise se preocupar com formatos de arquivo ideais ou técnicas de compactação. O AWS HealthOmics cuida de tudo isso para você.

Os objetos de sequência são chamados de conjuntos de leitura e são logicamente equivalentes a um arquivo FASTQ, BAM ou CRAM. O armazenamento do AWS HealthOmics oferece uma classe de armazenamento ativo e uma classe de armazenamento de arquivo para seus conjuntos de leitura. Conjuntos de leitura na classe de arquivo custam menos por mês do que armazená-los na classe ativa. Os conjuntos de leitura na classe ativa podem ser acessados em milissegundos, enquanto os conjuntos de leitura na camada de arquivo precisam ser ativados antes que possam ser acessados. Depois que os conjuntos de leitura não são acessados por 30 dias, eles são movidos automaticamente para a classe de armazenamento de arquivo de baixo custo até que sejam reativados.

Não há nenhuma taxa de importação para conjuntos de leitura. Os dados de armazenamento do AWS HealthOmics são cobrados por um período mínimo de armazenamento de 30 dias, e os dados excluídos antes de 30 dias incorrem em uma cobrança proporcional equivalente à cobrança pelo armazenamento dos dias restantes. O armazenamento do AWS HealthOmics foi criado para dados de longa duração que são acessados raramente e retidos durante anos.

Você paga por solicitações GET feitas aos objetos de conjunto de leitura. Todos os outros tipos de solicitação sobre conjuntos de leitura são gratuitos.

Preço de análise do AWS HealthOmics

A análise do AWS HealthOmics ajuda a preparar dados de variáveis genômicas e anotações genômicas para uso com o amplo conjunto de serviços de análise e machine learning da AWS, como o Amazon Athena e o Amazon SageMaker. Você pode armazenar qualquer quantidade de dados de variáveis genômicas e só pagará pelo que usar. O tamanhos dos dados é definido como o tamanho dos dados transformados. Porém, quando consulta e analisa os dados em outros serviços, você paga pelo uso desses serviços.

A análise do AWS HealthOmics é cobrada por um período mínimo de armazenamento de 30 dias, e os dados excluídos antes de 30 dias incorrem em uma cobrança pro rata equivalente à cobrança pelo armazenamento pelos dias restantes.

Preços de fluxos de trabalho privados e Ready2Run do AWS HealthOmics

O AWS HealthOmics também gerencia a execução de fluxos de trabalho de bioinformática com fluxos de trabalho privados e Ready2Run.

Os fluxos de trabalho privados permitem que você traga seus próprios scripts de bioinformática escritos nas linguagens de fluxo de trabalho mais usadas. Você pode executar fluxos de trabalho privados com uma única execução. Você paga somente pelo que solicita e é cobrado separadamente pelos tipos de instância do Omics e pelo armazenamento de execução. Todas as tarefas do fluxo de trabalho são mapeadas para a instância mais adequada para os recursos definidos. Por exemplo, uma tarefa definida para usar 8 CPUs e 60 GB de RAM será mapeada para o tipo de instância omics.r.2xlarge para execução.

Os fluxos de trabalho do Ready2Run são fluxos de trabalho pré-criados que foram empacotados por empresas de software terceirizadas do setor e pipelines de código aberto. Você pode simplesmente usar os fluxos de trabalho Ready2Run para processar seus dados com os fluxos de trabalho mais usados, como Germline e GATK-BP. Os fluxos de trabalho Ready2Run são pagos por execução, o que significa que você paga o mesmo preço por cada fluxo de trabalho.

Para fluxos de trabalho privados e Ready2Run, os logs são armazenados no Amazon CloudWatch Logs em sua conta e cobrados no CloudWatch pelo tempo que você optar por retê-los. Você pode configurar o serviço para que informe o uso de recursos por execução para simplificar o orçamento, o planejamento e a contabilidade.

  • Fluxos de trabalho privados
  • Fluxos de trabalho Ready2Run

Exemplos de preço

Exemplo 1

Uma iniciativa de sequenciamento populacional está começando a sequenciar indivíduos de um biobanco que eles coletaram. Eles decidem fazer isso na região Oeste da UE (Irlanda). Eles sequenciam 100 mil indivíduos, 130 gigabases cada, e armazenam os dados brutos de sequenciamento no armazenamento do AWS HealthOmics. Durante os próximos cinco anos, eles permanecem na classe de armazenamento de arquivamento após os 30 dias seguintes à importação e são acessados duas vezes, em média, quando passam para a classe de armazenamento ativo por 30 dias. Cada genoma é baixado em 500 partes, gerando 500 chamadas de API GET. O custo total ao longo de cinco anos para um único genoma é:
Classe de armazenamento ativo: USD 0,005769 por gigabase/mês * 130 gigabases * 90 dias = USD 2,22
Classe de armazenamento de arquivamento: USD 0,001154 por gigabase/mês * 130 gigabases * (1825 – 90) dias = USD 8,56.
APIs GET: USD 0,005 / 1000 chamadas de API * (2 * 500 chamadas de API) = USD 0,005
Custo total em 5 anos: USD 2,22 + USD 8,56 + USD 0,005 = USD 10,79 (ou USD 2,16/ano)

Exemplo 2

Uma cientista de bioinformática deseja executar um fluxo de trabalho Nextflow em fluxos de trabalho do AWS HealthOmics na região Leste dos EUA (N. da Virgínia). Ela tem três tarefas no fluxo de trabalho. A primeira reserva 16 vCPUs e 30 GB de memória e leva 3 horas para ser executada. A segunda reserva 32 vCPUs e 160 GB de memória e leva 2 horas para ser executada. A terceira reserva 4 vCPUs e 10 GB de memória e leva 10 minutos para ser executada. A cliente registra o fluxo de trabalho e chama a API StartRun com o sistema de arquivos padrão de 1200 GB. Seus custos gerais são:
Tarefa1 (omics.c.4xlarge): 0,9180/h * 3 h = 2,754 USD
Task 2 (omics.r.8xlarge):
2,7216 USD/h * 2 h = 5,4432 USD
Tarefa 3 (omics.m.xlarge): 0,2592 USD/h * 1/6 h = 0,0432 USD
Armazenamento: 0,0001918 USD/ GB-hora * (1200 GB*(3 h+2 h+1/6 h)) = 1,18916 USD
Total: 9,42956 USD

Exemplo 3

Um cientista de dados tem 3.202 arquivos no formato de chamada de variável (VCF) que ele deseja analisar no Amazon Athena na região Leste dos EUA (N. da Virgínia). Ele cria um repositório de variáveis e ingere esses arquivos usando as APIs do AWS HealthOmics. Os dados ingeridos têm um tamanho de 1,5 TB. Ao longo do mês seguinte, ele executa 1.000 consultas no Athena, calculando frequências alélicas para diferentes subpopulações, cada uma consumindo em média 50 GB. Seus custos mensais gerais são:
Armazenamento variável: USD 0,035 por GB/mês * (1024 GB/TB * 1,5 TB) = USD 53,76
Amazon Athena: USD 5/TB * 1000 * 50 / 1024 = USD 244,14

Exemplo 4

Um computational scientist deseja executar o fluxo de trabalho Ready2Run GATK-BP Germline fq2vcf para genoma 30x na região Leste dos EUA (Norte da Virgínia) para três amostras. O cliente insere seus dados e chama a API StartRun para cada amostra. O custo das três execuções é:
Fluxo de trabalho Ready2Run GATK-BP Germline fq2vcf para genoma 30x: USD 10,00/execução * 3 = USD 30,00
Total: USD 30,00

Recursos de preços adicionais

Calculadora de preços da AWS

Calcule os custos mensais com facilidade na AWS

Centro de recursos de aspectos econômicos da nuvem

Entre em contato com os especialistas da AWS para obter um orçamento personalizado