Visão geral

Com o AWS HealthOmics, você paga somente pelo que usa. Você paga conforme a quantidade de dados armazenados e as instâncias de computação usadas para processar o fluxo de trabalho. Com o AWS HealthOmics, é possível armazenar objetos de dados de sequência e de referência ou dados de variantes e anotações. Você também pode executar fluxos de trabalho de bioinformática para analisar e transformar dados genômicos, transcriptômicos e outros dados ômicos. O AWS HealthOmics é otimizado para armazenamento e computação de dados ômicos e funciona com outros serviços da AWS, como o Amazon SageMaker, o Amazon Simple Storage Service (S3) e o Amazon Athena.

Nível gratuito

Como parte do nível gratuito da AWS, você pode começar a usar o AWS HealthOmics gratuitamente. O nível gratuito começa no primeiro mês quando você cria o primeiro recurso no AWS HealthOmics. Os detalhes do nível gratuito do AWS HealthOmics estão na tabela abaixo.

 

Uso do nível gratuito por mês nos primeiros dois meses

Armazenamento do AWS HealthOmics 1500 gigabase-meses na classe de armazenamento ativo e 1500 gigabase-meses na classe de armazenamento de arquivo
Fluxos de trabalho do AWS HealthOmics

275 horas de instância omics.m.xlarge ou instâncias de computação equivalentes e 49 mil GB-horas de armazenamento de execuções

Análise do AWS HealthOmics 200 gigabyte-meses

Os clientes da AWS recebem 100 GB de transferência de dados para a Internet gratuitamente todos os meses, agregados em todos os serviços e regiões da AWS (exceto China e GovCloud).

Preço de armazenamento do AWS HealthOmics

Quando armazena sequências genômicas no armazenamento do AWS HealthOmics, você paga pelo armazenamento por gigabase por mês. Um gigabase é um bilhão de bases de arquivos de sequências importados (como FASTQ, BAM e CRAM). O armazenamento do AWS HealthOmics armazena as bases, os índices de qualidade, os alinhamentos e outros metadados dos arquivos de origem. Você paga por gigabase armazenado, para que não precise se preocupar com formatos de arquivo ideais ou técnicas de compactação. O AWS HealthOmics cuida de tudo isso para você.

Os objetos de sequência são chamados de conjuntos de leitura e são logicamente equivalentes a um arquivo FASTQ, BAM ou CRAM. O armazenamento do AWS HealthOmics oferece uma classe de armazenamento ativo e uma classe de armazenamento de arquivo para seus conjuntos de leitura. Conjuntos de leitura na classe de arquivo custam menos por mês do que armazená-los na classe ativa. Os conjuntos de leitura na classe ativa podem ser acessados em milissegundos, enquanto os conjuntos de leitura na camada de arquivo precisam ser ativados antes que possam ser acessados. Depois que os conjuntos de leitura não são acessados por 30 dias, eles são movidos automaticamente para a classe de armazenamento de arquivo de baixo custo até que sejam reativados.

Não há nenhuma taxa de importação para conjuntos de leitura. Os dados de armazenamento do AWS HealthOmics são cobrados por um período mínimo de armazenamento de 30 dias, e os dados excluídos antes de 30 dias incorrem em uma cobrança proporcional equivalente à cobrança pelo armazenamento dos dias restantes. O armazenamento do AWS HealthOmics foi criado para dados de longa duração que são acessados raramente e retidos durante anos.

Há duas formas de acessar os dados de armazenamento do AWS HealthOmics: via leitura, gravação e atualização por meio das APIs do HealthOmics e via leitura por meio das APIs do S3.  Para acesso por meio das APIs da HealthOmics, você paga pelas solicitações GET feitas aos seus objetos de conjunto de leitura. Todos os outros tipos de solicitação do HealthOmics sobre conjuntos de leitura são gratuitos. Para acesso por meio das APIs do S3, as solicitações COPY e LIST são cobradas separadamente de todos os outros tipos de solicitação.  

Preço de análise do AWS HealthOmics

A análise do AWS HealthOmics ajuda a preparar dados de variáveis genômicas e anotações genômicas para uso com o amplo conjunto de serviços de análise e machine learning da AWS, como o Amazon Athena e o Amazon SageMaker. Você pode armazenar qualquer quantidade de dados de variáveis genômicas e só pagará pelo que usar. O tamanhos dos dados é definido como o tamanho dos dados transformados. Porém, quando consulta e analisa os dados em outros serviços, você paga pelo uso desses serviços.

A análise do AWS HealthOmics é cobrada por um período mínimo de armazenamento de 30 dias, e os dados excluídos antes de 30 dias incorrem em uma cobrança pro rata equivalente à cobrança pelo armazenamento pelos dias restantes.

Preços de fluxos de trabalho Ready2Run do AWS HealthOmics

Os fluxos de trabalho Ready2Run são fluxos de trabalho pré-criados que foram empacotados por empresas de software terceirizadas do setor e pipelines de código aberto. Você pode simplesmente usar os fluxos de trabalho Ready2Run para processar seus dados com os fluxos de trabalho mais usados, como Germline e GATK-BP. Os fluxos de trabalho Ready2Run são pagos por execução, o que significa que você paga o mesmo preço por cada fluxo de trabalho. Para ver informações detalhadas sobre cada fluxo de trabalho Ready2Run, visite o console HealthOmics.

 

Preços de fluxos de trabalho privados do AWS HealthOmics

Os fluxos de trabalho privados permitem que você traga seus próprios scripts de bioinformática escritos nas linguagens de fluxo de trabalho mais usadas. Você pode executar fluxos de trabalho privados com uma única execução. Você paga somente pelo que solicita e é cobrado separadamente pelos tipos de instância do Omics e pelo armazenamento de execução. Todas as tarefas do fluxo de trabalho são mapeadas para a instância mais adequada para os recursos definidos. Por exemplo, uma tarefa definida para usar 8 CPUs e 60 GB de RAM será mapeada para o tipo de instância omics.r.2xlarge para execução. Para armazenamento de execução, você pode escolher um sistema de arquivos provisionado estatisticamente com maior throughput de sistema de arquivos ou um sistema de arquivos que seja escalado dinamicamente.

 

Transferência de dados

Você paga por toda a largura de banda da HealthOmics. As taxas de transferência de dados não se aplicam aos dados transferidos para nenhum serviço da AWS na mesma região da AWS que o datastore. O preço abaixo é baseado nos dados transferidos para dentro e para fora do AWS HealthOmics (via Internet pública)†††. Saiba mais sobre os preços do AWS Direct Connect. Para transferências de dados que excedam 500 TB/mês, entre em contato conosco.

 

Região
Região

As camadas de taxa consideram o uso agregado de transferência de dados OUT para a Internet em todos os serviços da AWS.

 ††† A transferência de dados OUT pode ser diferente dos dados recebidos pela sua aplicação caso a conexão seja encerrada por você antes do tempo. Por exemplo, se você fizer uma solicitação de um objeto de 10 GB e encerrar a conexão após o recebimento de 2 GB de dados. O AWS HealthOmics tenta interromper o streaming de dados, mas isso não acontece instantaneamente. Neste exemplo, a transferência de dados OUT pode ser de 3 GB (1 GB a mais do que os 2 GB que você recebeu). Como resultado, você receberá uma cobrança por 3 GB de transferência de dados OUT.

 

Exemplos de preços

Exemplo 1

Uma iniciativa de sequenciamento populacional está começando a sequenciar indivíduos de um biobanco que eles coletaram. Eles decidem fazer isso na região Oeste da UE (Irlanda). Eles sequenciam 100 mil indivíduos, cada um com 130 gigabases, 50 gigabytes e armazenam os dados brutos de sequenciamento no armazenamento do AWS HealthOmics. Durante os próximos cinco anos, eles permanecem na classe de armazenamento de arquivamento após os 30 dias seguintes à importação e são acessados duas vezes, em média, quando passam para a classe de armazenamento ativo por 30 dias. Eles usam APIs do S3 para acessar os arquivos. Cada genoma é baixado em 500 partes, gerando 500 chamadas de API GET. O custo total ao longo de cinco anos para um único genoma é:
Classe de armazenamento ativo: USD 0,005769 por gigabase/mês * 130 gigabases * 90 dias = USD 2,22
Classe de armazenamento de arquivamento: USD 0,001154 por gigabase/mês * 130 gigabases * (1825 – 90) dias = USD 8,56.
APIs GET do S3: USD 0,0004/1000 chamadas de API * (2 * 500 chamadas de API) = USD 0,0004
Custo total em 5 anos: USD 2,22 + USD 8,56 + USD 0,0004 = USD 10,78 (ou USD 2,15/ano)

Exemplo 2

Uma cientista de bioinformática deseja executar um fluxo de trabalho Nextflow em fluxos de trabalho do AWS HealthOmics na região Leste dos EUA (N. da Virgínia). Ela tem três tarefas no fluxo de trabalho. A primeira reserva 16 vCPUs e 30 GB de memória e leva 3 horas para ser executada. A segunda reserva 32 vCPUs e 160 GB de memória e leva 2 horas para ser executada. A terceira reserva 4 vCPUs e 10 GB de memória e leva 10 minutos para ser executada. A cliente registra o fluxo de trabalho e chama a API StartRun com o sistema de arquivos padrão de 1200 GB. Seus custos gerais são:
Tarefa1 (omics.c.4xlarge): 0,9180/h * 3 h = 2,754 USD
Task 2 (omics.r.8xlarge):
2,7216 USD/h * 2 h = 5,4432 USD
Tarefa 3 (omics.m.xlarge): 0,2592 USD/h * 1/6 h = 0,0432 USD
Armazenamento: 0,0001918 USD/ GB-hora * (1200 GB*(3 h+2 h+1/6 h)) = 1,18916 USD
Total: 9,42956 USD

Exemplo 3

Um cientista de dados tem 3.202 arquivos no formato de chamada de variável (VCF) que ele deseja analisar no Amazon Athena na região Leste dos EUA (N. da Virgínia). Ele cria um repositório de variáveis e ingere esses arquivos usando as APIs do AWS HealthOmics. Os dados ingeridos têm um tamanho de 1,5 TB. Ao longo do mês seguinte, ele executa 1.000 consultas no Athena, calculando frequências alélicas para diferentes subpopulações, cada uma consumindo em média 50 GB. Seus custos mensais gerais são:
Armazenamento variável: USD 0,035 por GB/mês * (1024 GB/TB * 1,5 TB) = USD 53,76
Amazon Athena: USD 5/TB * 1000 * 50 / 1024 = USD 244,14

Exemplo 4

Um computational scientist deseja executar o fluxo de trabalho Ready2Run GATK-BP Germline fq2vcf para genoma 30x na região Leste dos EUA (Norte da Virgínia) para três amostras. O cliente insere seus dados e chama a API StartRun para cada amostra. O custo das três execuções é:
Fluxo de trabalho Ready2Run GATK-BP Germline fq2vcf para genoma 30x: USD 10,00/execução * 3 = USD 30,00
Total: USD 30,00

Recursos de preços adicionais

Calculadora de preços da AWS

Calcule os custos mensais com facilidade na AWS

Centro de recursos de aspectos econômicos da nuvem

Entre em contato com os especialistas da AWS para obter um orçamento personalizado