I prezzi di Amazon Omics sono calcolati in base all'uso effettivo. Saranno addebitati i costi in base alla quantità di dati che archivi e le istanze di calcolo che utilizzi per processare il flusso di lavoro. Con Amazon Omics, puoi archiviare oggetti dati o varianti di sequenza e riferimento e dati di annotazione. Puoi anche eseguire flussi di lavoro bioinformatici per analizzare e trasformare dati genomici, transcrittomici e altri dati omici. Amazon Omics è ottimizzato per l'archiviazione e il calcolo dei dati omici e funziona con altri servizi AWS come Amazon SageMaker, Amazon Simple Storage Service (S3) e Amazon Athena.
Piano gratuito
Poiché hai accesso al piano gratuito AWS, puoi iniziare a utilizzare Amazon Omics gratuitamente. Il piano gratuito si attiva il primo giorno del mese in cui crei la tua prima risorsa Amazon Omics. I dettagli del piano gratuito di Amazon Omics sono riportati nella tabella di seguito.
Uso del piano gratuito mensile per i primi 2 mesi |
|
Domande frequenti su Amazon Omics | 1.500 gigabase al mese nella classe di archiviazione attiva e 1.500 gigabase al mese nella classe di archiviazione |
Flussi di lavoro di Amazon Omics | Ore di istanza da 275 omics.m.xlarge oppure istanze equivalenti di calcolo e 49.000 GB all’ora di archiviazione |
Analisi di Amazon Omics | 200 gigabyte al mese |
Prezzi per l’archivio di Amazon Omics
Quando archivi le sequenze genomiche nell’archivio di Amazon Omics, paghi l’archivio per gigabase al mese. Un gigabase è un miliardo di basi dai file di sequenza importati (come FASTQ, BAM e CRAM). L’archivio di Amazon Omics archivia le basi, i punteggi di qualità, gli allineamenti e altri metadati dai file di origine. Paghi per gigabase memorizzato, quindi non devi preoccuparti di formati di file o tecniche di compressione ottimali. Amazon Omics si occupa di tutto questo per te.
Gli oggetti sequenza sono chiamati set di lettura e dal punto di vista logico sono equivalenti a un file FASTQ, BAM o CRAM. L'archivio Amazon Omics offre una classe di archiviazione attiva e una per i set di lettura. L'archiviazione dei set di lettura nella classe di archiviazione costa meno al mese rispetto alla classe attiva. È possibile accedere ai set di lettura nella classe attiva nell'arco di millisecondi, mentre quelli nel livello di archiviazione devono essere attivati prima di potervi accedere. Dopo il mancato accesso ai set di lettura per 30 giorni, questi passano automaticamente alla classe di archiviazione a costo ridotto finché non vengono riattivati.
I set di lettura non prevedono costi di importazione. I dati di archiviazione di Amazon Omics vengono addebitati per una durata minima di archiviazione di 30 giorni e i dati eliminati prima dei 30 giorni comportano un addebito proporzionale pari al costo di archiviazione per i giorni rimanenti. L’archivio di Amazon Omics è progettato per dati di lunga durata, ma a cui si accede raramente e che vengono conservati per anni.
Paghi in base alle richieste GET inviate ai tuoi oggetti set di lettura. Tutti gli altri tipi di richiesta sui set di lettura sono gratuiti.
Prezzi per analisi di Amazon Omics
L'analisi di Amazon Omics ti aiuta a preparare i dati delle varianti genomiche e le annotazioni genomiche da utilizzare con l'ampia suite di analisi AWS e servizi di machine learning come Amazon Athena e Amazon SageMaker. Puoi archiviare qualsiasi quantità di dati sulle varianti genomiche e paghi solo per ciò che archivi. La dimensione dei dati è definita come la dimensione dei dati trasformati. Tuttavia, quando esegui query e analizzi i dati in altri servizi, paghi per l'utilizzo di tali servizi.
I dati di analisi di Amazon Omics vengono addebitati per una durata di archiviazione minima di 30 giorni e i dati eliminati prima dei 30 giorni comportano un addebito proporzionale pari al costo di archiviazione per i giorni rimanenti.
Prezzi dei flussi di lavoro privati e Ready2Run di Amazon Omics
Amazon Omics gestisce anche l'esecuzione di flussi di lavoro bioinformatici con flussi di lavoro privati e Ready2Run.
I flussi di lavoro privati ti consentono di portare i tuoi script bioinformatici scritti nei linguaggi di flusso di lavoro più comunemente usati. Puoi eseguire flussi di lavoro privati con un'unica esecuzione. Il prezzo viene calcolato solo in base alle richieste e viene addebitato separatamente per i tipi di istanza omici e l'esecuzione dell'archiviazione. Tutte le attività nel tuo flusso di lavoro sono mappate all'istanza che si adatta meglio alle loro risorse definite. Ad esempio, un'attività definita per utilizzare 8 CPU e 60 GB di RAM verrà mappata al tipo di istanza omics.r.2xlarge per l'esecuzione.
I flussi di lavoro Ready2Run sono flussi di lavoro predefiniti che sono stati confezionati da società di software terze del settore e pipeline open source. Puoi semplicemente utilizzare i flussi di lavoro Ready2Run per elaborare i tuoi dati con i flussi di lavoro più comunemente usati come Germline e GATK-BP. I flussi di lavoro Ready2Run sono pay-per-run, il che significa che viene addebitato lo stesso prezzo per ogni flusso di lavoro.
Per i flussi di lavoro privati e Ready2Run, i log vengono archiviati nei file di log Amazon CloudWatch nel tuo account e fatturati in CloudWatch per tutto il tempo in cui decidi di conservarli. È possibile configurare il servizio in modo da segnalare l'utilizzo per esecuzione per budget, pianificazione e contabilità semplificati.
-
Flussi di lavoro privati
-
Flussi di lavoro Ready2Run
-
Flussi di lavoro privati
-
-
Flussi di lavoro Ready2Run
-
Esempi di prezzo
Esempio 1
Un'iniziativa di sequenziamento della popolazione sta iniziando a sequenziare gli individui da una biobanca raccolta. Si è scelto di farlo nella regione occidentale (Irlanda) dell’UE. Sequenziano 100.000 individui, ciascuno su 130 gigabase e archiviano i dati di sequenziamento non elaborati nell’archivio di Amazon Omics. Nei successivi cinque anni, rimangono nella classe di archiviazione dell'archivio dopo i 30 giorni successivi all'importazione e vi si accede in media due volte quando passano alla classe di archiviazione attiva per 30 giorni. Ogni genoma viene scaricato in 500 parti, generando 500 chiamate API GET. Il loro costo totale in cinque anni per un singolo genoma è:
Classe di archiviazione attiva: 0,005769 USD gigabase/mese * 130 gigabase * 90 giorni = 2,22 USD
Classe di archiviazione attiva: 0,001154 USD gigabase/mese * 130 gigabase * (1.825-90) giorni = 8,56 USD.
API GET: 0,005/1.000 chiamate API * (2 * 500 chiamate API) = 0,005 USD
Costo totale per 5 anni: 2,22 USD + 8,56 USD + 0,005 USD = 10,79 USD (o 2,16 USD/anno)
Esempio 2
Una scienziata bioinformatica desidera eseguire un flusso di lavoro Nextflow nei flussi di lavoro Amazon Omics nella regione degli Stati Uniti orientali (Virginia settentrionale). Ha tre attività nel flusso di lavoro. La prima riserva 16 vCPU e 30 GB di memoria e impiega 3 ore per essere eseguita. La seconda richiede 32 vCPU e 160 GB di memoria e impiega 2 ore per essere eseguita. La terza riserva 4 vCPU e 10 GB di memoria e impiega 10 minuti per l'esecuzione. Il cliente registra il flusso di lavoro e chiama l'API StartRun con il file system predefinito da 1.200 GB. I costi complessivi addebitati sono:
Attività 1 (omics.c.4xlarge): 0.918 USD/ora * 3 ore = 2,754 USD
Attività 2 (omics.c.8xlarge): 2,7216 USD/ora * 2 ore = 5,4432 USD
Attività 3 (omics.m.xlarge): 0,2592 USD/ora * 1/6 ore = 0,0432 USD
Archiviazione: 0.0001918 USD/GB all’ora * (1.200 GB* (3 ore+2 ore+1/6 ora)) = 1,18916 USD
Total: 9,42956 USD
Esempio 3
Uno scienziato di dati ha 3.202 file di formato (VCF) di chiamata che desidera analizzare in Amazon Athena nella regione della Virginia orientale (Virginia settentrionale). Crea un archivio di variante e inserisce questi file con le API di Amazon Omics. I dati inseriti hanno la dimensione di 1,5 TB. Nel corso del mese successivo, esegue 1.000 query in Athena, calcolando le frequenze alleliche per diverse sottopopolazioni, ciascuna delle quali consuma in media 50 GB. I suoi costi totali mensili sono:
Archivio di variante: 0,035 USD GB/mese * (1.024 GB/TB * 1,5 TB) = 53,76 USD
Amazon Athena: 5 USD/TB * 1.000 * 50/1.024 = 244,14 USD
Esempio 4
Uno scienziato computazionale desidera eseguire la linea germinale GATK-BP fq2vcf per un flusso di lavoro Ready2Run del genoma 30x nella regione degli Stati Uniti orientali (Virginia settentrionale) per 3 campioni. Il cliente inserisce i propri dati e chiama l'API StartRun per ogni campione. Il costo per le 3 esecuzioni è:
GATK-BP Germline fq2vcf per un flusso di lavoro Ready2Run con genoma 30x: 10 USD per esecuzione * 3 = 30 USD
Totale: 30 USD
Risorse aggiuntive sui prezzi
Calcola facilmente le spese mensili con AWS
Contatta gli specialisti AWS per ricevere un preventivo personalizzato