Übersicht

Mit AWS HealthOmics zahlen Sie nur für das, was Sie tatsächlich nutzen. Der Preis wird auf der Grundlage der von Ihnen gespeicherten Datenmenge und der Datenverarbeitungs-Instances, die Sie für die Verarbeitung Ihres Workflows nutzen, berechnet. Mit AWS HealthOmics können Sie Sequenz- und Referenzdatenobjekte oder Varianz- und Annotationsdaten speichern. Sie können auch Bioinformatik-Workflows ausführen, um genomische, transkriptomische und andere Omics-Daten zu analysieren und zu transformieren. AWS HealthOmics ist für die Speicherung und Datenverarbeitung von Omics-Daten optimiert und arbeitet mit anderen AWS-Services wie Amazon SageMaker, Amazon Simple Storage Service (S3) und Amazon Athena zusammen.

Kostenloses Kontingent

Im Rahmen des kostenlosen Kontingents von AWS können Sie AWS HealthOmics zum Einstieg kostenlos verwenden. Ihr kostenloses Kontingent startet mit dem ersten Monat, nachdem Sie Ihre erste AWS-HealthOmics-Ressource erstellt haben. Die Details zum kostenlosen Kontingent für AWS HealthOmics sind in der Tabelle unten aufgeführt.

 

Nutzung eines kostenlosen Kontingents pro Monat für die ersten 2 Monate

AWS-HealthOmics-Speicher 1 500 Gigabase-Monate in der aktiven Speicherklasse und 1 500 Gigabase-Monate in der Archivspeicherklasse
Workflows bei AWS HealthOmics

275 omics.m.xlarge-Instance-Stunden oder gleichwertige Datenverarbeitungs-Instances und 49 000 GB-Stunden Laufzeitspeicher

AWS-HealthOmics-Analytik 200 Gigabyte-Monate

AWS-Kunden erhalten jeden Monat 100 GB Datenübertragung in das Internet, die für alle AWS-Services und -Regionen (außer China und GovCloud) gilt.

Preise für AWS-HealthOmics-Speicher

Wenn Sie genomische Sequenzen im AWS-HealthOmics-Speicher speichern, zahlen Sie für den Speicherplatz pro Gigabase pro Monat. Eine Gigabase ist eine Milliarde Basen aus Ihren importierten Sequenzdateien (wie FASTQ, BAM und CRAM). AWS-HealthOmics speichert die Basen, Qualitätsbewertungen, Ausrichtungen und andere Metadaten aus Ihren Quelldateien. Sie zahlen pro gespeicherter Gigabase, sodass Sie sich keine Gedanken über optimale Dateiformate oder Komprimierungstechniken machen müssen. AWS HealthOmics kümmert sich für Sie um all diese Dinge.

Sequenzobjekte werden als Lesesätze bezeichnet und sind logisch gesehen gleichwertig mit einer FASTQ-, BAM- oder CRAM-Datei. AWS-HealthOmics-Speicher bietet Ihnen eine Aktivspeicherklasse und eine Archivspeicherklasse für Ihre Lesesätze. Lesesätze in der Archivklasse kosten pro Monat weniger als Lesesätze in der Aktivklasse. Auf Lesesätze in der Aktivklasse kann innerhalb von Millisekunden zugegriffen werden, während Lesesätze in der Archivklasse erst aktiviert werden müssen, bevor auf sie zugegriffen werden kann. Nachdem 30 Tage lang nicht auf die Lesesätze zugegriffen wurde, werden sie automatisch in die kostengünstigere Archivspeicherklasse verschoben, bis sie wieder aktiviert werden.

Es gibt keine Importgebühr für Lesesätze. Die Speicherdaten von AWS HealthOmics werden für eine Mindestspeicherdauer von 30 Tagen berechnet. Für Daten, die vor Ablauf von 30 Tagen gelöscht werden, fällt eine anteilige Gebühr in Höhe der Speichergebühr für die verbleibenden Tage an. Der AWS-HealthOmics-Speicher ist für langlebige Daten konzipiert, auf die nur selten zugegriffen wird und die über Jahre hinweg gespeichert werden.

Es gibt zwei Möglichkeiten, auf AWS-HealthOmics-Speicherdaten zuzugreifen: Durch Lesen, Schreiben und Aktualisieren über HealthOmics-APIs und durch Lesen über S3-APIs.  Für den Zugriff über HealthOmics-APIs zahlen Sie für GET-Anfragen an Ihre Lesesatzobjekte. Alle anderen HealthOmics-Anfragetypen in Lesesätzen sind kostenlos. Für den Zugriff über S3-APIs werden COPY- und LIST-Anfragen getrennt von allen anderen Anforderungstypen in Rechnung gestellt.  

GET- und LIST-Anfragen über die Amazon-S3-API-Nutzung werden zu den S3-API-Tarifen in Rechnung gestellt (Preise finden Sie hier).

Preise für AWS-HealthOmics-Analytik

AWS-HealthOmics-Analytik hilft Ihnen, Ihre genomischen Variantendaten und genomischen Annotationen für die Verwendung mit der breiten Palette von AWS-Analytik- und Machine-Learning-Services wie Amazon Athena und Amazon SageMaker vorzubereiten. Sie können jede beliebige Menge an genomischen Variantendaten speichern und Sie zahlen nur für das, was Sie speichern. Die Datengröße ist definiert als die Größe der transformierten Daten. Wenn Sie jedoch die Daten in anderen Services abfragen und analysieren, zahlen Sie für die Nutzung dieser Services.

Die Analytik-Daten von AWS-HealthOmics werden für eine Mindestspeicherdauer von 30 Tagen berechnet. Für Daten, die vor Ablauf von 30 Tagen gelöscht werden, fällt eine anteilige Gebühr in Höhe der Speichergebühr für die verbleibenden Tage an.

Preise für private und Ready2Run-Workflows von AWS HealthOmics

AWS HealthOmics verwaltet auch die Ausführung von Bioinformatik-Workflows mit privaten Workflows und Ready2Run-Workflows.

Private Workflows ermöglichen es Ihnen, Ihre eigenen Bioinformatik-Skripts mitzubringen, die in den am häufigsten verwendeten Workflow-Sprachen geschrieben sind. Sie können private Workflows mit einer einzigen Ausführung ausführen. Sie zahlen nur für das, was Sie nutzen, und werden für die verschiedenen Typen von Omics-Instances und die Speicherung von Ausführungen separat abgerechnet. Alle Aufgaben in Ihrem Workflow werden der Instance zugeordnet, die am besten zu ihren definierten Ressourcen passt. So wird beispielsweise eine Aufgabe, die für die Verwendung von 8 CPUs und 60 GB RAM definiert ist, für die Ausführung dem Instance-Typ omics.r.2xlarge zugeordnet.

Ready2Run-Workflows sind vorgefertigte Workflows, die von branchenweit tätigen Softwareunternehmen und Open-Source-Pipelines zusammengestellt wurden. Sie können einfach Ready2Run-Workflows verwenden, um Ihre Daten mit den am häufigsten verwendeten Workflows wie Germline und GATK-BP zu verarbeiten. Ready2Run-Workflows sind Pay-per-Run, was bedeutet, dass Ihnen für jeden Workflow der gleiche Preis berechnet wird.

Workflow-Protokolle werden in Amazon-CloudWatch-Protokollen in Ihrem Konto gespeichert und in CloudWatch so lange abgerechnet, wie Sie sie aufbewahren möchten. Sie können den Service so konfigurieren, dass er die Ressourcennutzung pro Ausführung meldet, um Budgetierung, Planung und Buchhaltung zu vereinfachen.

  • Private Workflows
  • Ready2Run-Workflows

Preisbeispiele

Beispiel 1

Eine Initiative zur Sequenzierung der Population beginnt mit der Sequenzierung von Individuen aus einer Biobank, für die Daten erfasst wurden. Sie wählten dafür die Region EU West (Irland). Sie sequenzieren 100 000 Individuen mit jeweils 130 Gigabasen, 50 Gigabyte, und speichern die Rohdaten der Sequenzierung im AWS-HealthOmics-Speicher. In den nächsten 5 Jahren verbleiben sie nach den 30 Tagen nach dem Import in der Archivspeicherklasse und werden im Durchschnitt zweimal aufgerufen, wenn sie 30 Tage lang in die aktive Speicherklasse wechseln. Sie verwenden S3-APIs für den Zugriff auf die Dateien. Jedes Genom wird in 500 Teilen heruntergeladen, was 500 GET-API-Aufrufe erzeugt. Die Gesamtkosten über fünf Jahre für ein einzelnes Genom betragen:
Aktivspeicherklasse: 0,005769 USD Gigabase/Monat x 130 Gigabases x 90 Tage = 2,22 USD
Archivspeicherklasse: 0,001154 USD Gigabase/Monat x 130 Gigabases x (1 825–90) Tage = 8,56 USD.
S3-GET-APIs: 0,0004 USD/1 000 API-Aufrufe * (2 * 500 API-Aufrufe) = 0,0004 USD
Gesamtkosten über 5 Jahre: 2,22 USD + 8,56 USD + 0,0004 USD = 10,78 USD (oder 2,15 USD/Jahr)

Beispiel 2

Eine Bioinformatikerin möchte einen Nextflow-Workflow in AWS-HealthOmics-Workflows in der Region USA Ost (Nord-Virginia) ausführen. Sie hat drei Aufgaben im Workflow. Der erste reserviert 16 vCPUs und 30 GB Speicher und benötigt 3 Stunden für die Ausführung. Der zweite benötigt 32 vCPUs und 160 GB Speicher und seine Ausführung dauert 2 Stunden. Der dritte reserviert 4 vCPU und 10 GB Speicher und seine Ausführung dauert 10 Minuten. Der Kunde registriert den Workflow und ruft die StartRun-API mit dem Standard-Dateisystem 1 200 GB auf. Ihre Gesamtkosten betragen:
Aufgabe 1 (omics.c.4xlarge): 0,9180 USD/h * 3 h = 2,754 USD
Aufgabe 2 (omics.r.8xlarge):
2,7216 USD/h * 2 h = 5,4432 USD
Aufgabe 3 (omics.m.xlarge): 0,2592 USD/h * 1/6 h = 0,0432 USD
Speicher: 0,0001918 USD/GB-Stunde * (1 200 GB * (3 h +2 h + 1/6 h)) = 1,18916 USD
Gesamt: 9,42956 USD

Beispiel 3

Ein Datenwissenschaftler hat 3 202 VCF-Dateien (Variant Call Format), die er in Amazon Athena in der Region USA Ost (Nord-Virginia) analysieren möchte. Er erstellt einen Variantenspeicher und nimmt diese Dateien über die Amazon-HealthOmics-APIs auf. Die aufgenommenen Daten sind 1,5 TB groß. Im Laufe des nächsten Monats führt er 1 000 Abfragen in Athena aus, um Allelhäufigkeiten für verschiedene Unterpopulationen zu berechnen, wobei jede im Durchschnitt 50 GB verbraucht. Seine monatlichen Gesamtkosten betragen:
Variantenspeicher: 0,035 GB/Monat x (1 024 GB/TB x 1,5 TB) = 53,76 USD
Amazon Athena: 5 USD/TB x 1 000 x 50 / 1 024 = 244,14 USD

Beispiel 4

Ein Informatiker möchte den GATK-BP Germline fq2vcf für den 30-fachen Genom-Ready2Run-Workflow in der Region USA Ost (Nord-Virginia) für 3 Proben ausführen. Der Kunde gibt seine Daten ein und ruft die StartRun-API für jedes Beispiel auf. Die Kosten für die 3 Läufe betragen:
GATK-BP Germline fq2vcf for 30x genome Ready2Run workflow: 10.00 USD/Ausführung x 3 = 30,00 USD
Insgesamt: 30,00 USD

Zusätzliche Ressourcen zur Preiskalkulation

AWS Pricing Calculator

Einfaches Berechnen Ihrer monatlichen Kosten für AWS

Cloud Economics Resource Center

AWS-Spezialisten kontaktieren, um ein personalisiertes Angebot zu erhalten