Häufig gestellte Fragen zu AWS HealthOmics

Allgemeines

AWS HealthOmics ist ein speziell entwickelter Service, der Unternehmen im Gesundheitswesen und in der Biowissenschaft dabei hilft, genomische, transkriptomische und andere Omics-Daten zu speichern, abzufragen und zu analysieren und aus diesen Daten Erkenntnisse zur Verbesserung der Gesundheit zu gewinnen. AWS HealthOmics unterstützt groß angelegte Analysen und kollaborative Forschung.

AWS HealthOmics bietet skalierbare Workflows und integrierte Tools für die Aufbereitung und Analyse von Omics-Daten und stellt die zugrunde liegende Infrastruktur automatisch bereit und skaliert sie, sodass Sie mehr Zeit für Forschung und Innovation aufwenden können. AWS HealthOmics unterstützt groß angelegte Analysen und kollaborative Forschung.

AWS HealthOmics kann Daten direkt aus dem Amazon Simple Storage Service (S3) oder dem AWS-HealthOmics-Speicher mit AWS HealthOmics privat und Ready2Run-Workflows verarbeiten. Sie können Daten wie genomische Rohdaten der Sequenzierung, Dateien im Variantenaufrufformat und Annotationsdatensätze aus Amazon S3 in bioinformatik-kompatible AWS-HealthOmics-Speicher- und Analytik-Speicher importieren. Sie können den Zugriff zur AWS-HealthOmics-Variante und Anmerkungsspeicher mit AWS Lake Formation kontrollieren und Amazon Athena verwenden, um die Daten-Abfrage zu erleichtern und sie mit anderen Datenformen zu kombinieren wie Patienten-Krankenakten von Amazon HealthLake. Sie können Amazon Athena auch verwenden, um Daten einfacher abzufragen und mit anderen Daten zu kombinieren, z. B. mit medizinischen Daten von Amazon HealthLake. Außerdem können Sie die umgewandelten Daten in Amazon QuickSight für erweiterte Analytics verwenden. Sie können auch Amazon SageMaker verwenden, um neuartige Algorithmen für Machine Learning zu erstellen, zu trainieren und auf Ihren multimodalen und multiomischen Daten einzusetzen. Schließlich können Sie Amazon EventBridge auch verwenden, um Ereignisse als Teil Ihrer ereignisgesteuerten Architektur zu veröffentlichen.

Wir haben zwei Arten von Datenspeichern, einen für biologische Rohdaten und einen für Varianten- und Annotationsdaten. AWS-HealthOmics-Speicher kann FASTA-formatierte Referenzgenome und g-komprimierte FASTQ-, BAM- und CRAM-formatierte Rohdaten der Sequenzierung importieren. AWS-HealthOmics-Analytik-Speicher können (g)VCF-formatierte Dateien für Variantendaten und VCF-, GFF- und TSV/CSV-Dateien für genomische Annotationen importieren. AWS-HealthOmics-Workflows können alle Daten lesen, die von Ihrer definierten Workflow-Definition und Ihren Tools unterstützt werden, entweder aus dem AWS-HealthOmics-Speicher oder aus Amazon S3.

AWS-HealthOmics-Workflows unterstützen Workflow-Definitionen, die mit der WDL-1.1-Spezifikation oder Nextflow 22.04.0 DSL2 konform sind. Derzeit müssen Tools, auf die von Workflows verwiesen wird, in OCI-kompatiblen Containern gekapselt und in einer privaten Registry in Amazon Elastic Container Registry (ECR) gespeichert sein. Workflow-Definitionen müssen bestimmte Endausgaben definieren – Zwischenergebnisse werden verworfen, wenn eine Workflow-Ausführung abgeschlossen ist. Das Zwischenspeichern von Workflow-Ausführungen oder -Aufgaben wird derzeit nicht unterstützt.

Private Workflows ermöglichen es Ihnen, Ihre eigenen Bioinformatik-Skripts mitzubringen, die in den am häufigsten verwendeten Workflow-Sprachen, WDL und Nextflow geschrieben sind. Sie können diese privaten Workflows mit einer einzigen Ausführung ausführen, die als Run bezeichnet wird. Für private Workflows zahlen Sie nur für das, was Sie nutzen, und werden für die verschiedenen Typen von Omics-Instances und die Speicherung von Ausführungen separat abgerechnet. Alle Aufgaben in Ihrem Workflow werden der Instance zugeordnet, die am besten zu Ihren definierten Ressourcen passt.

Ready2Run-Workflows sind vorgefertigte Workflows, die von branchenführenden Drittanbieter-Softwareunternehmen wie Sentieon, Inc., NVIDIA und Element Biosciences zusammen mit gängigen Open-Source-Pipelines wie dem GATK Best Practice Workflow des Broad Institute und AlphaFold für die Vorhersage der Proteinstruktur entwickelt wurden. Sie können einfach Ready2Run Workflows verwenden, um Ihre Daten mit den am häufigsten verwendeten Workflows wie Germline und GATK-8P des Broad Institute zu verarbeiten. Ready2Run-Workflows werden pro Lauf mit einem vorab festgelegten Preis abgerechnet. Das bedeutet, dass Ihnen für jeden Workflow der gleiche Preis berechnet wird.

Datenschutz und Datensicherheit

AWS HealthOmics ist HIPAA-fähig. Sie können attributbasierte Zugriffskontrollen verwenden, um festzulegen, wer Zugriff auf AWS-HealthOmics-Ressourcen hat. Alle persistenten Speicher unterstützen vom Kunden verwaltete Schlüssel. Zeilen- und Spaltenberechtigungen sind auch bei AWS-HealthOmics-Analytik-Speichern verfügbar. Die AWS-HealthOmics-APIs sind in AWS-CloudTrail- und Amazon-CloudWatch-Logs integriert, sodass Sie detaillierte Datenprovenienz- und Zugriffsprüfungsprotokolle erstellen können.

AWS HealthOmics ist ein HIPAA-fähiger Service. Wenn Sie geschützte Gesundheitsinformationen (PHI) auf AWS speichern, sind Sie verpflichtet, ein BAA zu haben. Sie können ein BAA schnell online abschließen, indem Sie AWS Artifact nutzen.