Amazon Omics erleichtert das Speichern, Abfragen und Analysieren von Genom-, Transkriptom- und anderen Omics-Daten und ermöglicht die Gewinnung von Erkenntnissen aus diesen Daten. Es vereinfacht und beschleunigt den Prozess der Speicherung und Analyse von Multiomics-Informationen für Forschung und klinische Anwendungen, sodass Sie sich darauf konzentrieren können, detailliertere Erkenntnisse aus Ihren Daten zu gewinnen.

Mit Amazon-Omics-Speicher können Sie Petabytes an Omics-Daten effizient und kostengünstig speichern und so wissenschaftliche Entdeckungen im Populationsmaßstab ermöglichen. Amazon-Omics-Workflows automatisieren die Bereitstellung und Skalierung der Datenverarbeitungsinfrastruktur, sodass Sie bioinformatische Analysepipelines im Produktionsmaßstab ausführen können und weniger Zeit für die Verwaltung der Infrastruktur müssen und mehr Zeit für die Forschung aufwenden können. Amazon-Omics-Analytics vereinfacht die Aufbereitung von Omics-Daten für multimodale Analysen. So können Sie Multiomics- und Gesundheitsdaten zusammenführen und eine gezieltere und personalisierte Therapie entwickeln. Diese Funktionen sind auch HIPAA-konform.

Allgemeines

Speziell entwickelter Speicher

Der Amazon-Omics-Speicher ist mit bioinformatischen Dateiformaten wie FASTQ, BAM und CRAM kompatibel und ermöglicht es Ihnen, diese Daten effizient und kostengünstig zu speichern, zu entdecken und zu teilen. Diese Dateiformate werden als Lesesatzobjekte in einem Sequenzspeicher gespeichert. Sie können auch Referenzgenome im FASTA-Format speichern. Daten werden als unveränderliche Objekte mit eindeutigen Bezeichnern importiert, um Workloads zu unterstützen, die eine strenge Datenprovenienz erfordern. Der Zugriff auf einzelne Datenobjekte, einschließlich Referenzen und Lesesatzobjekte, kann mithilfe von Tags und attributbasierten Zugriffskontrollen über AWS Identity and Access Management (IAM) kontrolliert werden. Um die langfristigen Speicherkosten zu senken, werden Datenobjekte, auf die innerhalb von 30 Tagen nicht zugegriffen wurde, automatisch in eine Archivspeicherklasse verschoben. Archivierte Objekte können jederzeit mit einem API-Aufruf reaktiviert werden.

Bioinformatik-Workflows

Amazon Omics unterstützt Sie bei der Ausführung von Bioinformatik-Workflows im großen Maßstab. Geben Sie Ihre Workflow-Definition, die Tools, die Sie verwenden möchten, und die zu analysierenden Daten an. Amazon Omics stellt die zugrunde liegende Infrastruktur bereit und implementiert den Workflow. Workflow-Definitionen, die den Spezifikationen WDL 1.1 und Nextflow 22.04.0 DSL2 entsprechen, werden unterstützt. Workflows verwenden OCI-konforme containerisierte Tools, die in privaten Registrys in Amazon Elastic Container Registry (ECR) gespeichert sind. Sie können Daten aus S3-Buckets oder Amazon-Omics-Sequenzspeichern analysieren. Sie können steuern, wer Zugriff auf bestimmte Workflows hat, die Gesamtmenge der verwendeten Ressourcen kontrollieren und die Priorität der Implementierung über Workflow-Ausführungsgruppen verwalten.

Analyse im großen Maßstab

Mit Amazon Omics können Sie genomische Datenformate wie (g)VCF, GFF3 und TSV/CSVs schnell in Apache Parquet einlesen und umwandeln. Sie können die Genomikdaten über Analystics-Services wie Amazon Athena zugänglich machen. Sie können sowohl Variantendaten (Daten aus einer einzelnen Probe) als auch Annotationsdaten (bekannte Informationen über Positionen im Genom) umwandeln. Mit AWS Lake Formation können Sie den Zugriff auf Analytics-Speicher steuern und so die Durchführung von Abfragen über verschiedene Datenquellen hinweg erleichtern, während Sie gleichzeitig eine feinkörnige Zugriffskontrolle implementieren. So können Sie zum Beispiel die Genomdaten von Personen sicher mit ihrer medizinischen Vorgeschichte aus Amazon HealthLake kombinieren, die frühere Behandlungen, Medikamente oder Laborberichte umfassen kann, um die Präzisionsmedizin zu erleichtern.

Datenzusammenarbeit und -provenienz

Amazon Omics macht es Forschern leichter, Zusammenarbeitsteilnehmer zu markieren, ihre Berechtigungen einzurichten und Daten sicher mit ihnen zu teilen. Dies vereinfacht es Ihnen, Ihre Omics-Daten auffindbar, zugänglich, interoperabel und wiederverwendbar (findable, accessible, interoperable, and reusable; FAIR) zu machen. Mit domänenspezifischen Metadaten können Sie Amazon-Omics-Datenspeicher mit anderen Omics- und Gesundheitsdaten verknüpfen, um Multiomics- und multimodale Analysen zu erleichtern.

Sicherheit, Datenschutz und Compliance

HIPAA-konform

Amazon Omics ist HIPAA-konform. Sie können attributbasierte Kontrollen anwenden, um einen feinkörnigen Datenzugriff und Governance zu definieren. Umfassende Protokollierung und Provenance-Erfassung sind integriert, damit Sie wissen, auf welche Daten zugegriffen wurde, wer darauf zugegriffen hat und wann.