Amazon Omics semplifica l'archiviazione, l'interrogazione e l'analisi di dati genomici, transcrittomici e altri dati omici e quindi la generazione di approfondimenti da tali dati. Semplifica e accelera il processo di archiviazione e analisi delle informazioni multiomiche per la ricerca e le applicazioni cliniche, in modo che tu possa concentrarti sulla derivazione di approfondimenti dai tuoi dati.

Con la memoria di Amazon Omics, puoi archiviare petabyte di dati omici in modo efficiente ed economico, consentendo la scoperta scientifica su scala di popolazione. I flussi di lavoro di Amazon Omics automatizzano il provisioning e il ridimensionamento dell'infrastruttura di calcolo, in modo da poter eseguire pipeline di analisi bioinformatiche su scala di produzione e dedicare meno tempo alla gestione dell'infrastruttura e più tempo alla ricerca. L'analisi di Amazon Omics semplifica la preparazione dei dati omici per le analisi multimodali, consentendoti di riunire i dati multiomici e delle cartelle cliniche e generare una terapia più mirata e personalizzata. Queste caratteristiche sono anche conformi allo standard HIPAA.

Domande generali

Archivio appositamente realizzato

L’archivio di Amazon Omics è compatibile con i formati di file bioinformatici come FASTQ, BAM e CRAM e consente di archiviare, scoprire e condividere questi dati in modo efficiente e a costo ridotto. Questi formati di file vengono archiviati come oggetti set di lettura all'interno di un archivio sequenza. Puoi inoltre possibile archiviare i genomi di riferimento nel formato FASTA. I dati vengono importati come oggetti immutabili con identificatori univoci per supportare i carichi di lavoro che richiedono una rigorosa provenienza dei dati. L'accesso a singoli oggetti di dati, inclusi riferimenti e oggetti set di lettura, può essere controllato utilizzando tag e controlli di accesso basati su attributi tramite AWS Identity and Access Management (IAM). Per ridurre i costi di archiviazione a lungo termine, gli oggetti dati a cui non è stato effettuato l'accesso entro 30 giorni vengono spostati automaticamente in una classe di memoria di archivio. Gli oggetti archiviati possono essere riattivati in qualsiasi momento con un richiamo API.

Flussi di lavoro di bioinformatica

Amazon Omics ti aiuta a eseguire flussi di lavoro di bioinformatica su larga scala. Specifica la definizione del flusso di lavoro, gli strumenti che desideri utilizzare e i dati da analizzare e Amazon Omics eseguirà il provisioning dell'infrastruttura principale e implementerà il flusso di lavoro. Sono supportate le definizioni del flusso di lavoro conformi alle specifiche WDL 1.1 e Nextflow 22.04.0 DSL2. I flussi di lavoro utilizzano strumenti containerizzati conformi a OCI archiviati in registri privati in Amazon Elastic Container Registry (ECR). Puoi analizzare i dati dai bucket S3 o dagli archivi di sequenza di Amazon Omics. È possibile controllare chi ha accesso a flussi di lavoro specifici, controllare la quantità totale di risorse utilizzate e gestire la priorità di implementazione tramite i gruppi di esecuzione del flusso di lavoro.

Analisi su larga scala

Con Amazon Omics, puoi inserire e trasformare rapidamente formati di dati genomici come (g)VCF, GFF3 e TSV/CSV in Apache Parquet. Puoi rendere accessibili i dati genomici tramite servizi di analisi come Amazon Athena. È possibile trasformare sia i dati delle varianti (dati di un singolo campione) sia i dati delle annotazioni (informazioni note sulle posizioni nel genoma). Puoi controllare l'accesso agli archivi di analisi con AWS Lake Formation, semplificando l'esecuzione di query su diverse origini dei dati implementando controlli di accesso granulari. Ad esempio, puoi combinare in modo sicuro i dati del genoma delle persone con la loro storia medica da Amazon HealthLake, che può includere trattamenti precedenti, farmaci o referti di laboratorio, per facilitare la medicina di precisione.

Collaborazione e provenienza dei dati

Amazon Omics rende più facile per i ricercatori taggare i collaboratori, impostare le loro autorizzazioni e condividere i dati in modo sicuro con loro. Questo semplifica il modo in cui rendi i tuoi dati omici disponibili, accessibili, interoperabili e riutilizzabili (FAIR). Con i metadati specifici del dominio, puoi collegare gli archivi di dati di Amazon Omics con altri dati omici e sanitari per facilitare le analisi multiomiche e multimodali.

Sicurezza, privacy e conformità

Conforme allo standard HIPAA

Amazon Omics è conforme allo standard HIPAA. Puoi applicare controlli basati sugli attributi per definire l'accesso ai dati e la governance granulari. La registrazione completa e l'acquisizione della provenienza sono integrate in modo da sapere a quali dati si ha avuto l'accesso, chi vi ha avuto accesso e quando.