Funzionalità di AWS HealthOmics

AWS HealthOmics semplifica l'archiviazione, l'interrogazione e l'analisi di dati genomici, transcrittomici e altri dati omici e quindi la generazione di approfondimenti da tali dati. Semplifica e accelera il processo di archiviazione e analisi delle informazioni multiomiche per la ricerca e le applicazioni cliniche, in modo che tu possa concentrarti sulla derivazione di approfondimenti dai tuoi dati.

Con la memoria di AWS HealthOmics, puoi archiviare petabyte di dati omici in modo efficiente ed economico, consentendo la scoperta scientifica su scala di popolazione. I flussi di lavoro privati e Ready2Run di AWS HealthOmics automatizzano il provisioning e il ridimensionamento dell'infrastruttura di calcolo, in modo da poter eseguire pipeline di analisi bioinformatiche su scala di produzione e dedicare meno tempo alla gestione dell'infrastruttura e più tempo alla ricerca. AWS HealthOmics include una raccolta di flussi di lavoro Ready2Run predefiniti con prezzo in base alle esecuzioni. L'analisi di AWS HealthOmics semplifica la preparazione dei dati omici per le analisi multimodali, consentendoti di riunire i dati multiomici e delle cartelle cliniche e generare una terapia più mirata e personalizzata. Queste funzionalità sono anche conformi allo standard HIPAA.

Domande generali

L’archiviazione di AWS HealthOmics è compatibile con i formati di file bioinformatici come FASTQ, BAM e CRAM e consente di archiviare, scoprire e condividere questi dati in modo efficiente e a costo ridotto. Questi formati di file vengono archiviati come oggetti set di lettura all'interno di un archivio sequenza. Puoi inoltre possibile archiviare i genomi di riferimento nel formato FASTA. I dati vengono importati come oggetti immutabili con identificatori univoci per supportare i carichi di lavoro che richiedono una rigorosa provenienza dei dati. L'accesso a singoli oggetti di dati, inclusi riferimenti e oggetti set di lettura, può essere controllato utilizzando tag e controlli di accesso basati su attributi tramite AWS Identity and Access Management (IAM). Per ridurre i costi di archiviazione a lungo termine, gli oggetti dati a cui non è stato effettuato l'accesso entro 30 giorni vengono spostati automaticamente in una classe di memoria di archivio. Gli oggetti archiviati possono essere riattivati in qualsiasi momento con un richiamo API.

AWS HealthOmics ti aiuta a eseguire flussi di lavoro di bioinformatica su larga scala. Puoi scegliere i flussi di lavoro Ready2Run o portare i tuoi flussi di lavoro privati per elaborare i tuoi dati biologici senza la necessità di gestire l'infrastruttura sottostante.

I flussi di lavoro Ready2Run sono flussi di lavoro predefiniti progettati da società di software di terze parti leader del settore come Sentieon, Inc., NVIDIA ed Element Biosciences insieme a pipeline open source comuni come il flusso di lavoro sulle best practice GATK del Broad Institute e AlphaFold per la previsione della struttura delle proteine. Puoi semplicemente utilizzare i flussi di lavoro Ready2Run per elaborare i tuoi dati senza la necessità di gestire gli strumenti software o gli script del flusso di lavoro. I flussi di lavoro Ready2Run vengono pagati per esecuzione con un prezzo predeterminato.

I flussi di lavoro privati consentono di portare i propri script di flusso di lavoro scritti in Workflow Description Language (WDL) o Nextflow, che sono i due linguaggi di flusso di lavoro più utilizzati. Puoi eseguire questi flussi di lavoro privati con un'unica esecuzione, nota come esecuzione. Per i flussi di lavoro privati, il prezzo viene calcolato solo in base alle richieste e viene addebitato separatamente per i tipi di istanza omici e l'esecuzione dell'archiviazione. Tutte le attività nel tuo flusso di lavoro sono mappate all'istanza che si adatta meglio alle tue risorse definite.

Con AWS HealthOmics, puoi inserire e trasformare rapidamente formati di dati genomici come (g)VCF, GFF3 e TSV/CSV in tabelle Apache Iceberg. Puoi rendere accessibili i dati genomici tramite servizi di analisi come Amazon Athena. È possibile trasformare sia i dati delle varianti (dati di un singolo campione) sia i dati delle annotazioni (informazioni note sulle posizioni nel genoma). Puoi controllare l'accesso agli archivi di analisi con AWS Lake Formation, semplificando l'esecuzione di query su diverse origini dei dati implementando controlli di accesso granulari. Ad esempio, puoi combinare in modo sicuro i dati del genoma delle persone con la loro storia medica da Amazon HealthLake, che può includere trattamenti precedenti, farmaci o referti di laboratorio, per facilitare la medicina di precisione.

AWS HealthOmics semplifica la collaborazione tra i ricercatori attraverso l'etichettatura, l'impostazione delle autorizzazioni e la condivisione sicura dei dati con i collaboratori. Questo semplifica il modo in cui rendi i tuoi dati omici disponibili, accessibili, interoperabili e riutilizzabili (FAIR). Con i metadati specifici del dominio, puoi collegare i datastore di AWS HealthOmics con altri dati omici e sanitari per facilitare le analisi multiomiche e multimodali. Per la provenienza dei dati, AWS HealthOmics archivia tutti i metadati di esecuzione del flusso di lavoro nei log di CloudWatch e consente di archiviare facilmente le query su queste informazioni. Puoi esportare queste informazioni da CloudWatch a S3 per l'archiviazione a lungo termine. Queste informazioni possono aiutarti a tracciare quali algoritmi sono stati utilizzati con i tuoi dati di input per generare i dati di output per i tuoi requisiti di conformità.

Sicurezza, privacy e conformità

AWS HealthOmics è idoneo all'HIPAA. Puoi applicare controlli basati sugli attributi per definire l'accesso ai dati e la governance granulari. La registrazione completa e l'acquisizione della provenienza sono integrate in modo da sapere a quali dati si ha avuto l'accesso, chi vi ha avuto accesso e quando.