Domande frequenti su AWS HealthOmics

Domande generali

AWS HealthOmics è un servizio appositamente realizzato che aiuta le organizzazioni del settore sanitario e delle scienze biologiche e i loro partner software ad archiviare, interrogare e analizzare i dati genomici, transcrittomici e altri dati omici e quindi generare approfondimenti da tali dati per migliorare la salute. Supporta analisi su larga scala e ricerche in collaborazione.

AWS HealthOmics fornisce flussi di lavoro scalabili e strumenti integrati per la preparazione e l'analisi dei dati omici e fornisce e ridimensiona automaticamente l'infrastruttura principale, in modo da poter dedicare più tempo alla ricerca e all'innovazione. AWS HealthOmics supporta analisi su larga scala e ricerche in collaborazione.

AWS HealthOmics può elaborare i dati direttamente dall’archiviazione di Amazon Simple Storage Service (S3) o AWS HealthOmics con i flussi di lavoro privati e Ready2Run di AWS HealthOmics. Puoi importare dati come file di sequenze genomiche grezze, file in formato di richiamo delle varianti e set di dati di annotazioni da Amazon S3 nella memoria di AWS HealthOmics compatibile con la bioinformatica e negli archivi analitici. Puoi controllare l'accesso alla variante di AWS HealthOmics e agli archivi di annotazione con AWS Lake Formation e utilizzare Amazon Athena per facilitare l'interrogazione dei dati e combinarli con altri tipi di dati, come le cartelle cliniche di Amazon HealthLake. Puoi anche utilizzare Amazon Athena per facilitare l'interrogazione dei dati e combinarli con altri tipi di dati, come le cartelle cliniche di Amazon HealthLake. Inoltre, puoi utilizzare i dati trasformati in Amazon QuickSight per analisi avanzate. Puoi anche utilizzare Amazon SageMaker per creare, addestrare e distribuire nuovi algoritmi di machine learning sui tuoi dati multiomici e multimodali. Infine, puoi anche utilizzare Amazon EventBridge per pubblicare eventi come parte della tua architettura basata sugli eventi.

Disponiamo di due tipi di archivio dati, uno per i dati biologici grezzi e uno per i dati di varianti e annotazioni. L’archiviazione di AWS HealthOmics può importare genomi di riferimento in formato FASTA e file di sequenze grezze in formato FASTQ, BAM e CRAM compressi con gzip. Gli archivi analitici di AWS HealthOmics possono importare file in formato (g)VCF per i dati delle varianti e file VCF, GFF e TSV/CSV per le annotazioni genomiche. I flussi di lavoro di AWS HealthOmics possono leggere qualsiasi dato supportato dalla definizione del flusso di lavoro e dagli strumenti definiti dalla memoria di AWS HealthOmics o da Amazon S3.

I flussi di lavoro di AWS HealthOmics supportano definizioni di flussi di lavoro conformi alla specifica WDL 1.1 o Nextflow 22.04.0 DSL2. Attualmente, gli strumenti a cui fanno riferimento i flussi di lavoro devono essere incapsulati in container conformi a OCI e archiviati in un registro privato in Amazon Elastic Container Registry (ECR). Le definizioni del flusso di lavoro devono definire output finali specifici: i risultati intermedi vengono eliminati al termine dell'esecuzione di un flusso di lavoro. La memorizzazione nella cache delle esecuzioni del flusso di lavoro o delle attività non è attualmente supportata.

I flussi di lavoro privati ti consentono di portare i tuoi script bioinformatici scritti nei linguaggi di flusso di lavoro più comunemente usati. Puoi eseguire questi flussi di lavoro privati con un'unica esecuzione, nota come esecuzione. Per i flussi di lavoro privati, il prezzo viene calcolato solo in base alle richieste e viene addebitato separatamente per i tipi di istanza omici e l'esecuzione dell'archiviazione. Tutte le attività nel tuo flusso di lavoro sono mappate all'istanza che si adatta meglio alle tue risorse definite.

I flussi di lavoro Ready2Run sono flussi di lavoro predefiniti progettati da società di software terze leader del settore come Sentieon, Inc., NVIDIA ed Element Biosciences insieme a pipeline open source comuni come il flusso di lavoro sulle best practice GATK del Broad Institute e AlphaFold per la previsione della struttura delle proteine. Puoi semplicemente utilizzare i flussi di lavoro Ready2Run per elaborare i tuoi dati con i flussi di lavoro più comunemente usati come Germline e GATK-8P del Broad Institute. I flussi di lavoro Ready2Run vengono pagati per esecuzione con un prezzo predeterminato. Ciò significa che ti viene addebitato lo stesso prezzo per ogni flusso di lavoro.

Privacy e sicurezza

AWS HealthOmics è idoneo all'HIPAA. Puoi utilizzare i controlli di accesso basati sugli attributi per definire chi ha accesso alle risorse di AWS HealthOmics. Tutta la memoria persistente supporta le chiavi gestite dal cliente. Le autorizzazioni di riga e colonna sono disponibili anche con gli archivi analitici di AWS HealthOmics. Le API di AWS HealthOmics sono integrate con i log di AWS CloudTrail e Amazon CloudWatch per consentirti di generare una provenienza dettagliata dei dati e accedere ad audit trail.

AWS HealthOmics è un servizio conforme allo standard HIPAA. Se archivi informazioni sanitarie protette (PHI) su AWS, devi disporre di un BAA. Puoi entrare rapidamente in un BAA online utilizzando AWS Artifact.