Atributos do AWS HealthOmics

O AWS HealthOmics facilita o armazenamento, a consulta e a análise de dados genômicos, transcriptômicos e outros dados ômicos e, em seguida, gera insights desses dados. Ele simplifica e acelera o processo de armazenamento e análise de informações multiômicas para pesquisas e aplicações clínicas para que você possa se concentrar em obter insights mais profundos de seus dados.

Com o armazenamento do AWS HealthOmics, você pode armazenar petabytes de dados ômicos de forma eficiente e econômica, permitindo a descoberta científica em escala populacional. Os fluxos de trabalho privados do AWS HealthOmics e Ready2Run automatizam o provisionamento e a escalabilidade da infraestrutura de computação para que você possa executar pipelines de análise de bioinformática em escala de produção e passar menos tempo gerenciando a infraestrutura e mais tempo realizando pesquisas. O AWS HealthOmics vem com uma coleção de fluxos de trabalho Ready2Run que são pré-criados e têm um preço por execução. A análise do AWS HealthOmics simplifica a preparação de dados ômicos para análises multimodais, permitindo que você reúna dados multiômicos e dados de prontuários médicos e gere uma terapia mais dirigida e mais personalizada. Esses atributos também são qualificados pela HIPAA.

Geral

O armazenamento do AWS HealthOmics é compatível com formatos de arquivo de bioinformática, como FASTQ, BAM e CRAM, e permite armazenar, descobrir e compartilhar esses dados de forma eficiente e a baixo custo. Esses formatos de arquivo são armazenados como objetos de conjunto de leitura em um armazenamento de sequências. Você também pode armazenar genomas de referência no formato FASTA. Os dados são importados como objetos imutáveis com identificadores exclusivos para serem compatibilidade com workloads que exijam rigorosa proveniência de dados. O acesso a objetos de dados individuais, incluindo referências e objetos de conjunto de leitura, pode ser controlado usando tags e controles de acesso baseados em atributos por meio do AWS Identity and Access Management (IAM). Para reduzir os custos de armazenamento a longo prazo, os objetos de dados que não foram acessados dentro de 30 dias são movidos automaticamente para uma classe de armazenamento de arquivamento. Os objetos arquivados podem ser reativados a qualquer momento com uma chamada de API.

O AWS HealthOmics ajuda você a executar fluxos de trabalho de bioinformática em escala. Você pode escolher fluxos de trabalho Ready2Run ou trazer seus próprios fluxos de trabalho privados para processar seus dados biológicos sem a necessidade de gerenciar a infraestrutura subjacente.

Os fluxos de trabalho Ready2Run são fluxos de trabalho pré-criados por empresas de software terceirizadas líderes do setor, como Sentieon, Inc., NVIDIA e Element Biosciences, juntamente com pipelines comuns de código aberto, como o fluxo de trabalho de práticas recomendadas do GATK fornecidas pelo Broad Institute e o AlphaFold para previsão da estrutura de proteínas. Você pode simplesmente usar os fluxos de trabalho Ready2Run para processar seus dados sem a necessidade de gerenciar as ferramentas de software ou os scripts de fluxo de trabalho. Os fluxos de trabalho Ready2Run são pagos por execução com um preço predeterminado.

Os fluxos de trabalho privados permitem que você traga seus próprios scripts de fluxo de trabalho escritos em Workflow Description Language (WDL) ou Nextflow, que são as duas linguagens de fluxo de trabalho mais usadas. É possível executar esses fluxos de trabalho privados com uma única realização, conhecida como execução. Para fluxos de trabalho privados, você paga somente pelo que solicita e a cobrança é efetuada separadamente para os tipos de instância ômica e para o armazenamento de execuções. Todas as tarefas em seu fluxo de trabalho são mapeadas para a instância mais adequada aos recursos definidos.

Com o AWS HealthOmics, você pode ingerir e transformar rapidamente formatos de dados genômicos, como (g)VCF, GFF3 e TSV/CSVs, em tabelas do Apache Iceberg. Você pode tornar os dados genômicos acessíveis por meio de serviços de análise, como o Amazon Athena. Você pode transformar dados de variantes (dados de uma amostra individual) e dados de anotação (informações conhecidas sobre posições no genoma). Você pode controlar o acesso a armazenamentos de análise com o AWS Lake Formation, facilitando a realização de consultas em diversas fontes de dados e, ao mesmo tempo, implementando controles de acesso de alta granularidade. Por exemplo, você pode combinar, com segurança, os dados do genoma de indivíduos com seu histórico médico do Amazon HealthLake, que pode incluir tratamentos anteriores, medicamentos ou resultados de laboratório, para facilitar a medicina de precisão.

O AWS HealthOmics facilita a colaboração dos pesquisadores por meio de marcação, definição de permissões e compartilhamento seguro de dados com colaboradores. Isso simplifica a forma como você torna seus dados ômicos fáceis de encontrar, acessíveis, interoperáveis e reutilizáveis (FAIR). Com metadados específicos do domínio, você pode vincular os armazenamentos de dados do AWS HealthOmics a outros dados ômicos e médicos para facilitar análises multiômicas e multimodais. Para a proveniência dos dados, o AWS HealthOmics arquiva todos os metadados de execução do fluxo de trabalho nos logs do CloudWatch e permite que você armazene facilmente essas informações de consulta. Você pode exportar essas informações do CloudWatch para o S3 para armazenamento de longo prazo. Essas informações podem ajudar você a rastrear quais algoritmos foram usados com seus dados de entrada para gerar seus dados de saída para seus requisitos de conformidade.

Segurança, privacidade e conformidade

O AWS HealthOmics é qualificado para HIPAA. Você pode aplicar controles baseados em atributos para definir o acesso e a governança dos dados com alta granularidade. Abrangente registro em log e captura de proveniência são incorporados para que você saiba quais dados foram acessados, quem os acessou e quando.