O Amazon Omics facilita o armazenamento, a consulta e a análise de dados genômicos, transcriptômicos e outros dados ômicos e, em seguida, gera insights a partir desses dados. Ele simplifica e acelera o processo de armazenamento e análise de informações multiômicas para pesquisas e aplicações clínicas, para que você possa se concentrar em obter insights mais profundos de seus dados.

Com o armazenamento do Amazon Omics, você pode armazenar petabytes de dados ômicos de forma eficiente e econômica, permitindo a descoberta científica em escala populacional. Os fluxos de trabalho do Amazon Omics automatizam o provisionamento e a escalabilidade da infraestrutura de computação, para que você possa executar funis de análise bioinformática em escala de produção e passar menos tempo gerenciando a infraestrutura e mais tempo realizando pesquisas. A análise do Amazon Omics simplifica a preparação de dados ômicos para análises multimodais, permitindo que você reúna dados multiômicos e dados de prontuários médicos, e gere uma terapia mais dirigida e mais personalizada. Esses recursos também são qualificados pela HIPAA.

Geral

Armazenamento especializado

O armazenamento do Amazon Omics é compatível com formatos de arquivo de bioinformática, como FASTQ, BAM e CRAM e permite armazenar, descobrir e compartilhar esses dados de forma eficiente e a baixo custo. Esses formatos de arquivo são armazenados como objetos de conjunto de leitura em um armazenamento de sequências. Você também pode armazenar genomas de referência no formato FASTA. Os dados são importados como objetos imutáveis com identificadores exclusivos para serem compatibilidade com workloads que exijam rigorosa proveniência de dados. O acesso a objetos de dados individuais, incluindo referências e objetos de conjunto de leitura, pode ser controlado usando tags e controles de acesso baseados em atributos por meio do AWS Identity and Access Management (IAM). Para reduzir os custos de armazenamento a longo prazo, os objetos de dados que não foram acessados dentro de 30 dias são movidos automaticamente para uma classe de armazenamento de arquivamento. Os objetos arquivados podem ser reativados a qualquer momento com uma chamada de API.

Fluxos de trabalho de bioinformática

O Amazon Omics ajuda você a executar fluxos de trabalho de bioinformática em escala. Especifique a definição de fluxo de trabalho, as ferramentas que você deseja usar e os dados a serem analisados, e o Amazon Omics provisionará a infraestrutura subjacente e implementará o fluxo de trabalho. Definições de fluxo de trabalho que atendem às especificações DSL2 do WDL 1.1 e do Nextflow 22.04.0 são compatíveis. Os fluxos de trabalho usam ferramentas em contêiner compatíveis com OCI armazenadas em registros privados no Amazon Elastic Container Registry (ECR). Você pode analisar dados de buckets do S3 ou de armazenamentos de sequências do Amazon Omics. Você pode controlar quem tem acesso a fluxos de trabalho específicos, controlar a quantidade total de recursos usados e gerenciar a prioridade de implementação por meio de grupos de execução de fluxo de trabalho.

Análise em escala

Com o Amazon Omics, você pode ingerir e transformar rapidamente formatos de dados genômicos como (g)VCF, GFF3 e TSV/CSVs em Apache Parquet. Você pode tornar os dados genômicos acessíveis por meio de serviços de análise, como o Amazon Athena. Você pode transformar dados de variantes (dados de uma amostra individual) e dados de anotação (informações conhecidas sobre posições no genoma). Você pode controlar o acesso a armazenamentos de análise com o AWS Lake Formation, facilitando a realização de consultas em diversas fontes de dados e, ao mesmo tempo, implementando controles de acesso de alta granularidade. Por exemplo, você pode combinar, com segurança, os dados do genoma de indivíduos com seu histórico médico do Amazon HealthLake, que pode incluir tratamentos anteriores, medicamentos ou resultados de laboratório, para facilitar a medicina de precisão.

Colaboração e proveniência de dados

O Amazon Omics torna mais fácil para os pesquisadores marcar os colaboradores, configurar suas permissões e compartilhar dados com eles em segurança. Isso simplifica a forma como você torna seus dados ômicos fáceis de encontrar, acessíveis, interoperáveis e reutilizáveis (FAIR). Com metadados específicos do domínio, você pode vincular os armazenamentos de dados do Amazon Omics a outros dados ômicos e médicos para facilitar análises multiômicas e multimodais.

Segurança, privacidade e conformidade

Qualificado pela HIPAA

O Amazon Omics é qualificado pela HIPAA. Você pode aplicar controles baseados em atributos para definir o acesso e a governança dos dados com alta granularidade. Abrangente registro em log e captura de proveniência são incorporados para que você saiba quais dados foram acessados, quem os acessou e quando.