Aspectos generales

P: ¿Qué es Amazon Omics?

Amazon Omics es un servicio diseñado específicamente para ayudar a las organizaciones del sector de la atención médica y las ciencias biológicas, así como a sus socios de software, a almacenar, consultar y analizar datos genómicos, transcriptómicos y otros datos ómicos y, de este modo, generar información a partir de esos datos con el objetivo de mejorar la salud. Permite la realización de análisis a gran escala y la colaboración entre investigadores.

P: ¿De qué manera Amazon Omics contribuye a aumentar la eficiencia?

Amazon Omics proporciona flujos de trabajo escalables y herramientas integradas para preparar y analizar datos ómicos. Además, aprovisiona y escala automáticamente la infraestructura subyacente, con lo cual podrá dedicar más tiempo a la investigación y la innovación. Amazon Omics admite análisis a gran escala e investigación colaborativa.

P: ¿Cómo funciona este servicio con otros servicios de AWS?

Amazon Omics puede procesar datos directamente desde Amazon Simple Storage Service (S3) o desde el almacenamiento de Amazon Omics mediante flujos de trabajo de Amazon Omics. Puede importar datos, como archivos de secuencias genómicas sin procesar, archivos de formato de llamado de variantes y conjuntos de datos de anotaciones, desde Amazon S3 a almacenes de almacenamiento y análisis de Amazon Omics compatibles con la biocomputación. Puede controlar el acceso a los almacenes de variantes y anotaciones de Amazon Omics mediante AWS Lake Formation y utilizar Amazon Athena para que sea más fácil consultar los datos y combinarlos con otras formas de datos, como los registros médicos de Amazon HealthLake. También puede utilizar Amazon Athena para que sea más fácil consultar los datos y combinarlos con otras formas de datos, como los registros médicos de Amazon HealthLake. Además, puede utilizar los datos transformados en Amazon QuickSight para realizar análisis avanzados. También puede utilizar Amazon SageMaker para crear, entrenar e implementar nuevos algoritmos de machine learning respecto a los datos multiómicos y multimodales.

P: ¿Qué formatos de datos admite Amazon Omics?

Contamos con dos tipos de almacenes de datos, uno para los datos biológicos sin procesar y otro para los datos de variantes y anotaciones. El almacenamiento de Amazon Omics puede importar genomas de referencia con formato FASTA y archivos de secuencia sin procesar con formato gzip FASTQ, BAM y CRAM. Los almacenes de análisis de Amazon Omics pueden importar archivos con formato (g)VCF para datos de variantes y archivos VCF, GFF y TSV/CSV para anotaciones genómicas. Los flujos de trabajo de Amazon Omics pueden leer cualquier dato compatible con la definición del flujo de trabajo y las herramientas definidas a partir del almacenamiento de Amazon Omics o de Amazon S3.

P: ¿Cuáles son las diferencias entre ejecutar flujos de trabajo de WDL o Nextflow con flujos de trabajo de Amazon Omics en lugar de sus implementaciones de motor de código abierto?

Los flujos de trabajo de Amazon Omics admiten definiciones de flujos de trabajo que cumplen con la especificación WDL 1.1 o Nextflow 22.04.0 DSL2. Actualmente, las herramientas a las que hacen referencia los flujos de trabajo se deben encapsular en contenedores que cumplan con la iniciativa de contenedores abiertos (OCI) y se almacenan en un registro privado de Amazon Elastic Container Registry (ECR). Las definiciones del flujo de trabajo deben definir resultados finales específicos: los resultados intermedios se descartan cuando se completa la ejecución del flujo de trabajo. Actualmente no es posible almacenar en caché las ejecuciones o tareas de los flujos de trabajo.

Privacidad y seguridad

P: ¿Qué tipo de seguridad ofrece Amazon Omics?

Amazon Omics cumple con los requisitos de la HIPAA. Se pueden utilizar controles de acceso basados en atributos para definir quién tiene acceso a los recursos de Amazon Omics. Todo el almacenamiento persistente admite claves administradas por el cliente. Los permisos de filas y columnas también se encuentran disponibles con los almacenes de análisis de Amazon Omics. Las API de Amazon Omics se integran con AWS CloudTrail y los Registros de Amazon CloudWatch para lograr obtener una procedencia detallada de los datos y seguimientos de auditoría de acceso.

P: ¿Se necesita un anexo para socios empresariales (BAA) antes de poder utilizar Amazon Omics?

Amazon Omics es un servicio que cumple con los requisitos de la HIPAA. Si almacena información de salud protegida (PHI) en AWS, está obligado a suscribir un anexo para socios empresariales (BAA). Puede suscribir rápidamente un anexo para socios empresariales (BAA) en línea mediante AWS Artifact.