Implementación de referencia

DRAGEN de Illumina en AWS

Análisis de datos de secuenciación de última generación

Con esta solución de socios se implementa la plataforma Bio-IT DRAGEN (Dynamic Read Analysis for GENomics) de Illumina en la nube de Amazon Web Services (AWS).

La plataforma Bio-IT DRAGEN permite realizar análisis ultrarrápidos de datos de secuenciación de última generación (NGS), reduce radicalmente el tiempo necesario para analizar datos genómicos y mejora el nivel de precisión. Incluye canalizaciones de bioinformática que proveen algoritmos optimizados para realizar tareas de asignación, alineamiento, clasificación, marcado duplicado y llamado de variantes en haplotipos. Estas canalizaciones incluyen línea germinal, somática (tumor y tumor/normal), ARN, ARN unicelular, metilación, genotipado conjunto y DRAGEN-GATK.

Con esta solución de socios, se crea un entorno de AWS que abarca dos zonas de disponibilidad a fin de lograr alta disponibilidad y se aprovisionan dos entornos de computación por lotes de AWS para instancias de spot y bajo demanda. En estos entornos, se incluyen instancias de DRAGEN F1 que se conectan con matrices de puertas programables en campo (FPGA) a fin de obtener aceleración de hardware.

Logotipo de Illumina

Illumina desarrolló esta solución de socios en colaboración con AWS. Illumina es unsocio de AWS.


Los administradores de AWS Service Catalog pueden agregar esta arquitectura a su propio catálogo.  

  •  Lo que creará
  • Utilice esta solución de socio para configurar el siguiente entorno configurable en AWS:

    • Una arquitectura con alta disponibilidad que abarca dos zonas de disponibilidad.*
    • Una Virtual Private Cloud (VPC) configurada con subredes públicas y privadas de acuerdo con las prácticas recomendadas de AWS. Esto proporciona la infraestructura de red para la implementación*.
    • Una gateway de Internet para proporcionar acceso a Internet*.
    • En las subredes públicas, gateways administradas mediante NAT a fin de permitir acceso a Internet saliente para los recursos en las subredes privadas*.
    • Mediante una canalización de AWS CodePipeline, se crea una imagen de Docker y se la carga en el repositorio de Amazon Elastic Container Registry (Amazon ECR).
    • Dos entornos informáticos de AWS Batch: uno para instancias de spot de Amazon Elastic Compute Cloud (Amazon EC2) y el otro para instancias bajo demanda.
    • Una cola de trabajo de AWS Batch en la que se prioriza el envío al entorno informático para que se puedan optimizar costos mediante las instancias de spot.
    • Una definición de trabajo de AWS Batch para ejecutar DRAGEN.
    • Las funciones y políticas de AWS Identity and Access Management (IAM) para que se ejecuten los trabajos de AWS Batch.

    * En la plantilla con la que se implementa la solución del socio en una VPC existente, se omiten las tareas marcadas con asteriscos y se le pide la configuración de su VPC existente.

  •  Cómo implementar
  • Para implementar DRAGEN de Illumina, siga las instrucciones en la guía de implementación. El proceso de implementación incluye los siguientes pasos:

    1. Si aún no tiene una cuenta de AWS, regístrese en https://aws.amazon.com.
    2. Suscríbase a la plataforma Bio-IT DRAGEN en AWS Marketplace.
    3. Lance la solución del socio. Cada implementación tarda alrededor de 15 minutos. Puede elegir entre dos opciones:
    4. Para probar la implementación, ejecute un trabajo de DRAGEN.

    A fin de personalizar su implementación, configure la arquitectura de red, establezca la cantidad deseada de CPU virtuales en el entorno de AWS Batch, especifique un porcentaje de oferta para instancias de spot y establezca la cantidad de reintentos para trabajos de AWS Batch.

    Amazon puede compartir la información de implementación de los usuarios con el socio de AWS que colaboró con AWS en esta solución.  

  •  Costos y licencias
  • A fin de utilizar esta solución de socios, se requiere una suscripción a la imagen de máquina de Amazon (AMI) para la plataforma Bio-IT DRAGEN, que está disponible en AWS Marketplace con precios por hora.

    Usted es responsable del costo de los servicios de AWS, así como de las licencias de terceros que se utilicen, mientras se ejecuta esta solución. No se aplican cargos adicionales por el uso de la solución.

    En esta solución, se incluyen parámetros de configuración que puede personalizar. Algunas de estas configuraciones, como el tipo de instancia, afectan al costo del despliegue. Para hacer estimaciones de costos, consulte las páginas de precios de cada servicio de AWS que utilice. Los precios están sujetos a cambios.

    Sugerencia: Después de implementar una solución, cree Informes de costo y uso de AWS para realizar el seguimiento de los costos asociados. Dichos informes envían métricas de facturación a un bucket de Amazon Simple Storage Service (Amazon S3) en su cuenta. Suministran estimaciones de costos en función del uso de cada mes y agregan los datos a finales del mes. Para obtener más información, consulte ¿Qué son los informes de costo y uso de AWS?