La solución de procesamiento de datos genómicos de AstraZeneca realiza 51 000 millones de pruebas en un día en AWS

2021

Unos 20 años después de la publicación del primer genoma humano, la genómica está pasando de ser una práctica intensiva en investigación a ser un motor de la medicina personalizada. Comprometida con esta transición, la empresa biofarmacéutica mundial AstraZeneca está acelerando el uso de la genómica en la medicina de precisión e impulsando la traslación de la genómica para transformar el descubrimiento de fármacos.

AstraZeneca utiliza petabytes de datos de secuenciación genómica para informar sobre la investigación y el desarrollo de fármacos. Para procesar rápidamente los datos a escala, AstraZeneca utilizó Amazon Web Services (AWS) para crear una solución rápida y eficaz para extraer información genómicas impactantes.

AstraZeneca Genomics en AWS: Un viaje desde los petabytes a los nuevos medicamentos (1:19)
kr_quotemark

“Hemos aportado información genética en más de 40 proyectos de descubrimiento de fármacos de AstraZeneca en 2020 gracias al uso de estas capacidades”.

Slavé Petrovski
VP, jefe de Análisis del Genoma e Informática, Centro de Investigación Genómica, I+D, AstraZeneca

Creación de una solución que libere a los científicos para innovar

Además de recopilar rápidamente información de los datos genómicos, AstraZeneca quería reasignar recursos a la exploración científica y evitar gastar el tiempo de la bioinformática en actividades de administración de datos de valor relativamente bajo. Dado que la empresa recopila petabytes de datos a través de múltiples fuentes en grandes ráfagas, necesitaba una capacidad informática potente y escalable.

Tras haber creado en AWS anteriormente, AstraZeneca decidió ampliar su uso de las herramientas de AWS para desarrollar una solución bioinformática basada en la nube para el procesamiento y análisis genómicos rápidos.

Automatización en AWS para producir información rápida

La solución de alto rendimiento de AstraZeneca realiza muchos pasos de procesamiento y análisis de datos genómicos. El análisis genómico secundario examina las lecturas de secuenciación en bruto para reconstruir un genoma e identificar variantes genómicas que puedan ser analizadas en etapas posteriores. Para automatizar la orquestación de datos de esos pasos, la arquitectura utiliza AWS Lambda, un servicio informático sin servidor que permite a los usuarios ejecutar código sin aprovisionar ni administrar servidores. Para crear una capa de ejecución de tareas, la arquitectura utiliza AWS Batch, que aprovisiona dinámicamente la cantidad y el tipo óptimos de recursos informáticos, como instancias optimizadas para la CPU o la memoria, en función del volumen y los requisitos específicos de recursos de los trabajos por lotes enviados. Por el camino, la arquitectura clasifica los datos en buckets mediante Amazon Simple Storage Service (Amazon S3), un servicio de almacenamiento de objetos.

En AWS, AstraZeneca aceleró y mejoró la productividad con escala, potencia informática y acceso a ricos servicios tecnológicos. Gracias a que la empresa puede realizar análisis a escala cuando los necesita, los datos están disponibles para su análisis más pronto. “Ahora podemos ejecutar más de 51 000 millones de pruebas estadísticas en menos de 24 horas y estudiar los efectos de mutaciones individuales o de genes individuales, cada uno de ellos con una amplia gama de fenotipos”, dice Slavé Petrovski, VP, jefe de Análisis e Informática del Genoma en el Centro de Investigación Genómica de AstraZeneca. Los esfuerzos de la empresa están dando sus frutos. “Hemos aportado información genética en más de 40 proyectos de descubrimiento de fármacos de AstraZeneca en 2020 gracias al uso de estas capacidades”, dice Petrovski.

Impulso a la innovación científica

AstraZeneca produjo una línea de bioinformática genómica rápida y eficaz que proporciona a sus científicos el tiempo y los recursos necesarios para seguir innovando. Gracias a ello, el Centro de Investigación Genómica de la empresa avanza en su objetivo de analizar dos millones de genomas para el 2026.


Sobre AstraZeneca

AstraZeneca es una empresa biofarmacéutica mundial que desarrolla medicamentos innovadores en una serie de áreas terapéuticas. El Centro de Investigación Genómica es una iniciativa de AstraZeneca que pretende analizar dos millones de genomas para 2026.

Beneficios de AWS

  • Permite ejecutar más de 51 000 millones de pruebas estadísticas en menos de 24 horas
  • Facilitó la entrega de información genómica a más de 40 proyectos de descubrimiento de fármacos en 2020
  • Se amplía o reduce para adaptarse a las demandas erráticas de la secuenciación genómica
  • Libera recursos para la exploración científica

Servicios de AWS utilizados

AWS Lambda

AWS Lambda es un servicio informático sin servidor que le permite ejecutar código sin aprovisionar ni administrar servidores, crear una lógica de escalado de clústeres basada en la carga de trabajo, mantener integraciones de eventos o administrar tiempos de ejecución.

Más información »

AWS Batch

AWS Batch permite a los desarrolladores, científicos e ingenieros ejecutar de manera fácil y eficiente cientos de miles de trabajos de computación por lotes en AWS.

Más información »

Amazon S3

Amazon Simple Storage Service (Amazon S3) es un servicio de almacenamiento de objetos que ofrece escalabilidad, disponibilidad de datos, seguridad y rendimiento líderes en el sector.

Más información »


Introducción

Cada día crece el número de empresas de todos los tamaños y sectores que consiguen transformar sus negocios gracias a AWS. Contacte con nuestros expertos e inicie hoy mismo su proceso de traspaso a la nube de AWS.