Historias de los clientes / Ciencias biológicas

2022
Logotipo de Vertex

Vertex Pharmaceuticals reduce los costes del almacenamiento y procesamiento de datos de criomicroscopía electrónica en un 50 % con AWS

Descubra cómo Vertex Pharmaceuticals acelera el descubrimiento de fármacos mediante la ejecución de sus flujos de trabajo de criomicroscopía electrónica en AWS.

2 veces

más rendimiento

>50 %

de reducción de costes

Varios días

de mejora en los tiempos de procesamiento de datos

3 meses

para completar el prototipo de la nueva arquitectura

Mayor

escalabilidad y mejor productividad

Información general

Vertex Pharmaceuticals (Vertex) es una empresa global de biotecnología que invierte en innovación científica para crear medicamentos transformadores para las personas con enfermedades graves. Vertex utiliza la criomicroscopía electrónica para generar imágenes sofisticadas e información sobre la estructura 3D de una proteína y la estructura de los posibles objetivos farmacológicos. Mediante ese proceso, los químicos de la empresa pueden diseñar mejores moléculas de fármacos mediante la optimización de su estructura para que se unan a sus objetivos.
 
Sin embargo, los flujos de trabajo de criomicroscopía electrónica necesitan una enorme cantidad de recursos informáticos y de almacenamiento. Los científicos que realizan análisis en varios centros de investigación generan petabytes de datos. Vertex necesitaba hacer que su infraestructura fuera escalable para satisfacer sus crecientes necesidades y, al mismo tiempo, proporcionar una adecuada potencia de procesamiento para acelerar la investigación.
 
Vertex migró su almacenamiento y procesamiento de datos a Amazon Web Services (AWS). La empresa utilizó varios servicios de AWS, incluido Amazon Elastic Compute Cloud (Amazon EC2), que ofrece una capacidad informática segura y redimensionable para soportar prácticamente cualquier carga de trabajo. Vertex mejoró el rendimiento de sus cargas de trabajo de computación de alto rendimiento (HPC), aceleró los análisis de datos e hizo que su sistema fuera escalable, al tiempo que redujo los costes generales de almacenamiento y computación en más de un 50 por ciento.
Científicos que trabajan en un laboratorio

Oportunidad | Aceleración del rendimiento del procesamiento de los flujos de trabajo de criomicroscopía electrónica para generar información más rápido 

Vertex utiliza la criomicroscopía electrónica para descubrir tratamientos para las enfermedades mediante el análisis de la estructura molecular de los posibles objetivos farmacológicos. «La criomicroscopía electrónica nos ayuda a alcanzar la suficiente resolución para obtener información más detallada sobre las estructuras de las proteínas que hace solo unos años no podíamos estudiar», afirma David Posson, científico investigador principal de Vertex Pharmaceuticals.
 
Sin embargo, si bien esta tecnología avanzada desbloqueó el potencial de nuevos descubrimientos y tratamientos, también aumentó la necesidad de tener capacidad de almacenamiento y computación. «Al utilizar un microscopio para criomicroscopía electrónica, se generan terabytes de datos todos los días», asegura Roberto Iturralde, director sénior de Ingeniería de Software de Vertex Pharmaceuticals. «Es normal generar 1 PB de datos en 1 año». Además, los científicos necesitan la información rápido. La infraestructura local de Vertex para ejecutar sus cargas de trabajo de criomicroscopía electrónica tenía dificultades para mantenerse al día con sus crecientes demandas de computación y almacenamiento.
 
Inicialmente, Vertex tuvo que usar discos duros para transferir todos los datos de los microscopios de las instalaciones externas a su centro de datos, lo que tardó semanas. Cuando llegaban nuevos datos, los clústeres locales de HPC de la empresa no podían gestionar las ráfagas de actividad con eficiencia. Tampoco podían desescalar verticalmente durante los períodos de baja actividad.
 
El almacenamiento de datos a largo plazo presentaba otro desafío. Después de unas semanas, los científicos rara vez accedían a los datos microscópicos más antiguos. Sin embargo, el entorno local de Vertex no estaba optimizado para ahorrar en función de los patrones de uso y acceso. Como el dominio evolucionaba rápido, cada vez era más caro mantenerse al día con las continuas actualizaciones de hardware, software, redes y seguridad necesarias para administrar la infraestructura local de criomicroscopía electrónica. A principios de 2022, Vertex se dio cuenta de que necesitaba una solución más elástica con un mejor rendimiento.
 
Vertex ya utilizaba AWS desde 2015 para distintas cargas de trabajo. Inspirándose en las nuevas características lanzadas en AWS re:Invent 2021, Vertex rediseñó toda su carga de trabajo de criomicroscopía electrónica y la migró a AWS. La empresa creó un prototipo de la nueva arquitectura en solo 3 meses. «AWS cuenta con el conjunto más amplio y profundo de tecnologías nativas en la nube que queremos usar en Vertex», señala Iturralde. «Gracias a AWS, cambiamos rápidamente a un nuevo diseño que cumplía mejor con los requisitos cambiantes de nuestros científicos».
kr_quotemark

Al trabajar en AWS, podemos dedicar más tiempo a concentrarnos en cómo podemos innovar. Podemos ser creativos y aprovechar la nube para acelerar nuestra ciencia».

Roberto Iturralde
Director sénior de Ingeniería de Software, Vertex Pharmaceuticals

Solución | Reducción de los costes de almacenamiento de datos y aceleración del procesamiento con AWS ParallelCluster 

Con la migración a AWS, Vertex migró sus cargas de trabajo más cerca del sitio de llegada de los datos a Amazon Simple Storage Service (Amazon S3), un servicio de almacenamiento de objetos que ofrece escalabilidad, disponibilidad de datos, seguridad y rendimiento líderes en el sector. Vertex también utiliza Amazon FSx para Lustre, un almacenamiento compartido totalmente administrado e integrado en uno de los sistemas de archivos de alto rendimiento más populares del mundo, para ofrecer a los científicos la cantidad exacta de recursos de almacenamiento que necesitan durante un análisis activo.

Tras el procesamiento, Vertex vuelve a enviar los datos a Amazon S3. La empresa clasifica los datos de manera eficiente mediante las políticas del ciclo de vida de Amazon S3, conjuntos de reglas que definen las acciones que Amazon S3 aplica a un grupo de objetos. «Con las políticas del ciclo de vida de Amazon S3, podemos colocar los datos en diferentes niveles para reducir el coste de almacenamiento», afirma Iturralde. La empresa también puede escalar su almacenamiento sin problemas, lo que limita los gastos generales del centro de datos.

Para administrar la computación del procesamiento de datos, Vertex utiliza AWS ParallelCluster, una herramienta de administración de clústeres de código abierto que facilita la implementación y administración de clústeres de HPC elásticos en AWS. Activará y desactivará los nodos de HPC en función de las demandas del software de análisis. «Cuando terminen, podemos volver a pagar casi nada», advierte Iturralde. «No necesitamos preocuparnos de que el ritmo de la ciencia agote nuestros recursos o desvíe nuestra atención hacia el mantenimiento de la infraestructura».

Al hacer coincidir sus costes de computación con las demandas de carga de trabajo, Vertex redujo los costes en un 50 por ciento. También logró un rendimiento dos veces mejor que su arquitectura anterior. Además, Vertex eliminó los obstáculos a los que se enfrentaba su equipo de criomicroscopía electrónica en el entorno local a la hora de compartir los recursos con otros grupos, algo que hacía a menudo. «Antes, analizar los datos de criomicroscopía electrónica llevaba varias semanas, incluso cuando nadie más utilizaba los recursos», explica Posson. «Ahora, con AWS, podemos entregar datos de manera confiable en menos de 1 semana».

Vertex agregó la compatibilidad nativa con el inicio de sesión único mediante Amazon Cognito, que las empresas pueden utilizar para añadir el registro, el inicio de sesión y el control de acceso a las aplicaciones web y móviles de forma rápida y sencilla. «El uso de Amazon Cognito nos brinda la comodidad adicional de que solo los empleados correspondientes tengan acceso al software», señala Iturralde. Además, Vertex utiliza el equilibrador de carga de aplicación, que equilibra la carga del tráfico HTTP y HTTPS con un avanzado enrutamiento de solicitudes destinado a la entrega de aplicaciones modernas, para proteger su red.

En AWS, Vertex hizo que sus procesos sean eficientes, escalables y rentables, al mismo tiempo que reduce el mantenimiento manual. Basarse en AWS también significa que la empresa tiene acceso a los recursos informáticos y de GPU más recientes sin los meses de espera asociados a la adquisición de hardware para centros de datos. Por ejemplo, Vertex ejecuta instancias G5 de Amazon EC2, que ofrecen una potente combinación de capacidad de CPU, memoria de host y GPU. Mediante la ejecución de los procesos de criomicroscopía electrónica en la nube, los científicos pueden realizar análisis casi en tiempo real. Vertex utiliza el costes tiempo del microscopio con mayor eficiencia y facilita los avances científicos.

Resultado | Aceleración del procesamiento de datos para agilizar la investigación con Amazon EC2 

Vertex ya redujo el tiempo necesario para entregar los resultados del análisis y espera acelerarlo aún más. «Con el procesamiento en vivo, podríamos iniciar el análisis justo cuando los datos salen del microscopio», asegura Posson. «Tal vez podamos reducir nuestro plazo de 1 semana a la mitad».
 
Vertex también planea seguir haciendo que su infraestructura de HPC sea más elástica y nativa en la nube para ahorrar. «Al trabajar en AWS, podemos dedicar más tiempo a centrarnos en cómo podemos innovar», afirma Iturralde. «Podemos ser creativos y aprovechar la nube para acelerar nuestra ciencia».

Acerca de Vertex Pharmaceuticals

Vertex es una empresa farmacéutica con sede en Boston que estudia las moléculas complejas e investiga los tratamientos para las enfermedades graves con las últimas tecnologías microscópicas de todo el mundo.

Servicios de AWS utilizados

Amazon S3

Amazon Simple Storage Service (Amazon S3) es un servicio de almacenamiento de objetos que ofrece escalabilidad, disponibilidad de datos, seguridad y rendimiento líderes en el sector.

Más información »

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) ofrece una capacidad informática segura y redimensionable para prácticamente cualquier carga de trabajo.

Más información »

AWS ParallelCluster

AWS ParallelCluster es una herramienta de administración de clústeres de código abierto que facilita la implementación y la administración de clústeres de computación de alto rendimiento (HPC) en AWS.

Más información »

Amazon FSx para Lustre

Amazon FSx para Lustre proporciona un almacenamiento compartido completamente administrado con la escalabilidad y el rendimiento del conocido sistema de archivos Lustre.

Más información »

Comenzar

Organizaciones de todos los tamaños y de todos los sectores transforman sus negocios y cumplen sus misiones todos los días con AWS. Contacte nuestros expertos y comience hoy mismo su propia jornada en AWS.