Logotipo de 23andMe

23andMe innova en el descubrimiento de fármacos y terapias con la HPC en AWS

2022

La empresa genómica y biotecnología, 23andMe proporciona pruebas genéticas directamente al cliente, lo que brinda a los clientes información valiosa sobre su genética. 23andMe necesitaba más escalabilidad y flexibilidad en su computación de alto rendimiento (HPC) para gestionar múltiples petabytes de datos de manera eficiente. La empresa utilizaba una solución local, pero comenzó a utilizar Amazon Web Services (AWS) en 2016 para almacenar datos importantes. En 2021, la empresa realizó una migración completa a la nube, un proceso que solo llevó 4 meses. Desde que adoptó los servicios de HPC de AWS, como Amazon Elastic Compute Cloud (Amazon EC2), que proporciona una capacidad informática segura y redimensionable para prácticamente cualquier carga de trabajo, y AWS Batch, que permite a los desarrolladores, científicos e ingenieros ejecutar de manera fácil y eficiente cientos de miles de trabajos de computación por lotes en AWS, 23andMe ha aumentado su escalabilidad, flexibilidad y optimización de costes.

case-study-600x300
kr_quotemark

Para darnos una idea de la escala, teníamos un pico de trabajo de computación en ejecución con más de 80 000 CPU virtuales funcionando a la vez. El uso de Amazon EC2 ha eliminado la contención de recursos para los investigadores de 23andMe».

Arnold de Leon
Gerente del Programa Sénior, 23andMe

 

Adoptar la nube para un almacenamiento de datos seguro

Con sede en California, 23andMe es conocida por sus kits de recolección de ADN para el hogar. La empresa también utiliza su base de datos de información genética para ampliar su comprensión de la biología y terapéutica a fin de desarrollar nuevos fármacos y terapias. Fundada en 2006, 23andMe ha recopilado una enorme cantidad de datos y ha generado millones de líneas de código para su investigación y terapéutica. Utilizan estos datos para el análisis de regresión, los estudios de asociación de todo el genoma y los estudios de correlación general entre conjuntos de datos. El mercado de las pruebas genéticas ha ido ganando impulso debido al aumento de la prevalencia de enfermedades genéticas, a la mayor sensibilización del público sobre los beneficios de la detección temprana y a la caída de los costes de la secuenciación genética en los últimos 16 años.
 
En un principio, 23andMe utilizaba una instalación local, pero a medida que aumentaban sus necesidades de almacenamiento de datos y computación, la empresa comenzó a recurrir a la nube para obtener una mayor escalabilidad y flexibilidad. Además, la empresa buscó reducir los costes operativos humanos para el mantenimiento de las instalaciones y acelerar su capacidad de adoptar nuevo hardware y tecnología mediante la transición a la nube. En 2016, la empresa comenzó a utilizar Amazon Simple Storage Service (Amazon S3), un servicio de almacenamiento de objetos que ofrece escalabilidad, disponibilidad de datos, seguridad y rendimiento líderes en el sector. «Si nos interesa un dato, lo almacenamos en Amazon S3», afirma Arnold de Leon, gerente del programa a cargo de los gastos en la nube de 23andMe. «Es una forma excelente de proteger los datos en lo que respecta a la durabilidad de los datos». 23andMe utiliza la clase de almacenamiento por niveles inteligente de Amazon S3 para migrar automáticamente los datos al nivel de acceso más rentable cuando cambian los patrones de acceso.
 
Cuando comenzó a utilizar los servicios en la nube, 23andMe probó una solución híbrida que ejecutaba cargas de trabajo en su centro de datos y en AWS de forma simultánea. Esta solución ofrecía cierta escalabilidad, pero conllevaba los costes asociados a la migración de datos de ida y vuelta entre el centro de datos local y la nube. Para lograr una mejor optimización de costes y, al mismo tiempo, obtener más flexibilidad y escalabilidad, 23andMe decidió migrar completamente a AWS en 2021.

Optimización del valor al ejecutar HPC en AWS

23andMe utilizó el Programa de Aceleración de la Migración de AWS (AWS MAP), un programa de migración a la nube exhaustivo y probado, que se basa en nuestra experiencia adquirida tras migrar a miles de clientes empresariales a la nube. Con AWS MAP, 23andMe pudo lograr una migración sin problemas en solo 4 meses. «Lo que AWS MAP nos ofrecía era la posibilidad de realizar un cambio rápido y masivo», afirma de Leon. «Por lo general, cuando se hace eso, es muy caro, pero AWS MAP solucionó ese problema». 23andMe migró todo de su centro de datos a la nube en AWS. Un año después de la migración a AWS, cuando el programa AWS MAP finaliza para 23andMe, está logrando una rentabilidad igual o mejor en cuanto a precios gracias a la diligencia del equipo a la hora de adoptar los servicios de AWS.

La gestión de los directorios de inicio basados en archivos de los científicos presentó otro reto. Para resolver este problema, 23andMe recurrió a Weka, un socio de AWS. El sistema de archivos paralelos WekaIO es funcional, rentable y compatible con Amazon S3. Esto ayudó al equipo interno de 23andMe a implementar cambios sin interrumpir la experiencia del cliente. Cuando se completó la migración, 23andMe comenzó a aprovechar los servicios de AWS para HPC, como las instancias C5 de Amazon EC2, que ofrecen un alto rendimiento rentable a un bajo precio por computación para ejecutar cargas de trabajo avanzadas con un uso intensivo de computación. Eligió este tipo de instancia de Amazon EC2 porque era la más parecida a sus recursos informáticos anteriores.

23andMe descubrió rápidamente las ventajas de tener una variedad de tipos de instancias de Amazon EC2 disponibles para su uso. «Disponemos de todo el menú de ofertas de Amazon EC2 y una forma de lograr la eficiencia es encontrar una solución óptima para el uso de los recursos», afirma Justin Graham, gerente de un grupo de ingeniería de infraestructura de 23andMe. A partir de 2022, la empresa utilizará muchos tipos de instancias de forma flexible, incluidas las instancias Amazon EC2 X2i, la próxima generación de instancias optimizadas para memoria que ofrecen mejoras en el rendimiento, la rentabilidad y los costes de las cargas de trabajo que consumen mucha memoria. 23andMe también usa AWS Batch para proporcionar recursos de dimensionamiento y coincidencia adecuados para determinar qué tipos de instancias usar, lo que ayuda a optimizar la relación precio-rendimiento.

23andMe puede escalar bajo demanda para adaptarse a la capacidad de computación de las cargas de trabajo reales y luego volver a reducirlo. «Para darnos una idea de la escala, teníamos un pico de trabajo de computación en ejecución, con más de 80 000 CPU virtuales funcionando a la vez», afirma de Leon. Además, el uso de instancias de Amazon EC2 ha eliminado la contención de recursos para los investigadores de 23andMe. «Recientemente, tuvimos una carga de trabajo de producción de 3 semanas que finalizó un 33 por ciento antes de lo previsto. Desde que migramos a AWS, nuestra capacidad de ofrecer recursos informáticos a nuestros investigadores es ahora incomparable», afirma Graham.

Si bien disfruta de estas ventajas de utilizar los servicios de HPC en AWS, 23andMe no ha tenido que comprometer sus objetivos de gastos iniciales. «Nuestro objetivo era mantener los mismos costes, pero ganar flexibilidad, capacidad y valor. Ahorrar tiene que ver menos con los resultados finales y más con lo que ganamos por lo que gastamos», afirma de Leon. 23andMe ha logrado aumentar la optimización de costes mediante el uso de una variedad de servicios de AWS, como Amazon Relational Database Service (Amazon RDS), un conjunto de servicios gestionados que facilita la configuración, el funcionamiento y el escalado de bases de datos en la nube, así como Amazon EC2. 23andMe apuesta por AWS y tiene como objetivo seguir optimizando la relación precio-rendimiento de sus cargas de trabajo.

Explorar las posibilidades futuras con flexibilidad en AWS

23andMe pudo migrar su entorno existente prácticamente sin cambios y, con el tiempo, comenzó a incorporar más servicios de AWS en su solución. La empresa busca nuevas formas de optimizar los costes con AWS, explorando servicios como el procesador AWS Graviton, que ofrece una excelente relación precio-rendimiento para las cargas de trabajo en la nube que se ejecutan en Amazon EC2. La empresa está buscando oportunidades para optimizar los costes y, al mismo tiempo, retener los recursos que necesita para la computación bajo demanda. «Han pasado unos 10 meses desde la migración y el objetivo final es acelerar el proceso desde la idea hasta la validación. Nuestros investigadores son más rápidos y eficientes, y esperamos ver un gran avance en la investigación», afirma de Leon. 


Acerca de 23andMe

23andMe, una empresa de genómica y biotecnología con sede en California, proporciona información genética a los clientes y ha agrupado miles de millones de puntos de datos para su estudio, lo que ha dado lugar a descubrimientos científicos.

Beneficios de AWS

  • Migró sin problemas a la nube en 4 meses
  • Se eliminó la contención entre los investigadores sobre los recursos de computación
  • Mayor escalabilidad, compatible con un trabajo de computación que se ejecuta en más de 80 000 CPU virtuales
  • Mayor eficiencia, completando una carga de trabajo de producción de 3 semanas un 33 % antes de lo previsto
  • Costes optimizados

Servicios de AWS utilizados

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) ofrece la plataforma de computación más amplia y profunda, con más de 500 instancias y la posibilidad de elegir el procesador, el almacenamiento, la red, el sistema operativo y el modelo de compra de vanguardia, en función de lo que mejor se ajuste a las necesidades que plantea la carga de trabajo.

Más información »

Amazon S3

Amazon Simple Storage Service (Amazon S3) es un servicio de almacenamiento de objetos que ofrece escalabilidad, disponibilidad de datos, seguridad y rendimiento líderes en el sector.

Más información »

Amazon MAP

El Programa de aceleración de la migración (MAP) de AWS es un programa de migración a la nube completo y probado que se basa en la experiencia de AWS para migrar miles de clientes empresariales a la nube.

Más información »

AWS Batch

AWS Batch permite a los desarrolladores, científicos e ingenieros ejecutar de manera fácil y eficiente cientos de miles de trabajos de computación por lotes en AWS.

Más información »


Introducción

Organizaciones de todos los tamaños y de todos los sectores se transforman y cumplen sus misiones todos los días gracias a AWS.
Contáctese con nuestros expertos e inicie hoy mismo su proceso de traspaso a la nube de AWS.