La Escuela de Medicina de Icahn de Mount Sinai en la Ciudad de Nueva York, N.Y., es una institución reconocida internacionalmente en la capacitación médica y científica, la investigación biomédica y la atención al paciente. La institución trabaja para ampliar sus conocimientos biomédicos, brindar atención clínica y servir a la comunidad. La Escuela de Medicina de Icahn trabaja codo a codo con el Hospital de Mount Sinai, y sirve a una de las poblaciones más diversas y complejas del mundo.

Los investigadores y médicos de la Escuela de Medicina de Icahn están intentando develar los secretos genéticos del cáncer de mama y de ovario. Los doctores John A. Martignetti y Peter R. Dottino en Mount Sinai y sus colaboradores en Station X están estudiando más de 2 000 tumores de mama y ovario, y secuencias de ADN de la línea germinal generadas por The Cancer Genome Atlas Consortium (TCGA). TCGA constituye un esfuerzo integral y coordinado cuyo fin es agilizar nuestra comprensión de la base molecular del cáncer mediante la aplicación de tecnologías de análisis del genoma, incluida la secuenciación del genoma a gran escala. TCGA es un esfuerzo conjunto del Instituto Nacional del Cáncer de los Estados Unidos (NCI) y el Instituto Nacional de Investigación del Genoma Humano de los Estados Unidos (NHGRI), dos de los 27 institutos y centros de los Institutos Nacionales de Salud, Departamento de los Estados Unidos y Servicios Humanos.

Este es un problema importante que requiere una base informática considerable, ya que los científicos analizan más de 100 TB de datos, deducen hipótesis nuevas y vuelven a analizar los datos. Todas las mujeres con riesgo genético hereditario de contraer cualquiera de los dos tipos de cáncer, mutaciones en la línea germinal, ya sea en BRCA1 o 2, representan casi a la mitad. Los investigadores están tratando de encontrar las conexiones genéticas que faltan en aquellas que no tienen la mutación BRCA1/2.

En colaboración con Station X, los doctores Martignetti y Dottino pudieron conseguir la ayuda de un proveedor de soluciones que logró ofrecer una plataforma analítica segura y robusta para realizar el trabajo. Station X desarrolla GenePool™, una plataforma de software genómica para científicos y médicos que trabajan con datos genómicos humanos en la etapa temprana y en cuadros clínicos.

La extracción de información a partir de terabytes de datos genómicos – garantizando en todo momento la seguridad de la información – exige una plataforma flexible y de alto desempeño con almacenamiento de big data y un control riguroso del acceso. Era obvio que se trataba de un trabajo para la informática en la nube.

Amazon Web Services (AWS) forma las bases de la plataforma genómica de Station X, GenePool, que se puede escalar dinámicamente para analizar decenas de miles de genomas en cuestión de minutos. “AWS es una ubicación obvia para la creación de entornos de software”, afirma Sandeep Sanga, vicepresidente de productos de Station X. “Hemos creado GenePool en AWS para proporcionar a los investigadores un lugar donde administrar y analizar cantidades enormes de datos. Y hemos elegido AWS porque ofrece una cantidad de servicios muy competitiva”. El uso de AWS permitió a Station X concentrarse en el diseño de la plataforma GenePool para ayudar a los investigadores a entender sus datos secuenciados de manera rápida y segura.

Para los investigadores de Mount Sinai, la seguridad de los datos del paciente es fundamental. “Para nosotros, es de suma importancia mantener la confidencialidad de los pacientes, especialmente con la gran cantidad de datos que se generan”, explica Martignetti. “No es un asunto menor. Pero al usar AWS y GenePool, podemos cumplir con los estándares de confidencialidad”. Al usar AWS, Station X es capaz de brindar acceso a investigadores preaprobados a los datos de acceso controlado de The Cancer Genome Atlas, lo que permite a los usuarios autorizados “computar y significar las mutaciones somáticas y de línea germinal en pacientes que tienen cáncer de mama o de ovario”, agrega Sanga.

Mount Sinai utiliza AWS Identity and Access Management (IAM) para la autenticación de usuarios, que otorga control y administración de acceso a la cuenta con las Listas de control de acceso (ACL) de AWS para proporcionar un usuario seguro y centralizado y la administración de las credenciales. Amazon Simple Notification Service (Amazon SNS) y Amazon Simple Email Service (Amazon SES) ofrecen servicios de mensajería saliente para los administradores y usuarios finales que requieran notificaciones y alertas.

Elastic Load Balancing ayuda a Station X a garantizar que tenga una web escalable y una arquitectura API resilientes y seguras en su entorno de Amazon VPC, que aíslen almacenes de datos y niveles medios de la exposición de la red a Internet. “Al aislar nuestros almacenes de datos y niveles medios de la red a Internet, mantenemos la privacidad de todos nuestros servidores y garantizamos un sistema de seguridad radicalmente reducido”, afirma Sanga.

Los investigadores de Mount Sinai usan la nube de AWS para administrar y obtener información relevante de montañas de datos genómicos almacenados en Amazon Simple Storage Service (Amazon S3), con espacio de almacenamiento adicional en Amazon Glacier.

Station X usa almacenamiento de Amazon Elastic Block Store (Amazon EBS) para los datos críticos y de mayor valor para que exista un sistema de almacenamiento flexible y de alto desempeño capaz de presentar enormes volúmenes de datos computados previamente para un análisis genómico en tiempo real.

Amazon Elastic Compute Cloud (Amazon EC2) genera modelos estadísticos integrados, capacidades de filtro visual, una rica integración con las bases de datos comentadas genómicas y clínicas, y una integración de soporte a través de los servicios web de RESTful de GenePool. “La naturaleza elástica de Amazon EC2 nos permite realizar un procesamiento y un análisis significativos de los datos de manera rentable y dinámicamente escalable”, afirma Sanga. Mount Sinai usa el almacenamiento exclusivo de Amazon S3 para garantizar que los datos genómicos de un paciente estén guardados de manera segura y a la espera del análisis en GenePool. La Figura 1 muestra la arquitectura de Mount Sinai.

mount-sinai-arch-diag

Figura 1. Arquitectura de la investigación de Mount Sinai

Para poder garantizar que los sistemas estén funcionando correctamente, GenePool usa Amazon CloudWatch para su monitorización. Amazon ElastiCache ofrece un mecanismo centralizado de almacenamiento, que permite que los resultados analíticos de bases de datos grandes se obtengan rápidamente. “Los científicos pueden responder las preguntas críticas en cuestión de minutos o segundos gracias a la plataforma de software genómica que creamos en AWS”, comenta Sanga.

Al usar AWS y GenePool, los doctores Martignetti y Dottino ahora pueden estudiar rápidamente miles de registros de pacientes de los proyectos de The Cancer Genome Atlas e identificar irregularidades genéticas en una cantidad de genes de un candidato nuevo que encajen en su hipótesis científica. Al comparar los genes de este candidato con otros datos genómicos, los doctores Martignetti y Dottino lograron mejorar la lista de genética del candidato con posibles marcadores nuevos para el cáncer de mama y de ovario hereditario.

“Antes de la nube de AWS Cloud, no teníamos manera de analizar un grupo tan grande de datos con nuestros colaboradores externos”, explica Martignetti. “No hubiese podido ser posible clasificar los datos adecuadamente, analizarlos y volver a filtrarlos; todo eso es fundamental en nuestros esfuerzos por encontrar las conexiones genéticas que faltan”.

“La creación de GenePool en AWS le dio a Station X la capacidad de almacenar grupos de datos para nuestros clientes genómicos traslacionales y clínicos”, agrega Sanga. “Tenemos una ventaja competitiva importante al usar AWS: rápido acceso a los datos, amplio almacenamiento y una enorme potencia informática”, añade. “Cuando se trata de investigar proyectos de este tipo, nunca habremos terminado. Siempre habrá más datos que analizar. Así que, aun cuando ayudemos a los investigadores a llegar a una conclusión científica, siempre quedará mucho por aprender. Con AWS, estamos listos para el desafío”.

Sin la capacidad de realizar este análisis de manera segura en la nube de AWS, los médicos de Mount Sinai no podrían continuar con su investigación. “Con AWS, podemos almacenar archivos fuente de manera segura y rentable con una durabilidad y accesibilidad importantes. No podríamos realizar nuestra investigación sin AWS”, afirma Martignetti. “Pero con AWS y GenePool, esperamos descubrir mutaciones que prueben ser las conexiones que faltan para saber por qué algunas mujeres tienen un mayor riesgo de contraer estos tipos de cáncer”.

Para obtener más información acerca de genómica en la nube, visite nuestra página de Genómica de AWS.