Blog de Amazon Web Services (AWS)
Simulaciones basadas en agentes de la propagación de COVID-19 en el distrito de Marcos Paz de la Provincia de Buenos Aires, Argentina
Marcos Boaglio, Senior Solutions Architect, WWPS/LCC/SOLAPS,
Ezequiel Puerta, Dto. de Computación, Facultad de Cs. Exactas y Naturales (FCEyN), UBA y
Rodrigo Castro, PhD. Investigador, Instituto UBA-CONICET de Ciencias de la Computación. Profesor, Dto. de Computación, FCEyN, UBA.
Con la llegada de la pandemia a la Argentina, en marzo de 2020, se formó un grupo multidisciplinario basado en la Universidad de Buenos Aires (UBA) con amplia trayectoria y experiencia en el desarrollo e investigación de herramientas matemático-computacionales, para colaborar en la toma de decisiones en el contexto del COVID-19. El análisis de datos sobre nuestro país y el mundo, la simulación de escenarios, y proyectos en territorio fueron parte del desafío encarado.
En el presente blog post describiremos un trabajo de campo que realizamos mediante micro simulación basada en agentes para la proyección de escenarios en el distrito de Marcos Paz, Provincia de Buenos Aires, Argentina. La plataforma tecnológica basada en la nube hace posible ajustar el modelo del municipio, comparando la realidad versus la simulación y analizando la incidencia de cada supuesto configurado como parámetro.
Visión general de la solución
Para simular el entorno basado en agentes en el distrito de Marcos Paz, construimos un entorno basado en el simulador GAMA orquestado en modo headless sobre Instancias Amazon EC2 on-demand. Una instancia principal controla el proceso completo, desde la selección de parámetros de simulación, el reparto de tareas a instancias de trabajo, junto con el análisis y la recolección de resultados desde un file system Amazon EFS.
Solución
Para buscar el modelo construimos una solución a medida que nos habilitó la posibilidad de simular diferentes escenarios en forma paralela sobre una infraestructura prácticamente ilimitada, escalable y ágil creando un entorno elástico único y no replicable en infraestructuras tradicionales on-premises. A su vez, nos hizo posible el acceso instantáneo a últimas tecnologías sin ciclos de adquisición prolongados ni grandes inversiones de capital. Las opciones de configuración flexibles nos permitieron elegir y probar recursos de diferentes capacidades para optimizar costos y opciones.
Modelado
Dentro de la solución, un componente clave es la definición del modelo específico para el Municipio de Marcos Paz. Con el objetivo de analizar la dinámica de contagios relacionados con las posibles fases de aislamiento en diferentes escenarios, y el impacto de la conectividad con otros municipios, se buscó un modelo altamente parametrizable, capaz de generar múltiples escenarios poblacionales y representar diversas políticas sanitarias, obteniendo resultados similares en orden de magnitud a los observados en la realidad (específicamente en Marcos Paz).
Se modeló en términos de:
- Parámetros
- Esquemas de contagio
- Compartimientos epidemiológicos
- Transiciones entre compartimientos
Parámetros
Trabajamos con parámetros epidemiológicos, de actividades, de restricciones, de demografía y también con shapefiles. Algunos de ellos son:
- Tamaño de la población (65.000 agentes)
- Ventana temporal
- Mínima distancia social
- Cantidad inicial de casos
- Probabilidad de transmisión efectiva
- Proporción de asintomáticos, casos leves, severos e internados en UTI
- Media de cantidad de días y desvíos standard para transiciones de estados de la enfermedad
- Cantidad de trabajadores esenciales (internos) y con permisos de circulación entre municipios
- Acatamiento de las restricciones generales y de la auto-cuarentena
- Actividad escolar, exceptuados, límite de traslados (en km)
- Cohortes (porcentaje sobre total, proporción de hombres y mujeres y tasa de letalidad por sexo)
- Capas SIG (shapefiles) con la geografía del lugar a estudiar
Esquemas de contagio
Definimos 4 esquemas de contagio por encuentro, sin respetar el distanciamiento social:
Compartimientos de estados epidemiológicos
Utilizamos 9 compartimientos para los estadíos desde el punto de vista de su clasificación epidemiológica y de la severidad de la enfermedad:
Transiciones de estados epidemiológicos
Los agentes evolucionan entre compartimientos según la siguiente lógica:
Metodología
Tomando como objetivo encontrar curvas de evolución temporal para cada compartimiento similares a las observadas en la realidad, seleccionamos rangos de valores posibles para cada parámetro y realizamos búsquedas exhaustivas mediante simulaciones paralelas. Es decir, dada una combinación de parámetros, simulamos durante una ventana temporal y estimamos el error como la diferencia entre los resultados de la simulación y los datos reales.
Una instancia Amazon EC2 principal orquesta el proceso realizando las siguientes acciones:
- Definición de cada conjunto de valores posibles de parámetros a explorar mediante simulación.
- Distribución de configuraciones y disparo de simulaciones (1) (mediante un desarrollo sobre APIs BOTO3) en instancias de trabajo Amazon EC2 aprovisionadas con Amazon Machine Images (AMI) personalizadas con el simulador GAMA (en modo headless) configurado con el modelo del distrito de Marcos Paz desarrollado. Dichas instancias almacenan los resultados de su simulación en un file system Amazon Elastic File System (EFS) compartido (2).
- Recolección y análisis de la información (3).
Visualización
El modelo se desarrolló junto con su infraestructura de visualización que nos permitió estudiar las simulaciones tanto con “fotos” como con “películas” de la actividad simulada mediante nuestro modelo de agentes.
La infraestructura de visualización nos permitió observar (en cada simulación), el comportamiento y la evolución de diferentes variables frente a diversos escenarios (combinación de parámetros).
De estas observaciones se desprenden modelos y resultados como los que mostramos a continuación.
Modelo SEIR Básico
Cantidad de individuos para cada compartimento en un momento dado, con diferentes niveles de detalle.
Modelo SEIR Detallado
Cantidad de individuos para cada compartimento en un momento dado, con mayor niveles de detalle.
Actividades Diarias
Representa la cantidad de individuos realizando cada una de las posibles actividades modeladas. Se puede apreciar como hay mayor actividad durante la semana en comparación al fin de semana. A su vez, en los horarios pico la cantidad de individuos en movimiento aumenta.
Histogramas de Transiciones y Tiempos
Tiempo necesario para transicionar a un estado N desde su estado N-1. Por ejemplo, la media de días para transicionar a Asintomático desde Expuesto es de 5 días. Útil para validar valores ingresados mediante parámetros.
Origen de los casos
Podemos analizar el origen de los contagios. Los mismos pueden ser casos iniciales configurados en la simulación, o casos por transmisión comunitaria, por un contagio fuera de los límites de Marcos Paz (caso importado), por un contagio por contacto dentro de las fronteras de Marcos Paz con alguien que no reside en el mismo (caso de contacto externo) o por contaminación residual (carga viral) en edificios con mala renovación de aire.
Contagios distribuidos en el espacio
Podemos observar donde ocurren los contagios. En este caso ilustrativo se observa como la mayor cantidad de contagios ocurre en el centro del municipio.
Conclusión y Resultados
Con el objetivo de analizar dinámicas de contagios relacionados con las posibles fases de aislamiento en diferentes escenarios, y el impacto de la conectividad con otros municipios, se diseñó un modelo preliminar altamente parametrizable capaz de reproducir, en orden de magnitud, los datos observados en la realidad del Municipio de Marcos Paz. Generamos varias decenas de escenarios y comparamos cada uno de ellos contra los datos reales registrados. A modo ilustrativo, en la siguiente imagen se observa como en una simulación particular (un escenario de parámetros) la curva de infectados (rojo) ajusta la tendencia de la curva real (salmón) para un período analizado de 4 semanas.
Próximos Pasos
La solución construida nos brinda una plataforma para continuar investigando la dinámica de contagio del municipio en forma exhaustiva mientras dure la pandemia de COVID-19. Continuaremos trabajando para obtener mejores ajustes del modelo de simulación, obteniendo más resultados, con ventanas de tiempo más amplias y más evaluaciones de escenarios de intervención posibles vía la exploración de parámetros.
Sobre los autores
Marcos es Arquitecto Senior de Soluciones de AWS para el sector público en Argentina. En ese rol, es responsable de guiar y proveer ayuda a las organizaciones en su estrategia hacia la nube, proporcionando orientación sobre cómo abordar problemas de alto riesgo. Marcos también es el responsable por proyectos basados machine learning e IoT para el sector público en el Cono Sur. Tiene más de 25 años de experiencia con tecnología, incluyendo el desarrollo de soluciones cloud, machine learning, desarrollo de software e infraestructura de datacenter.
Rodrigo Castro es Investigador del Instituto UBA-CONICET de Ciencias de la Computación, Director del Laboratorio de Simulación de Eventos Discretos y Profesor Adjunto del Departamento de Computación de la Facultad de Ciencias Exactas y Naturales de la Universidad de Buenos Aires. Doctorado en Ingeniería Electrónica (Control) de la Universidad Nacional de Rosario (Rosario, Argentina) en diciembre de 2010, realizó su posdoctorado en el Instituto Federal Suizo de Tecnología en Zurich (ETH Zurich), Suiza.
Ezequiel Puerta es estudiante avanzado de Ciencias de la Computación en el Departamento de Computación de la Facultad de Ciencias Exactas y Naturales de la Universidad de Buenos Aires. Es desarrollador de software especializado en el diseño, desarrollo e implementación de soluciones informáticas financieras, trabajando en los mercados financieros nacionales y extranjeros.