Csiro_Customer-Reference_Logo@2x

Caso práctico del Black Dog Institute y la CSIRO

2015

Como la agencia científica nacional de Australia, la Organización de Investigación Científica e Industrial de la Mancomunidad (CSIRO) desafió los límites de lo que es posible durante más de 85⁰años. En la actualidad, la organización de investigación multidisciplinaria cuenta con más de 5000 personas trabajando en 55 centros en Australia y otros países. Juega un papel fundamental en la mejora de las colaboraciones dentro del sistema de innovación nacional australiano y actúa como asesor de confianza del gobierno, la industria y la comunidad científica. Se encuentra dentro del uno por ciento de las principales instituciones de investigación a nivel mundial en 14 de 22 campos de investigación y dentro del 0,1 por ciento en cuatro campos de investigación. De manera colectiva, el nivel de excelencia e innovación de CSIRO la ubica dentro de las 10 agencias de investigación aplicada más importantes del mundo.

Fundado en 2002, el Black Dog Institute (BDI) es un organismo de investigación australiano sin fines de lucro dedicado a mejorar el diagnóstico, el tratamiento y la prevención de varios trastornos emocionales. Su objetivo es educar a los profesionales del sector médico y al público en general acerca de los trastornos mentales y ofrece una variedad de recursos, que incluyen fichas técnicas y cuestionarios, en su sitio web. Por ejemplo, los médicos generales de Australia derivan a los pacientes al programa de evaluación de trastornos mentales (MAP) en línea, que analiza el tipo de personalidad y ayuda a distinguir entre ansiedad, trastorno bipolar y los diferentes subtipos de depresión clínica. Con nueve directores, doce especialistas en psiquiatría y un numeroso personal de apoyo, el BDI continúa creciendo y atrayendo a expertos líderes en el campo de la salud mental, a través de los cuales se logran nuevas subvenciones y distinciones. En 2013, la catedrática y directora ejecutiva del BDI, Helen Christensen, recibió la prestigiosa Medalla de los Fundadores de la Sociedad Australiana de Investigación Psiquiátrica.

iniciar un tutorial de Python
CustomerReferences_QuoteMark

Es una herramienta extraordinaria. Con AWS, pudimos poner la aplicación en funcionamiento en tan solo unos meses y ahora nos permite analizar millones de tweets en tiempo real".

Dra. Cécile Paris
Líder de Investigación en Lenguaje y Computación Social, CSIRO

El desafío

Desde mayo de 2014, el BDI colaboró con la CSIRO en una investigación sobre el uso de las redes sociales para monitorear cambios de estado de ánimo a gran escala. El estudio We Feel utiliza una gran muestra de datos que incluye cientos de millones de tweets que se publican diariamente en Twitter. La CSIRO propuso el estudio al Black Dog Institute, que ayudó a perfeccionar el concepto antes de que la CSIRO lo implemente.

Según una investigación anterior realizada por la Universidad Northeastern de Boston, el contenido y la estructura de los tweets se pueden analizar para determinar el estado emocional de las personas que los producen. Por ejemplo, un estudio del Centro de Sistemas Complejos de la Universidad de Vermont mezcló las 5000 palabras más utilizadas en una variedad de fuentes, que incluyeron Google Books, artículos del New York Times y mensajes de Twitter. Estas palabras se clasificaron del 1 (triste) al 9 (feliz) y se utilizaron para establecer una correspondencia de la relación entre la felicidad de la población estadounidense y una serie de historias de noticias de última hora.

Los diseñadores del estudio We Feel querían aplicar este enfoque básico a aproximadamente 19⁰000 tweets de acceso público por minuto, basándose en una gran cantidad de términos relacionados con el estado de ánimo. Los investigadores esperaban que el estudio los ayudara a entender en qué medida las emociones dependían de factores sociales y ambientales, como el clima, el momento del día y las noticias del momento.

Para lograr sus objetivos, los diseñadores del estudio debían enfrentar tres retos principales. En primer lugar, el gran volumen de datos de entrada exigiría una gran cantidad de potencia informática flexible para recopilar los tweets en tiempo real y analizar los resultados. En segundo lugar, necesitaban archivar datos de manera segura para que los patrones se pudieran medir y publicar con el tiempo. Finalmente, era muy importante que los hallazgos estuvieran disponibles y que el público los pudiera comprender. Para lograrlo, necesitaban una manera de representar visualmente los hallazgos en tiempo real, con un sistema de representación de emociones con códigos de colores que aprovecha el conjunto de datos de clasificaciones normativas de emociones desarrollado por el Centro de Investigación de Lectura de la Universidad Ghent de Bélgica.

Por qué Amazon Web Services

El equipo de We Feel se interesó inmediatamente en Amazon Web Services (AWS) y su servicio de procesamiento de datos en tiempo real Amazon Kinesis. “Sabíamos que AWS podía ofrecer la plataforma y las capacidades que necesitábamos, lo que hizo que AWS fuera una opción obvia para los proyectos”, afirma la Dra. Cécile Paris, líder investigadora en lenguaje y computación social en el buque insignia de la productividad digital de CSIRO. AWS también vio el mismo potencial para una asociación productiva y decidió patrocinar el proyecto , además de incluir sus productos como parte de un generoso paquete de soporte.

We Feel utiliza varias instancias de Amazon Elastic Compute Cloud (Amazon EC2) para captar tweets de la API pública de Twitter con un promedio de 19⁰000 tweets por minuto. Una instancia independiente de Amazon EC2 procesa los tweets, analiza los nombres de los usuarios para determinar el género e identifica frases que revelen contenido emocional. La información se envía a una transmisión de Amazon Kinesis y los tweets se copian en Amazon Simple Storage Service (Amazon S3) escalable para almacenamiento en frío. Otra instancia de Amazon EC2 monitorea la transmisión, genera un resumen de los resultados cada cinco minutos y lo transcribe en una base de datos de Amazon DynamoDB. Brian Jin, un ingeniero de software y director de proyectos de investigación de CSIRO, revisa periódicamente cada instancia con Amazon CloudWatch, que le permite monitorear la red para detectar actividad inusual. Finalmente, Amazon Route 53 se utiliza para enviar el tráfico web de entrada al sitio web de We Feel, que también está hospedado en AWS.

Los beneficios

Con la financiación constante de la CSIRO, el equipo de We Feel ahora usa AWS para analizar cientos de millones de tweets antes de publicar los resultados en su sitio web. El resultado es una visión innovadora del estado emocional de una población numerosa y demográficamente diversa. Los visitantes del sitio web pueden indagar en los resultados por género, ubicación y calidad emocional. Actualmente, se contemplan seis categorías emocionales primarias (desde la alegría hasta el miedo) con subcategorías para estados emocionales más sutiles, como el optimismo o el nerviosismo.

"Es una herramienta extraordinaria", afirma la Dra. Paris. "Con AWS, pudimos poner la aplicación en funcionamiento en tan solo unos meses y ahora nos permite analizar millones de tweets en tiempo real".

We Feel ofrece una visión macroscópica que les permite a los investigadores vincular los cambios de estado de ánimo con el contexto social. "Por ejemplo, pudimos observar cambios de estado de ánimo interesantes en relación con el lanzamiento del presupuesto federal australiano de 2014", afirma la Dra. Paris. "Durante la semana siguiente, observamos un incremento del 30 por ciento de tweets que expresaban temor y un 27 por ciento de tweets que expresaban enojo. Este tipo de análisis no tiene precedentes".

Un aspecto importante es que el uso de la capacidad informática de AWS les permitió a los investigadores enfocarse en los resultados de su estudio sin tener que preocuparse por la resiliencia de su infraestructura de TI. "En mayo de 2014, tuvimos un pico de tráfico: recibimos 28⁰000 visitas en el sitio web de We Feel en un solo día y 70⁰276 durante todo el mes", afirma Jin. "Pero no hubo absolutamente ninguna demora. Desde entonces, tenemos un tiempo de actividad de casi el 100 por ciento, con tan solo un día sin conexión para realizar una reestructuración programada de la red”.

Jin está particularmente interesado en Amazon Kinesis, a quien le atribuye la capacidad de suministrar la agilidad necesaria para recopilar y anotar grandes volúmenes de tweets en tiempo real. "Nos preocupaba el hecho de que el sistema pudiese sobrecargarse debido a los datos de entrada, pero no tuvimos errores de sistema debido a estos cambios de volumen", afirma. "Al mantener un búfer de 24 horas, el uso de Amazon Kinesis nos proporciona tolerancia de fallas integrada, de modo que apenas tenemos de qué preocuparnos".

El equipo de We Feel planea buscar más fondos para ampliar su trabajo de investigación y hacer un mejor uso de los datos de ubicación geográfica de Twitter, con el objetivo de allanar el camino para analizar la relación entre las ubicaciones y los estados emocionales. Por último, una mejor comprensión del "cuándo, por qué y dónde" de los cambios en los estados de ánimo de la población promete ayudar a organizaciones como el BDI a focalizar de manera más precisa los servicios y la información sobre salud mental. Esto podría mejorar el cuidado de la salud mental de las personas en los momentos que más lo necesitan.

"Sin la capacidad y la flexibilidad provistas por la plataforma de AWS, este proyecto simplemente no hubiera sido posible", afirma la profesora Christensen. "Los resultados que obtuvimos superan nuestras expectativas".


Acerca de CSIRO

Como la agencia científica nacional de Australia, la Organización de Investigación Científica e Industrial de la Mancomunidad (CSIRO) desafió los límites de lo que es posible durante más de 85⁰años.

Acerca de Black Dog Institute

Fundado en 2002, el Black Dog Institute (BDI) es un organismo de investigación australiano sin fines de lucro dedicado a mejorar el diagnóstico, el tratamiento y la prevención de varios trastornos emocionales.

Beneficios de AWS

  • Analiza cientos de millones de tweets en tiempo real
  • Lanzó la aplicación en meses
  • Experimenta un tiempo de actividad casi perfecto

Servicios de AWS utilizados

Amazon S3

Amazon Simple Storage Service (Amazon S3) es un servicio de almacenamiento de objetos que ofrece escalabilidad, disponibilidad de datos, seguridad y rendimiento líderes en la industria. 

Más información »

Amazon Kinesis

Amazon Kinesis facilita la recopilación, el procesamiento y el análisis de datos de streaming en tiempo real para obtener datos de manera oportuna y reaccionar rápidamente ante información nueva.

Más información >>

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) es un servicio web que proporciona capacidad informática en la nube segura y de tamaño modificable.

Más información >>

Amazon DynamoDB

Amazon DynamoDB es una base de datos de documentos y de valor clave que ofrece rendimiento en milisegundos de un solo dígito a cualquier escala.

Más información >>


Comenzar

Empresas de todos los tamaños y de todos los sectores están transformando sus negocios con AWS a diario. Póngase en contacto con nuestros expertos e inicie hoy mismo su traspaso a la nube de AWS.