En tant qu'agence nationale de recherche scientifique en Australie, le CSIRO (Commonwealth Scientific and Industrial Research Organisation) repousse les limites du possible depuis plus de 85 ans. Aujourd'hui, l'organisme de recherche pluridisciplinaire compte plus de 5 000 employés répartis dans 55 centres en Australie et à l'international. Il joue un rôle essentiel dans le renforcement de la collaboration au sein du système national d'innovation australien, et agit comme conseiller de confiance pour le gouvernement, l'industrie et la communauté scientifique. Il figure dans le premier pour cent des meilleurs instituts de recherche internationaux dans 14 domaines de recherche sur 22 et dans le premier dixième de pour cent dans quatre domaines de recherche. Ensemble, l'innovation et l'excellence du CSIRO le placent parmi les 10 meilleures agences de recherche appliquée au monde.

Fondé en 2002, le Black Dog Institute (BDI) est un organisme de recherche australien à but non lucratif consacré à l'amélioration du diagnostic, du traitement et de la prévention de divers troubles de l'humeur. Il vise à informer les professionnels de la santé et le public sur les problèmes de santé mentale, et propose toute une gamme de ressources, notamment des fiches d'information et des questionnaires, sur son site Web. Par exemple, les médecins généralistes en Australie orientent leurs patients vers le programme d'évaluation de l'humeur en ligne, qui analyse leur type de personnalité et permet de faire la distinction entre l'anxiété, le trouble bipolaire et les différents sous-types de dépression clinique. Avec neuf responsables, 12 psychiatres consultants et du personnel de soutien, le BDI continue à se développer et à attirer d'éminents spécialistes dans le domaine de la santé mentale, et, par la même occasion, de nouvelles subventions et récompenses. En 2013, l'Australasian Society for Psychiatric Research (Société australasienne de recherche en psychiatrie) a décerné la prestigieuse médaille des fondateurs au professeur Helen Christensen, directeur exécutif du BDI.

Depuis mai 2014, le BDI participe à un projet de recherche du CSIRO sur l'utilisation des réseaux sociaux pour surveiller les changements d'humeur à grande échelle. L'étude We Feel s'appuie sur un large échantillon de données, dont des centaines de millions de tweets publiés quotidiennement sur Twitter. Le CSIRO a soumis l'étude au Black Dog Institute, qui l'a aidé à affiner le concept avant sa mise en œuvre.

Selon une étude antérieure menée par l'université Northeastern de Boston, le contenu et la structure des tweets peuvent être analysés pour déterminer l'état émotionnel de leur auteur. Par exemple, une étude du Complex Systems Centers de l'université du Vermont a rassemblé les 5 000 mots utilisés le plus fréquemment dans une variété de sources, dont Google Books, des articles du New York Times et des messages Twitter. Ces mots ont été classés de 1 (triste) à 9 (heureux) et utilisés pour illustrer la relation entre le bonheur de la population américaine et un éventail d'actualités.

Les concepteurs de l'étude We Feel voulaient appliquer cette approche de base à environ 19 000 tweets publiquement accessibles par minute, en s'appuyant sur une liste importante de termes liés à l'humeur. Les chercheurs espéraient que l'étude les aiderait à comprendre à quel point les émotions dépendent de facteurs sociaux et environnementaux tels que la météo, le moment de la journée et l'actualité.

Pour atteindre leurs objectifs, les concepteurs de l'étude ont dû faire face à trois défis principaux. Premièrement, l'important volume de données entrantes exigeait une puissance de calcul considérable et flexible pour collecter les tweets en temps réel et analyser les résultats. Deuxièmement, les données devaient être archivées de manière sécurisée afin que les tendances au fil du temps puissent être mesurées et publiées. Pour terminer, il était indispensable de rendre les résultats accessibles et compréhensibles pour le public. A cette fin, il leur fallait trouver une manière de représenter visuellement leurs découvertes en temps réel, en faisant appel à un système de code-couleur émotionnel exploitant l'ensemble de données de la notation émotionnelle normative développée par le Centre de recherche sur la lecture de l'université de Gand, en Belgique.

L'équipe We Feel a immédiatement été séduite par l'offre AWS (Amazon Web Services) et son service de traitement des données en temps réel, Amazon Kinesis. « Nous savions qu'AWS pouvait nous fournir la plate-forme et les fonctionnalités dont nous avions besoin, ce qui en faisait un choix évident pour les projets », déclare le Dr Cécile Paris, chercheuse principale en informatique sociale et linguistique au Digital Productivity Flasgship du CSIRO. AWS a vu le même potentiel d'un partenariat fructueux et a décidé de sponsoriser le projet, en intégrant ses produits à un généreux programme de soutien.

We Feel utilise plusieurs instances Amazon Elastic Compute Cloud (Amazon EC2) pour capturer des tweets avec l'API publique de Twitter à une moyenne de 19 000 tweets par minute. Une instance Amazon EC2 distincte traite les tweets, en analysant les noms d'utilisateur pour déterminer le sexe des auteurs et en identifiant les expressions qui révèlent du contenu émotionnel. Les informations sont acheminées dans un flux Amazon Kinesis, et les tweets sont copiés vers une instance Amazon Simple Storage Service (Amazon S3) évolutive pour un stockage d'archive. Le flux est contrôlé par une autre instance Amazon EC2, qui génère une synthèse des résultats toutes les cinq minutes et le transcrit dans une base de données Amazon DynamoDB. Brian Jin, ingénieur logiciel et chargé de projets de recherche au CSIRO, passe régulièrement en revue chaque instance à l'aide d'Amazon CloudWatch, qui lui permet de surveiller le réseau pour identifier toute activité inhabituelle. Pour terminer, Amazon Route 53 sert à diriger le trafic Web entrant vers le site Web de We Feel, qui est également hébergé sur AWS.

Le financement continu du CSIRO permet à l'équipe We Feel d'utiliser dorénavant AWS pour analyser des centaines de millions de tweets avant la publication des résultats sur son site Web. Il est ainsi possible d'en retirer des informations révolutionnaires concernant l'état émotionnel d'une grande population diversifiée sur le plan démographique. Les visiteurs du site Web sont en mesure d'affiner les résultats par sexe, par lieu et par qualité émotionnelle. A ce jour, il existe six grandes catégories émotionnelles, allant de la joie à la peur, subdivisées de façon à présenter des états émotionnels plus nuancés, comme l'optimisme et la nervosité.

« Il s'agit d'un outil incroyable », ajoute le Dr Paris. « Grâce à AWS, nous avons pu rendre l'application opérationnelle en quelques mois seulement. Elle nous permet maintenant d'analyser des millions de tweets en temps réel. »

We Feel fournit aux chercheurs une vue macroscopique leur permettant de faire le lien entre les changements d'humeur et leur contexte social. « Par exemple, nous avons pu constater des changements d'humeur intéressants au moment du lancement du budget fédéral australien de 2014 », explique le Dr Cécile Paris. « Au cours de la semaine suivante, nous avons assisté à une augmentation de 30 % du nombre de tweets inquiets et à une augmentation de 27 % du nombre de tweets énervés. Ce type d'analyse n'a jamais été entrepris auparavant. »

Il est important de noter que la puissance de calcul d'AWS a permis aux chercheurs de se concentrer sur les résultats de leur étude sans avoir à se soucier de la résistance de leur infrastructure informatique. « En mai 2014, nous avons connu des pics de trafic. Le site Web de We Feel a reçu 28 000 visiteurs en une seule journée, et 70 276 au cours du mois », précise Brian Jin. « Néanmoins, aucun ralentissement n'a été constaté. Depuis, nous avons atteint un taux de disponibilité de presque 100 %, avec seulement un jour hors ligne dédié à une refonte programmée des réseaux. »

M. Jin est particulièrement enthousiasmé par Amazon Kinesis, qui offre l'agilité nécessaire pour collecter et annoter d'importants volumes de tweets en temps réel. « Nous craignions que le système puisse être submergé par les données entrantes, mais nous n'avons rencontré aucune erreur système due à ces variations de volume », ajoute-t-il. « En maintenant une période tampon de 24 heures, l'utilisation d'Amazon Kinesis nous apporte une tolérance inhérente aux pannes. Ainsi, nous n'avons que peu de souci à nous faire. »

L'équipe We Feel prévoit de solliciter un financement supplémentaire pour développer ses travaux de recherche et mieux tirer parti des données de localisation de Twitter, afin d'ouvrir la voie à l'analyse de la relation entre la localisation et l'état émotionnel. A terme, une meilleure compréhension du « quand, pourquoi et où » des changements d'humeur de la population contribuera à aider les organismes comme le BDI à cibler avec plus de précision les informations et les services relatifs à la santé mentale. Cela pourrait améliorer les soins de santé mentale au moment où ils sont plus que jamais nécessaires.

« Sans la puissance et la flexibilité offertes par la plate-forme AWS, ce projet n'aurait tout simplement pas été possible », conclut le professeur Christensen. « Les résultats que nous avons obtenus ont surpassé nos attentes. »

Pour découvrir comment AWS peut être utilisé par les prestataires de soins de santé, consultez notre page consacrée aux soins de santé d'AWS.