L'agenzia scientifica nazionale australiana, Commonwealth Scientific and Industrial Research Organisation (CSIRO), varca continuamente i confini del possibile da oltre 85 anni. L'organizzazione di ricerca multidisciplinare include oggi più di 5.000 persone, impiegate in 55 centri in Australia e in tutto il mondo. Ha un ruolo essenziale nel potenziare la collaborazione all'interno del sistema innovativo nazionale australiano, operando come consulente fidato della pubblica amministrazione, dell'industria e della comunità scientifica. È classificata all'interno del primo 1% degli istituti di ricerca globali in 14 campi di ricerca su 22 e del primo 0,1% in quattro campi di ricerca. Collettivamente, l'innovazione e l'eccellenza che la caratterizzano piazzano la CSIRO tra le prime 10 agenzie di ricerca applicata del mondo.

Fondato nel 2002, il Black Dog Institute (BDI) è un organismo di ricerca no profit australiano dedicato al miglioramento di diagnosi, trattamento e prevenzione di diversi disturbi dell'umore. L'istituto ha come obiettivo la formazione di professionisti medici e del pubblico in generale sui problemi di salute mentale e offre un'ampia gamma di risorse, tra cui schede informative e questionari, attraverso il proprio sito Web. Per esempio, i medici generici australiani possono indirizzare i pazienti al programma di valutazione dell'umore (MAP, Mood Assessment Program) online del BDI, che analizza il tipo di personalità e aiuta a distinguere tra ansia, disturbo bipolare e altri sottotipi diversi di depressione clinica. Con nove direttori, 12 consulenti psichiatrici e un ricco personale di supporto, il BDI continua a crescere, attirando esperti leader nel campo della salute mentale e, con loro, nuovi finanziamenti e onori. Nel 2013 la professoressa Helen Christensen, direttrice esecutiva del BDI, ha ricevuto il prestigioso riconoscimento Founders Medal dall'Australasian Society for Psychiatric Research.

Da maggio 2014, il BDI collabora con la CSIRO alla ricerca sull'uso dei social media per monitorare variazioni su larga scala dell'umore. Lo studio We Feel è basato su un gigantesco campione di dati che include centinaia di milioni di tweet pubblicati ogni giorno su Twitter. La CSIRO ha proposto lo studio al Black Dog Institute, che ha contribuito a perfezionare il concetto prima dell'implementazione da parte dell'organizzazione.

Secondo una ricerca precedente condotta presso la Northeastern University di Boston, è possibile analizzare il contenuto e la struttura dei tweet per determinare lo stato emotivo della persona che li ha creati. Per esempio, uno studio del Complex Systems Center dell'University of Vermont ha riunito le 5.000 parole utilizzate più di frequente in un'ampia gamma di origini, tra cui Google Libri, articoli del New York Times e messaggi di Twitter. Queste parole sono state classificate con valori da 1 (triste) a 9 (felice) e utilizzate per delineare la relazione tra la felicità della popolazione americana e una serie di notizie di attualità.

Gli ideatori dello studio We Feel hanno voluto applicare questo approccio di base a circa 19.000 tweet pubblici al minuto, attingendo a una grande quantità di termini correlati all'umore. I ricercatori speravano che lo studio li avrebbe aiutati a valutare quanto sia forte la dipendenza delle emozioni da fattori sociali e ambientali come il clima, l'ora del giorno e le notizie di attualità.

Per realizzare i propri obiettivi, gli ideatori dello studio hanno dovuto affrontare tre sfide principali. Prima di tutto, l'ingente volume di dati in ingresso ha richiesto una quantità elevata e flessibile di potenza di calcolo per raccogliere i tweet in tempo reale e analizzare i risultati. In secondo luogo, era necessario archiviare in modo sicuro i dati per poter misurare e pubblicare i modelli ricorrenti nel tempo. Infine, era importante rendere le conclusioni disponibili e comprensibili per il pubblico. A questo scopo, era necessaria una strategia per rappresentare visivamente i risultati in tempo reale, usando un sistema di codifica a colori emotivo che sfruttasse il set di dati delle classificazioni emotive standard sviluppate dal Center for Reading Research dell'università di Ghent in Belgio.

Il team dello studio We Feel è stato immediatamente attratto da Amazon Web Services (AWS) e dal suo servizio di elaborazione dei dati in tempo reale Amazon Kinesis. "Sapevamo che AWS era in grado di fornirci la piattaforma e le funzionalità necessarie e questo ha reso AWS la scelta obbligata per i progetti", ha dichiarato la dottoressa Cécile Paris, ricercatrice capo in linguaggi e social computing presso il reparto Digital Productivity Flagship della CSIRO. AWS ha riconosciuto lo stesso potenziale per una partnership fruttuosa, decidendo di sponsorizzare il progetto e includendo i propri prodotti come parte di un generoso pacchetto di supporto.

We Feel usa diverse istanze Amazon Elastic Compute Cloud (Amazon EC2) per acquisire i tweet dall'API pubblica di Twitter a una media di 19.000 tweet al minuto. Un'istanza Amazon EC2 separata elabora i tweet, analizzando i nomi utente per determinare il sesso e identificare le frasi che rivelano contenuto emotivo. Le informazioni vengono incanalate in un flusso Amazon Kinesis, mentre i tweet vengono copiati in un'istanza Amazon Simple Storage Service (Amazon S3) scalabile per l'archiviazione offline. Questo flusso viene monitorato da un'altra istanza Amazon EC2, che produce un riepilogo dei risultati ogni cinque minuti e lo trascrive in una database Amazon DynamoDB. Brian Jin, software engineer e responsabile dei progetti di ricerca presso CSIRO, esamina regolarmente ogni istanza usando Amazon CloudWatch, che gli permette di monitorare la rete per individuare attività insolite. Infine, viene usato Amazon Route 53 per indirizzare il traffico Web in ingresso al sito Web We Feel, anch'esso ospitato su AWS.

Con il continuo sostegno finanziario da parte della CSIRO, il team dello studio We Feel usa ora AWS per analizzare centinaia di milioni di tweet prima della pubblicazione dei risultati sul proprio sito Web. Ne derivano informazioni rivoluzionarie sullo stato emotivo di una popolazione ampia e diversificata a livello demografico. I visitatori del sito Web sono in grado di approfondire i risultati per sesso, posizione e qualità emotiva. Esistono attualmente sei categorie emotive principali, dalla gioia alla paura, con sottocategorie per stati emotivi più sfaccettati, come l'ottimismo e il nervosismo.

"È uno strumento eccezionale", ha affermato la dottoressa Paris. "Grazie ad AWS, siamo stati in grado di rendere operativa l'applicazione in appena un paio di mesi e oggi possiamo analizzare milioni di tweet in tempo reale".

We Feel offre una prospettiva macroscopica che permette ai ricercatori di collegare le variazioni di umore al rispettivo contesto sociale. "Per esempio, abbiamo osservato interessanti variazioni di umore in prossimità della presentazione del budget federale australiano del 2014", ha dichiarato la dottoressa Paris. "Durante la settimana successiva, abbiamo notato un aumento del 30% dei tweet impauriti e un aumento del 27% di quelli arrabbiati". Questo tipo di analisi non era mai stato svolto prima".

L'aspetto importante è che attraverso la potenza di calcolo di AWS i ricercatori hanno potuto concentrarsi sui risultati dello studio, senza doversi preoccupare della resilienza dell'infrastruttura IT. "In maggio 2014 abbiamo osservato il picco di traffico, con 28.000 visitatori del sito Web We Feel in un solo giorno e 70.276 nel mese", ha affermato Jin. "Eppure non si è verificato alcun ritardo. Da allora abbiamo riscontrato il 100% di tempo di attività, con un solo giorno offline per una riprogettazione di rete pianificata".

Jin è particolarmente entusiasta di Amazon Kinesis, che secondo lui ha il merito di garantire l'agilità necessaria per raccogliere e annotare grandi volumi di tweet in tempo reale. "Eravamo preoccupati che il sistema potesse essere travolto dai dati in ingresso, ma non si è verificato alcun errore di sistema a causa delle variazioni di questi volumi", ha sostenuto. "Mantenendo un margine di 24 ore, l'uso di Amazon Kinesis ci fornisce una tolleranza ai guasti integrata e così non dobbiamo preoccuparci di niente".

Il team dello studio We Feel prevede di trovare ulteriori finanziamenti per ampliare il proprio lavoro di ricerca e usare ancora meglio i dati di posizione di Twitter, in modo da analizzare la relazione tra località e stato emotivo. In definitiva, una migliore comprensione dei "quando, dove e perché" delle variazioni di umore della popolazione è alla base della possibilità di aiutare organizzazioni come il BDI a destinare in modo più accurato informazioni e servizi per la salute mentale. Questo approccio può migliorare la cura della salute mentale per le persone proprio quando ne hanno più bisogno.

"Senza la potenza e la flessibilità della piattaforma AWS, questo progetto non sarebbe mai stato possibile", ha dichiarato la professoressa Christensen. "I risultati che siamo riusciti a ottenere hanno superato le nostre aspettative".

Per ulteriori informazioni sul modo in cui AWS può essere utilizzato dai fornitori di servizi sanitari, visita la nostra pagina dei dettagli su AWS per il settore sanitario.