聯邦科學與工業研究組織 (CSIRO) 是澳洲的國家科學機構,85 年來持續在科學界開創新的可能性。如今,這個跨學科研究組織擁有超過 5,000 名人員,在澳洲國內與世界各地的 55 個研究中心工作。該組織是促進澳洲國家創新體系內共同合作的要角,也是政府、產業和科學社群信賴的顧問機構。它在 22 個科學研究領域中有 14 個領域都名列全球研究機構的前百分之一,在其中四個研究領域更是前百分之 0.1 的頂尖機構。總體而言,CSIRO 創新與卓越表現,使其擠身世界十大應用研究機構之列。

Black Dog Institute (BDI) 成立於 2002 年,是澳洲的非營利研究團體,致力於針對各種情感疾患改善診斷、治療與預防措施。其目標在於向醫療專業人員與一般大眾宣導心理健康問題的知識,並在其網站上提供種類廣泛的相關資源,包括資料表與問卷等。舉例而言,澳洲各地的家庭醫生都會推薦病患使用 BDI 的線上情緒評估程式 (MAP),分析人格類型並協助分辨焦慮、躁鬱症及臨床上各種類型的憂鬱症。BDI 有 9 位董事、12 位諮詢心理醫師以及為數眾多的支援人員,並且仍持續成長,不斷引進心理健康領域的頂尖專家,進而獲得新的補助金與獎項。2013 年,BDI 執行長 Helen Christensen 教授榮獲澳大拉西亞精神科研究學會頒發享有聲譽的創辦人獎。

2014 年 5 月起,BDI 與 CSIRO 合作研究利用社交媒體監控大規模的情緒變化。這項研究名為 We Feel,收集數量龐大的樣本資料,包括每天張貼到 Twitter 上數以億計的推文。這項研究是由 CSIRO 向 Black Dog Institute 提案,經過 BDI 細部調整研究概念之後,再由 CSIRO 實際執行。

波士頓東北大學先前的研究指出,分析推文的內容與結構可以判斷發表推文者的情緒狀態。舉例而言,佛蒙特大學複雜系統研究中心在一項研究中,彙整了 Google 圖書、紐約時報文章與 Twitter 留言等各種來源中最常用的 5,000 種單詞。這些單詞按照 1 (悲傷) 到 9 (快樂) 評分之後,可用來對照美國大眾幸福度與各種時事報導之間的關係。

We Feel 研究的設計人員想運用這套基本方法,分析每分鐘大約產生 19,000 則的公開可存取推文,以採集大量的情緒相關詞彙。研究人員希望這項研究有助於了解天氣、時段及時事等社會與環境因素對情緒的影響強度。

為達成此目標,研究設計人員必須面臨三大挑戰。首先,需要具備巨大且有彈性的運算能力,才能即時收集大量流入的推文並分析結果。再者,研究人員必須將資料安全存檔,以便測量與發表隨時間變化的模式。最後,研究結果必須可讓一般大眾取用與理解。為此,研究人員必須想辦法以視覺化方式即時呈現研究結果。本研究以比利時根特大學閱讀研究中心研發的正規情緒評分為基礎,設計了一套視覺化呈現用的情緒色彩標記系統。

We Feel 團隊很快就注意到 Amazon Web Services (AWS),以及即時 Amazon Kinesis 資料處理服務。CSIRO 數位生產力旗艦的語言與社交運算研究主管 Cécile Paris 博士表示:「我們知道 AWS 能提供我們所需的平台與功能,因此執行專案時採用 AWS 是必然的選擇。」AWS 也認為這項合作夥伴關係可望產出豐碩的成果,因此決定贊助這項專案,並慷慨提供一份包括 AWS 產品在內的支援套件。

We Feel 使用多個 Amazon Elastic Compute Cloud (Amazon EC2) 執行個體,透過 Twitter 公用 API 以平均每分鐘 19,000 則推文的速度擷取推文。還有一個獨立的 Amazon EC2 執行個體負責處理推文、分析使用者名稱以判斷性別,並辨識顯示情緒內容的字詞。分析後的資訊會傳入 Amazon Kinesis 串流中,然後程式會將推文複製到可擴展的 Amazon Simple Storage Service (Amazon S3) 進行冷儲存。串流會由另一個 Amazon EC2 執行個體監控,每五分鐘生產一次結果摘要,並轉寫至 Amazon DynamoDB 資料庫中。CSIRO 軟體工程師兼研究專案主管 Brian Jin 會使用 Amazon CloudWatch 定期檢閱每個執行個體,以便監控網路中是否有不尋常的活動。最後,本研究使用 Amazon Route 53 將傳入的 web 流量導向同樣由 AWS 託管的 We Feel 網站。

透過 CSIRO 持續的資助,We Feel 團隊現在會先使用 AWS 分析數億個推文,然後在網站發佈結果。此結果可針對大量且族群多元之人口的情緒狀態提供開創性深入解析。網站的訪客能夠依性別、位置和情緒性質深入了解結果。目前有六種主要的情緒類別 – 從開心到害怕 – 其中還包含更細微情緒狀態的子類別,像是樂觀和緊張。

「這套工具強大無比。」Paris 博士表示。「拜 AWS 所賜,我們只花了短短幾個月就成功讓應用程式開始運作,現在靠這套程式就能即時分析幾百萬則推文。」

We Feel 目前能提供宏觀的資料,讓研究者找出情緒變化與社會局勢之間的關聯。「舉例來說,我們成功觀測到 2014 年澳洲聯邦預算公布時發生的有趣情緒變化。」Paris 博士說。「預算公布之後一週,我們發現害怕的推文增加了百分之 30,而憤怒的推文則增加了百分之 27。以前從來沒有人做過這種分析。」

另一項重要優點在於,藉助 AWS 的運算能力,研究人員可以專注於研究結果,而不需要擔心 IT 基礎架構的恢復能力。「2014 年 5 月我們遇到尖峰流量,一天之內就有 28,000 名訪客瀏覽 We Feel 網站,整月訪客總計達到 70,276 人次。」Jin 指出。「可是網站完全沒有延遲。從當時到現在,我們的正常執行時間將近百分之百,只有一天依照排程離線進行網路重新設計。」

Jin 對 Amazon Kinesis 特別讚賞,認為這項服務提供了即時收集並標記大量推文所需的靈活性。「我們原本擔心大量流入的資料會讓系統癱瘓,不過至今為止還沒有因為流量變化而發生系統故障。」他表示。「使用 Amazon Kinesis 可保留 24 小時的緩衝,為我們提供固有的容錯能力,所以實在無須擔心。」

We Feel 團隊正規劃尋求更多資金補助,以延伸其研究並進一步活用 Twitter 的地點資料,以奠定分析地點與情緒狀態關係的基礎。研究的最終目標是更清楚了解大眾情緒變化的時間、地點與理由,以協助 BDI 等組織更明確地鎖定心理健康資訊與服務的提供對象。如此一來就能在人們最需要的時候,提供更完善的心理保健。

「如果沒有 AWS 平台的能力與彈性,這項專案根本不可能實現。」Christensen 博士表示。「目前為止的成果,遠超過我們當初的預期。」

要進一步了解醫療保健供應商如何使用 AWS,請瀏覽我們的 AWS 醫療保健詳細資訊頁面