《華爾街日報》使用 Amazon Kendra 為讀者提供搜尋工具
2021 年
2020 年美國總統大選在即,《華爾街日報》 (WSJ) 希望讀者能夠更輕鬆地看到並理解候選人的發言,以及候選人對於和讀者息息相關的議題持有什麼立場。皮尤研究中心 (Pew Research Center) 於 2019 年 6 月 5 日的一項調查發現,近八成美國人表示曾自行針對新聞報導進行過事實查核,以找尋原始資訊來源。
《華爾街日報》的產品與技術團隊選擇了 Amazon Web Services (AWS) 來打造全新的客戶體驗。透過與 AWS 數位創新計劃全球專家團隊,以及旨在協助企業在 AWS 實現業務成果的全球專家團隊 AWS Professional Services 合作,《華爾街日報》 團隊促進了智慧型搜尋工具 Talk2020 的開發,從而協助讀者快速搜尋和分析總統候選人 30 年來發表的公開聲明。這項工具可探究發言模式並執行文本分析,進而促進深入調查過往議題。Amazon Kendra 採用機器學習來提供高度準確的智慧搜尋服務,而這正是《華爾街日報》團隊成功的關鍵。
AWS 協助建立了符合我們時間表的解決方案。由於能和專家直接接觸,使我們成功利用 Amazon Kendra 提供正確的服務,且品質也符合我們的要求。」
Dion Bailey
《華爾街日報》技術架構負責人
為讀者提供準確資訊
《華爾街日報》是一家全球新聞機構,提供重要新聞、資訊、評論和分析;並透過印刷、數位、行動裝置、社群平台和影音等途徑與讀者互動。基於其全球商業和金融新聞來源的地位,《華爾街日報》提供涵蓋美國和國際新聞、政治、藝術、文化、生活、體育和健康領域的報導,更因出色的新聞內容而榮獲 38 座普立茲獎。為此,《華爾街日報》抓準機會推出可讓讀者探索文字記錄資料庫的功能,藉此觸達新受眾。「我們想建立一種功能,讓讀者可以藉此搜尋 Joe Biden、Donald Trump 及其競選團隊的逐字發言稿,然後讀者能自己得出結論。」《華爾街日報》技術架構負責人兼副總裁 Dion Bailey 表示。
撰寫調查報導的《華爾街日報》記者已經在利用 Dow Jones 的全球新聞資料庫 Factiva 來進行研究和事實查核。Factiva 匯集逾 32,000 種來源,讓使用者能夠根據任意文字、區域、主題、作者和中繼資料來搜尋內容。《華爾街日報》的研發團隊與華盛頓特區的記者聯手為這些文字記錄建立了一個有效的搜尋工具。藉助 Talk2020,《華爾街日報》希望這項工具更易於使用,並觸及更廣泛的受眾,幫助他們在 2020 總統大選期間作出各項決策。這項工具期望讀者以自然語言提出問題,像是「關於醫療保健議題,Trump 是怎麼說的?」並讓讀者接收到該問題的直接答案。結構良好的解決方案也有可能增進網站流量,並吸引更多讀者訂閱。
已經在使用 AWS 的《華爾街日報》團隊在建立期間透過每日站會、週會和架構深入研討會,定期參與 AWS Professional Services。「AWS 協助建立了符合我們時間表的解決方案。」Bailey 表示。「由於能和專家直接接觸,使我們成功利用 Amazon Kendra 提供了正確的服務,且其品質也符合我們的要求。」
整合內容策略和產品策略
透過 AWS,《華爾街日報》團隊迅速建成了 Talk2020,並在 2020 年 9 月首次總統辯論前成功實現推出的目標。該解決方案採用 Amazon Kendra 來提供可靠的企業搜尋功能。「Amazon Kendra 能夠即時處理自然語言,對我們來說是個很大的吸引力,」Bailey 表示。這項搜尋解決方案的前端由 API 閘道和 Amazon CloudFront 組成,這是一個快速、安全性高且可程式化的內容交付網路。使用者執行搜尋時,Amazon Kendra 會回傳其識別出的議題並引用相關言論,然後交互參考儲存在 Amazon DynamoDB (一種支援鍵值和文件資料結構的 NoSQL 資料庫服務)經過清理的 Factiva 文字記錄,進一步擴充這些引用言論。
而 AWS 服務之間的資料流則由 AWS Lambda 負責管控,這是一種無伺服器運算服務,能讓使用者無需佈建或管理伺服器就能執行程式碼。「我們必須在 Factiva 和資料層之間建立一個導入層,」Bailey 表示。AWS Lambda 的功能會發出請求,將文字記錄檔整理乾淨、格式化,並進一步辨識引言、發言人及其相關議題,然後將其傳至 Amazon Kendra 和 Amazon DynamoDB。「把這些任務交給 Lambda 函數執行,我們就能在不使用時關閉這些進程,所以成本效益很高,」Bailey 補充道。
根據 Talk2020 工具的資料顯示,其使用率在總統辯論、副總統辯論和市政廳大會期間和之後有顯著飆升。許多人甚至在辯論期間開著這項搜尋工具,即時調查候選人所發表的過往言論。Talk2020 的互動程度強烈,個人使用者每次造訪往往會詢問好幾個問題,並瀏覽數個議題。「這表示我們建立的工具滿足了讀者的需求;我們有機會持續嘗試不同方式來吸引眾多使用者。」Bailey 表示。
激勵人心的未來智慧搜尋使用案例
《華爾街日報》與 AWS 團隊合作,利用 Amazon Kendra 等創新服務,在短短五個月內推出了 Talk2020,不但成功推動網站流量、促進讀者互動,也吸引了更多新讀者訂閱。「AWS 團隊能隨時為我們提供服務,」Bailey 表示,「問題一出現就能幫忙解決。」
關於《華爾街日報》
《華爾街日報》成立於 1889 年,由道瓊公司 (Dow Jones & Company) 所有,是一家總部位於紐約的全球新聞機構,專注於商業、金融、經濟和全球軍事等內容。它透過印刷、數位、行動裝置、社群平台和影音等途徑與讀者互動。《華爾街日報》榮獲超過三十座普立茲獎,發行量已達數百萬份。
AWS 的優勢
- 在 5 個月內推出 Talk2020 搜尋工具
- 建立具有自然語言處理能力的搜尋工具
- 增進與使用者的互動
使用的 AWS 服務
Amazon Kendra
Amazon Kendra 是採用機器學習技術的智慧搜尋服務。Kendra 可重新構思網站和應用程式的企業搜尋方式,讓您的員工和客戶輕鬆找出所需內容,即使內容分散在貴組織的多個位置和內容儲存庫也沒問題。
Amazon CloudFront
Amazon CloudFront 是快速內容交付網路 (CDN) 服務,可在支援開發人員的環境中,以低延遲和高速傳輸的方式將資料、影片、應用程式和 API 安全地交付給全球的客戶。
Amazon DynamoDB
Amazon DynamoDB 是一種鍵值和文件資料庫,可在任何規模下達到不到 10 毫秒的效能。它是全受管、多區域、多主動式耐用資料庫,內建安全性、備份和還原以及記憶體內快取,以供網際網路規模的應用程式使用。
AWS Lambda
AWS Lambda 是一種無伺服器的運算服務,可讓您執行程式但不必佈建或管理伺服器、建立工作負載感知叢集擴展邏輯、維護事件整合或管理執行階段。有了 Lambda,您可以透過虛擬方式執行任何類型的應用程式或後端服務,全部免管理。
開始使用
各行各業、各種規模的公司每天都在使用 AWS 來轉型業務。聯絡我們的專家,立即開始使用 AWS 雲端服務。