謠言止於智者 AI能治假新聞?

評論版 2019/09/11

分享:

因反對《逃犯條例》修訂而引發的社會示威運動愈演愈烈,警民衝突不斷升溫,暴力程度亦逐步升級,受影響的地區範圍幾乎擴散至全港,本土經濟大受打擊,尤其是旅遊、飲食、零售業等行業。

網上散播流言仇恨 加深撕裂

活動期間,社交網絡成為另一戰場,黃絲藍絲雙方各自發放批評對方的信息,包括文字、語音、圖片、錄像等不同載體(carrier)的信息,每天如排山倒海般衝向全球網絡。然而,不少報道不盡不實,甚至極度偏頗,嚴重影響信息的可靠性。更甚者當中包涵「假新聞」(Fake News)及「仇恨言論」(Hate Speech),情況對平息是次風波不但無補於事,反而火上加油,進一步擴大黃藍兩方陣營之間的撕裂,百害而無一利。

在社交網絡世界中虛假信息難以完全杜絕。計算機科學家利用人工智能(AI)技術研發「流言檢測」(Rumour Detection)算法去識別及過濾網上不可靠的信息。

簡單而言,不論流言在任何載體出現,檢測算法主要分開靜態(static)與動態(dynamic)分析兩個階層。

「四何」分析法 查核信息真偽

以文字信息為例,靜態「流言檢測」針對信息內容進行「事實查核」(Fact Check)。簡單的查核方法是使用「四何」分析法去判斷信息中「何人」(Who)、「何事」(What)、「何時」(When)及何地(Where)的端倪,即文中所描述的人、事、時、地是否合理。

例句一:「李四教授於2019-2020學年在大圍香港中文大學的開學禮中致辭歡迎新生。」

參考例句一,這句子內容呈現多點失實報道,當中包括2019-2020學年中大並沒有舉辦開學禮(事);中大校內並沒有一位李四教授(人);中大並不是位於大圍(地)等虛假資訊。

動態邏輯推理 檢測事件可信性

動態分析是利用邏輯,從目標事件的建立過程來查核事件的可信性,做法有多種,如透過分析信息中表達之因果關係(Causality)、時間序(Chronology)等來判斷事件的「何解」(Why)及「如何」(How)之疑點。

例句二:張三是個大富豪,因為去年他相信了李四對市場的預測,而投資了這項目。

例句二提出「張三是個大富豪」,這事實的可信性十分之低,主要因為張三只是相信李四的預測而已,而卻沒有親自去求證(Causality);再者,李四預測是去年的事,今年市場可能有變(Chronology)。

「AI代人」,人工智能的終極目標是取代人類。人類對於理解上述的例句易如反掌,但利用機器去自動分析卻非容易。「謠言檢測」充分利用「自然語言處理」(Natural Language Processing,簡稱NLP)技術作網絡信息內容分析。自然語言處理如語音識別(Speech Recognition)、計算機視覺(Computer Vision)、機械人(Robotics)等是人工智能的核心技術領域之一。它模仿人類文字理解的能力,把一篇文章中的每一句子進行詞法(Morphology)、語法(Syntax)及語意(Semantic)分析,然後綜合每句分析結果去洞悉那文章所表達的信息。這些步驟對中小學生而言一點都不陌生,是學習語文的必修一環,由此可見,人工智能的分析算法往往也是從人類「偷師」過來的。

新聞不重質 「去中心化」易誤導

筆者認為「謠言檢測」技術於當下日益氾濫的網絡世界愈來愈重要,特別是網上傳媒及新聞。近年數碼新聞發布重速不重質,傳媒為求務必捷足先登,爭取把新聞最快推出,為此編輯便移船就磡,罔顧新聞的質量。因此,在缺乏嚴謹的質量管制下,網上新聞往往錯漏百出,當中虛假新聞在所難免,而且愈來愈多,愈來愈假。

事實上,傳統閱讀新聞文化在網絡世界中已被顛覆,受到「去中心化編輯」的影響,「分布式編輯」變成新聞媒體的主流,如此這般新聞的質量監管工作轉由閱讀者承擔,因此若然他們知識有限,便很容易錯誤理解網上信息,然後作出不智的決定及行動。所以,自小培養年輕人的獨立思考及邏輯分析能力十分之關鍵,這反映出中小學的通識教育尤其重要。

社交網絡成為示威衝突另一戰場,假新聞及仇恨言論每天如排山倒海般衝向全球網絡,令事態火上加油、撕裂加深。(資料圖片)

撰文 : 黃錦輝教授 香港中文大學工程學院副院長(外務)、香港資訊科技聯會前會長

欄名 : 國是港事

緊貼財經時事新聞分析,讚好hket Facebook 專版