2014 12 15 人工智慧分析爭議性議題的報導偏向

那福忠，知名電子出版專家、網路作家。

	人工智慧分析爭議性議題的報導偏向
	那福忠 December 15, 2014
	請把你的想法寫信給我： frank.na@gmail.com

一個剛從學校畢業的瑞士大學生，想在投資上發展自己的事業，不巧正好遇到金融風暴，讓他賠了不少錢，事後發覺當時很多有幫助的資訊可以讓他減少損失，他卻取得許多對他來說是錯誤的資訊，他就想為什麼在重大事件上不能即時取得多方面的資訊，把自己侷限在死角？這位電腦系畢業生於是改變了他的生涯規劃，繼續唸書深造。

他的名字叫 Claudiu Cristian Musat，七年以後成為洛桑技術學院人工智慧試驗室的博士研究員，發展出一個稱為 Perspectives 的搜尋引擎，把有爭議性議題的正反意見呈現給讀者，針對一個議題，有多少篇文稿是正面的、有多少篇文稿是反面的，正反的比例有多少，議題總結偏向正面還是偏向反面，有了這些資訊，讀者可以隨意閱讀，自己下結論。

網路給大家「選擇閱讀」的機會，結果大家多選擇與自己想法相近的意見，少選擇、或不選擇與自己相左的意見，於是各種意見社團相繼而生，對生活、知識、趣味各領域形成活躍的交往平台，是一件很好的事。但對一些較嚴肅的政治、經濟、醫藥各領域，就難免會產生不同傾向認知，這也是常說的網路的空間雖然浩大，網民的胸襟反而變得狹窄。

Perspectives 軟體正是扮演一個意見平衡的角色，遇到有爭議的議題，可以搜尋到正反雙方的資訊，給固持己見的人看看另一些人的想法，跳脫同質意見的圈圈。Musat 博士認為網路可以把人的胸襟擴大，如果在同一網頁標明正面與反面的意見，據他實驗的結果，有一半的人嘗試去瞭解與自己不同的意見，所以只要有適當的工具，網路還是可以開闊我們的思維。

針對一個爭議性的議題，要電腦判斷文稿的內容是正面還是反面，是難度頗高的人工智慧，所涉及的不單是文字處理，還要解讀文稿的語意，定義什麼叫正面、什麼叫反面，Musat 說基本上是用帶有感情的語詞如「好」與「壞」，「最好」與「最糟」來衡量文稿的偏向，因為這些語詞本身含有極限的意義。

Perspectives 軟體的做法，是用有爭議性的語詞與正反面的語詞比對，先擷取一篇文稿的含意，然後分析文句的結構與語意，一旦發現爭議性的語詞，就用正反面的語詞評比，計算正面與反面語詞的出現次數，決定這篇文稿的偏向。這一做法包括資料開鑿、語意分析等關鍵技術，Musat 說可以達到 80-90% 的準確度。

客觀與平衡是最重要的考量，對文稿的來源應有不同的加權，同一個議題，紐約時報的評論與一個僅有少數人的社群團體，雙方的意見自然不能站在同高度而論，但目前還沒有做到，仍然把最正面與最反面的文稿放在搜尋結果的前面，事實上極端的正面與反面的意見可靠通常較低。Musat 說驗證文稿來源，調整加權，是他們下一步的工作。

Perspectives 平台的焦點放在大家有爭議的事上，太複雜如以阿爭端意見過於紛歧，又像天氣預報是既有的事實隨處可以取得，都不在考慮之列，這一平台的目的是立即提供相反的意見，克服讀者「選擇閱讀」的習慣，可以在任何時間看到相反的意見。讀者會嗎？經過實驗，至少在英語與法語的經濟與健康的議題上，讀者有相當意願閱讀向反的意見。

Musat 目前正與一些主要新聞媒體洽談，這項技術對新聞的平衡報導有相當的潛力，因為可以測量新聞機構對特定議題偏向的程度，也可以用作讀者檢驗新聞從業人員的偏向程度，特別是對政治人物的偏頗報導。另外也可以長期檢驗新聞機構、從業人員，對一特定議題偏向程度的轉變。

對企業來說，Perspectives 更有相當的潛力，因為可以用來瞭解企業的公眾形象。企業經常花耗時間與巨大資源來分析資料，瞭解客戶的看法，雖然可以取得大量資料，分析卻不容易。如果可以從媒體、社群網路找到上萬則評語，並做出正反偏向的分析，Musat 問：這是「好」還是「壞」？

接到一位熱心讀者的來信，問我是否可以寫一點大數據在新聞業上的應用。大數據最吸引人的地方，在從龐大的資料堆裡挖掘出想像不到的寶藏，「自然語文處理」(Nature Language Processing) 為其基礎技術，用到任何領域都不容易，或許 Perspectives 算是大數據用在新聞報導的起步。

│

索引