科普信息網

人工智能或許能有效打擊機器制造的假新聞和灌水評論

發布時間:2019-07-31 14:40:21 來源:澎湃新聞 責任編輯:caobo

人工智能現在的寫作能力雖然還不至于寫出世界名著,但足以掩藏住機器的痕跡,混淆普通人的視線。最重要的是,AI可以批量生產文本,炮制假新聞、快速刷評論。該如何揪出冒充人類的AI呢?哈佛大學和麻省理工學院- IBM沃森人工智能實驗室(MIT-IBM Watson AI Lab)的研究人員想到了用AI識別AI。

他們開發了一種叫做“巨型語言模型測試器”(GLTR)的新工具,用于識別人工智能生成的文本。其辨別原理基于:人工智能是利用文本中的統計模式來自動生成文本的,而不考慮單詞和句子的實際含義。也就是說,如果一篇文章中的用詞都是可預測的,該文章就極可能是由人工智能寫的,而GLTR可以標注出文章用詞是否可預測。

開發最厚的盾,就要用最強的矛來測試。前一陣子,埃隆·馬斯克參與創立的AI研究機構OpenAI推出了一種算法,可以自動生成真實度極高的段落。只要在該算法的“學習模式”中輸入海量數據,該算法就可以統計詞頻,組合高頻詞,生成新的段落。而哈佛大學的團隊正是用Open AI公開發布的代碼為基礎,發明了GLTR。

GLTR可以根據詞頻,標明最可能出現的單詞搭配。最易預測的單詞是綠色的,較難預測的是黃色和紅色的,最難預測的是紫色的。當對Open AI編寫的算法所生成的文字進行測試后,發現大部分單詞都可預測;而人類寫出的新聞和科學摘要文字搭配更多樣。

那么,什么樣的用詞才是AI無法模仿的“人來之筆”呢?澎湃新聞記者將《哈姆雷特》中膾炙人口的段落放進該工具中檢索。

《哈姆雷特》選段,右為中文譯文

可以看到,莎翁的手筆確實不是AI能輕易揣摩的,短短的片段中就出現了20多處標紫。第一處標紫的“暴虐”雖非多么生僻的詞匯,但用來修飾“命運”卻并不常見。在AI眼中,這種搭配猶能體現出“人性之光”。

GLTR的研究人員讓哈佛的學生分別在不使用GLTR、和使用GLTR的時候,判斷文本是否是人工智能生成的。實驗結果表明,在不使用GLTR時,學生們只能識別出一半的虛假文本;而看到GLTR所做的標注后,他們可以識別出72%的虛假文本。Sebastian Gehrmanns是一位參與GLTR發明的博士生,他表明:“我們的目標是建立一個人類和人工智能協作的體系。”

《麻省理工科技評論》對此評價道,現在自動生成的假消息越來越多,這種AI工具或許能有效打擊機器制造的假新聞、假視頻和灌水評論。

標簽:

上一篇:國內5G資費套餐最快將于8月推出 運營商:5G資費不會很貴
下一篇:人工智能和物聯網助力提高啤酒質量

新聞排行