人工智能(AI)即將來臨。在蒙特利爾的NeurIPS 2018會議上接受的一篇論文《內(nèi)容保留文本生成與屬性控制》中,來自密歇根大學(xué)和谷歌大腦的數(shù)據(jù)科學(xué)家描述了一種機器學(xué)習(xí)架構(gòu),它不僅能夠生成給定樣本的句子,但是在保留其原意的同時改變原始文本的情緒,復(fù)雜性,緊張甚至聲音。
這可能有一天會用于復(fù)述,團隊假設(shè),機器翻譯和會話系統(tǒng)。它可以補充11月微軟研究所展示的系統(tǒng),它利用復(fù)雜的自然語言處理技術(shù)推理弱結(jié)構(gòu)化文本中的關(guān)系。
“在這項工作中,我們解決了修改句子文本屬性的問題,”研究人員寫道。“據(jù)我們所知,我們演示了第一個學(xué)習(xí)如何在沒有并行數(shù)據(jù)的情況下修改給定句子的多個文本屬性的實例。”
該團隊首先解決了情緒控制問題。他們采購了餐館評論數(shù)據(jù)集 - Yelp評論數(shù)據(jù)集的過濾版本 - 以及大量的IMDB電影評論,分別為447,000和300,000個句子,用于訓(xùn)練系統(tǒng)。
在培訓(xùn)之后,研究人員使用128,000次餐廳評論和36,000次電影評論的測試數(shù)據(jù)集,嘗試從具有負(fù)面情緒的句子中生成具有正面情緒的文本片段,反之亦然。
評估BLEU--“雙語評估替代”的縮寫,是評估機器翻譯文本的標(biāo)準(zhǔn)指標(biāo) - AI系統(tǒng)能夠勝過兩種領(lǐng)先的文本生成方法。此外,它始終生成與輸入句子相關(guān)的語法正確句子 - 在某種程度上,亞馬遜機械土耳其人的研究參與者認(rèn)為其輸出比以前的方法更加真實。
生成的句子令人驚訝地連貫。在一個例子中“柜臺后面的人不友好”變成“柜臺上的人非常友好和樂于助人。”在另一個例子中,模特翻轉(zhuǎn)了“這是關(guān)于電影的另一個有趣的方面”,“沒有贖回的品質(zhì)”關(guān)于這部電影。“
更令人印象深刻的是,另一項測試中的研究人員使用該系統(tǒng)同時控制句子的多種屬性 - 包括情緒,時態(tài),聲音和情緒。在對來自多倫多BookCorpus數(shù)據(jù)集的200萬個文本片段的數(shù)據(jù)集進行培訓(xùn)之后,該模型能夠?qū)⑽磥頃r態(tài)中的指示性情緒(“John將無法在陣營中生存”)中的句子翻譯為條件時態(tài)中的虛擬語氣(“約翰不能住在營地“)。
“我們證明我們的模型通過各種實驗和指標(biāo)有效地反映了條件信息,”研究人員寫道。“雖然以前的工作主要圍繞控制單個屬性并在兩種樣式之間進行轉(zhuǎn)換,但建議的模型很容易擴展到多屬性場景。在此框架中考慮具有連續(xù)值的屬性以及更大的語義和句法屬性集將是有趣的未來工作。“
新聞排行
圖文播報
科普信息網(wǎng) - 科普類網(wǎng)站
聯(lián)系郵箱:85 572 98@qq.com 備案號: 粵ICP備18023326號-39
版權(quán)所有:科普信息網(wǎng) www.www44bkbkcom.cn copyright © 2018 - 2020
科普信息網(wǎng)版權(quán)所有 本站點信息未經(jīng)允許不得復(fù)制或鏡像,違者將被追究法律責(zé)任!