人工智能讓蒙娜麗莎“不笑了”為其打造表情包

發(fā)布時間：2019-05-29 11:04:32 來源：網(wǎng)易智能責(zé)任編輯：caobo

【網(wǎng)易智能訊5月29日消息】“蒙娜麗莎”因為其神秘的微笑而聞名于世。最近在人工智能的幫助下，這張著名的臉展示出了一系列令人震驚的新表情。

在一段5月21日分享在YouTube的一段視頻中，分別有三個不同片段展示了緊張不安的蒙娜麗莎動嘴唇和轉(zhuǎn)頭時的樣子。視頻中的蒙娜麗莎是由卷積神經(jīng)網(wǎng)絡(luò)創(chuàng)造的，卷積神經(jīng)網(wǎng)絡(luò)是一種像人腦一樣處理信息的人工智能，可以用來分析和處理圖像。

研究人員對該算法進行了訓(xùn)練，使其能夠理解面部特征的一般形狀及其相互之間的關(guān)系，然后研究人員將這些信息應(yīng)用于靜止圖像上。最終，一幅單一的畫面變成了一段真實的視頻。

來自斯科爾科沃科技研究所和三星人工智能中心(莫斯科)的工程師葉戈爾·扎哈羅夫在這段《蒙娜麗莎》的視頻中解釋說：“人工智能‘學(xué)習(xí)’了三位模特的面部運動數(shù)據(jù)集，并且生成了三個截然不同的動畫。雖然在這三個視頻片段中人們?nèi)匀荒鼙嬲J(rèn)出蒙娜麗莎，但三位模特的外貌和行為的變化賦予了這些‘活生生的肖像’以鮮明的個性。”

扎哈羅夫和他的同事還根據(jù)20世紀(jì)的文化偶像，如阿爾伯特·愛因斯坦、瑪麗蓮·夢露和薩爾瓦多·達(dá)利的照片制作了動畫。研究人員在5月20日發(fā)表在arXiv雜志網(wǎng)絡(luò)版上的一項研究中描述了他們的發(fā)現(xiàn)，但是這項研究沒有經(jīng)過同行評審。

研究人員寫道，這類視頻被稱為deepfakes，制作這樣的原創(chuàng)視頻并不容易。人的頭部具有幾何復(fù)雜性和高度的動態(tài)性，并且頭部的三維模型有“數(shù)千萬個參數(shù)”。

更重要的是，這項研究表明，人類的視覺系統(tǒng)非常善于識別三維模型人腦中的“哪怕是很小的錯誤”。一些看起來很像人類但并不完全屬于人類的東西，會引發(fā)一種“恐怖谷效應(yīng)”(uncanny valley effect)，并給人們帶來深深的不安感。

人工智能此前已經(jīng)證明，制作令人信服的deepfakes是可能的，但是需要從多個角度拍攝目標(biāo)對象。在這項新研究中，工程師們將人工智能引入了一個非常大的數(shù)據(jù)集，里面有顯示人臉活動的參考視頻。科學(xué)家們建立了適用于任何一張臉的面部地標(biāo)，來教授“神經(jīng)網(wǎng)絡(luò)”人臉運動的一般規(guī)律。

然后，他們訓(xùn)練AI使用參考表達(dá)式來映射源特征的移動。研究人員稱，這使得人工智能即使只有一張圖片可用，也能創(chuàng)建deepfakes。

科學(xué)家們寫道：“更多的源圖像在最終動畫中提供了更詳細(xì)的結(jié)果。在一項用戶研究中，一段用三十二張圖片而不是一張圖片制作的視頻達(dá)到了堪稱完美的真實性。”

標(biāo)簽：