【網(wǎng)易智能訊5月29日消息】“蒙娜麗莎”因為其神秘的微笑而聞名于世。最近在人工智能的幫助下,這張著名的臉展示出了一系列令人震驚的新表情。
在一段5月21日分享在YouTube的一段視頻中,分別有三個不同片段展示了緊張不安的蒙娜麗莎動嘴唇和轉(zhuǎn)頭時的樣子。視頻中的蒙娜麗莎是由卷積神經(jīng)網(wǎng)絡(luò)創(chuàng)造的,卷積神經(jīng)網(wǎng)絡(luò)是一種像人腦一樣處理信息的人工智能,可以用來分析和處理圖像。
研究人員對該算法進行了訓(xùn)練,使其能夠理解面部特征的一般形狀及其相互之間的關(guān)系,然后研究人員將這些信息應(yīng)用于靜止圖像上。最終,一幅單一的畫面變成了一段真實的視頻。
來自斯科爾科沃科技研究所和三星人工智能中心(莫斯科)的工程師葉戈爾·扎哈羅夫在這段《蒙娜麗莎》的視頻中解釋說:“人工智能‘學(xué)習(xí)’了三位模特的面部運動數(shù)據(jù)集,并且生成了三個截然不同的動畫。雖然在這三個視頻片段中人們?nèi)匀荒鼙嬲J(rèn)出蒙娜麗莎,但三位模特的外貌和行為的變化賦予了這些‘活生生的肖像’以鮮明的個性。”
扎哈羅夫和他的同事還根據(jù)20世紀(jì)的文化偶像,如阿爾伯特·愛因斯坦、瑪麗蓮·夢露和薩爾瓦多·達(dá)利的照片制作了動畫。研究人員在5月20日發(fā)表在arXiv雜志網(wǎng)絡(luò)版上的一項研究中描述了他們的發(fā)現(xiàn),但是這項研究沒有經(jīng)過同行評審。
研究人員寫道,這類視頻被稱為deepfakes,制作這樣的原創(chuàng)視頻并不容易。人的頭部具有幾何復(fù)雜性和高度的動態(tài)性,并且頭部的三維模型有“數(shù)千萬個參數(shù)”。
更重要的是,這項研究表明,人類的視覺系統(tǒng)非常善于識別三維模型人腦中的“哪怕是很小的錯誤”。一些看起來很像人類但并不完全屬于人類的東西,會引發(fā)一種“恐怖谷效應(yīng)”(uncanny valley effect),并給人們帶來深深的不安感。
人工智能此前已經(jīng)證明,制作令人信服的deepfakes是可能的,但是需要從多個角度拍攝目標(biāo)對象。在這項新研究中,工程師們將人工智能引入了一個非常大的數(shù)據(jù)集,里面有顯示人臉活動的參考視頻。科學(xué)家們建立了適用于任何一張臉的面部地標(biāo),來教授“神經(jīng)網(wǎng)絡(luò)”人臉運動的一般規(guī)律。
然后,他們訓(xùn)練AI使用參考表達(dá)式來映射源特征的移動。研究人員稱,這使得人工智能即使只有一張圖片可用,也能創(chuàng)建deepfakes。
科學(xué)家們寫道:“更多的源圖像在最終動畫中提供了更詳細(xì)的結(jié)果。在一項用戶研究中,一段用三十二張圖片而不是一張圖片制作的視頻達(dá)到了堪稱完美的真實性。”
標(biāo)簽:
新聞排行
圖文播報
科普信息網(wǎng) - 科普類網(wǎng)站
聯(lián)系郵箱:85 572 98@qq.com 備案號: 粵ICP備18023326號-39
版權(quán)所有:科普信息網(wǎng) www.www44bkbkcom.cn copyright © 2018 - 2020
科普信息網(wǎng)版權(quán)所有 本站點信息未經(jīng)允許不得復(fù)制或鏡像,違者將被追究法律責(zé)任!