蒙娜麗莎“不笑了”，AI還為她打造了系列表情包

2019/5/29 11:01:38 來(lái)源：網(wǎng)易科技作者：網(wǎng)易智能 責(zé)編：懶貓

評(píng)論：

“蒙娜麗莎”因?yàn)槠渖衩氐奈⑿Χ劽谑馈Ｗ罱谌斯ぶ悄艿膸椭?，這張著名的臉展示出了一系列令人震驚的新表情。

在一段5月21日分享在YouTube的一段視頻中，分別有三個(gè)不同片段展示了緊張不安的蒙娜麗莎動(dòng)嘴唇和轉(zhuǎn)頭時(shí)的樣子。視頻中的蒙娜麗莎是由卷積神經(jīng)網(wǎng)絡(luò)創(chuàng)造的，卷積神經(jīng)網(wǎng)絡(luò)是一種像人腦一樣處理信息的人工智能，可以用來(lái)分析和處理圖像。

研究人員對(duì)該算法進(jìn)行了訓(xùn)練，使其能夠理解面部特征的一般形狀及其相互之間的關(guān)系，然后研究人員將這些信息應(yīng)用于靜止圖像上。最終，一幅單一的畫(huà)面變成了一段真實(shí)的視頻。

來(lái)自斯科爾科沃科技研究所和三星人工智能中心(莫斯科)的工程師葉戈?duì)枴ぴ_夫在這段《蒙娜麗莎》的視頻中解釋說(shuō)：“人工智能‘學(xué)習(xí)’了三位模特的面部運(yùn)動(dòng)數(shù)據(jù)集，并且生成了三個(gè)截然不同的動(dòng)畫(huà)。雖然在這三個(gè)視頻片段中人們?nèi)匀荒鼙嬲J(rèn)出蒙娜麗莎，但三位模特的外貌和行為的變化賦予了這些‘活生生的肖像’以鮮明的個(gè)性?！?/p>

扎哈羅夫和他的同事還根據(jù)20世紀(jì)的文化偶像，如阿爾伯特·愛(ài)因斯坦、瑪麗蓮·夢(mèng)露和薩爾瓦多·達(dá)利的照片制作了動(dòng)畫(huà)。研究人員在5月20日發(fā)表在arXiv雜志網(wǎng)絡(luò)版上的一項(xiàng)研究中描述了他們的發(fā)現(xiàn)，但是這項(xiàng)研究沒(méi)有經(jīng)過(guò)同行評(píng)審。

研究人員寫(xiě)道，這類視頻被稱為deepfakes，制作這樣的原創(chuàng)視頻并不容易。人的頭部具有幾何復(fù)雜性和高度的動(dòng)態(tài)性，并且頭部的三維模型有“數(shù)千萬(wàn)個(gè)參數(shù)”。

更重要的是，這項(xiàng)研究表明，人類的視覺(jué)系統(tǒng)非常善于識(shí)別三維模型人腦中的“哪怕是很小的錯(cuò)誤”。一些看起來(lái)很像人類但并不完全屬于人類的東西，會(huì)引發(fā)一種“恐怖谷效應(yīng)”(uncanny valley effect)，并給人們帶來(lái)深深的不安感。

人工智能此前已經(jīng)證明，制作令人信服的deepfakes是可能的，但是需要從多個(gè)角度拍攝目標(biāo)對(duì)象。在這項(xiàng)新研究中，工程師們將人工智能引入了一個(gè)非常大的數(shù)據(jù)集，里面有顯示人臉活動(dòng)的參考視頻?？茖W(xué)家們建立了適用于任何一張臉的面部地標(biāo)，來(lái)教授“神經(jīng)網(wǎng)絡(luò)”人臉運(yùn)動(dòng)的一般規(guī)律。

然后，他們訓(xùn)練AI使用參考表達(dá)式來(lái)映射源特征的移動(dòng)。研究人員稱，這使得人工智能即使只有一張圖片可用，也能創(chuàng)建deepfakes。

科學(xué)家們寫(xiě)道：“更多的源圖像在最終動(dòng)畫(huà)中提供了更詳細(xì)的結(jié)果。在一項(xiàng)用戶研究中，一段用三十二張圖片而不是一張圖片制作的視頻達(dá)到了堪稱完美的真實(shí)性?！?/p>

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

蒙娜麗莎“不笑了”，AI還為她打造了系列表情包

相關(guān)文章

蒙娜麗莎“不笑了”，AI還為她打造了系列表情包