設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

蒙娜麗莎“不笑了”,AI還為她打造了系列表情包

2019/5/29 11:01:38 來(lái)源:網(wǎng)易科技 作者:網(wǎng)易智能 責(zé)編:懶貓

“蒙娜麗莎”因?yàn)槠渖衩氐奈⑿Χ劽谑馈W罱谌斯ぶ悄艿膸椭?,這張著名的臉展示出了一系列令人震驚的新表情。

在一段5月21日分享在YouTube的一段視頻中,分別有三個(gè)不同片段展示了緊張不安的蒙娜麗莎動(dòng)嘴唇和轉(zhuǎn)頭時(shí)的樣子。視頻中的蒙娜麗莎是由卷積神經(jīng)網(wǎng)絡(luò)創(chuàng)造的,卷積神經(jīng)網(wǎng)絡(luò)是一種像人腦一樣處理信息的人工智能,可以用來(lái)分析和處理圖像。

研究人員對(duì)該算法進(jìn)行了訓(xùn)練,使其能夠理解面部特征的一般形狀及其相互之間的關(guān)系,然后研究人員將這些信息應(yīng)用于靜止圖像上。最終,一幅單一的畫(huà)面變成了一段真實(shí)的視頻。

來(lái)自斯科爾科沃科技研究所和三星人工智能中心(莫斯科)的工程師葉戈?duì)枴ぴ_夫在這段《蒙娜麗莎》的視頻中解釋說(shuō):“人工智能‘學(xué)習(xí)’了三位模特的面部運(yùn)動(dòng)數(shù)據(jù)集,并且生成了三個(gè)截然不同的動(dòng)畫(huà)。雖然在這三個(gè)視頻片段中人們?nèi)匀荒鼙嬲J(rèn)出蒙娜麗莎,但三位模特的外貌和行為的變化賦予了這些‘活生生的肖像’以鮮明的個(gè)性?!?/p>

扎哈羅夫和他的同事還根據(jù)20世紀(jì)的文化偶像,如阿爾伯特·愛(ài)因斯坦、瑪麗蓮·夢(mèng)露和薩爾瓦多·達(dá)利的照片制作了動(dòng)畫(huà)。研究人員在5月20日發(fā)表在arXiv雜志網(wǎng)絡(luò)版上的一項(xiàng)研究中描述了他們的發(fā)現(xiàn),但是這項(xiàng)研究沒(méi)有經(jīng)過(guò)同行評(píng)審。


研究人員寫(xiě)道,這類視頻被稱為deepfakes,制作這樣的原創(chuàng)視頻并不容易。人的頭部具有幾何復(fù)雜性和高度的動(dòng)態(tài)性,并且頭部的三維模型有“數(shù)千萬(wàn)個(gè)參數(shù)”。

更重要的是,這項(xiàng)研究表明,人類的視覺(jué)系統(tǒng)非常善于識(shí)別三維模型人腦中的“哪怕是很小的錯(cuò)誤”。一些看起來(lái)很像人類但并不完全屬于人類的東西,會(huì)引發(fā)一種“恐怖谷效應(yīng)”(uncanny valley effect),并給人們帶來(lái)深深的不安感。

人工智能此前已經(jīng)證明,制作令人信服的deepfakes是可能的,但是需要從多個(gè)角度拍攝目標(biāo)對(duì)象。在這項(xiàng)新研究中,工程師們將人工智能引入了一個(gè)非常大的數(shù)據(jù)集,里面有顯示人臉活動(dòng)的參考視頻??茖W(xué)家們建立了適用于任何一張臉的面部地標(biāo),來(lái)教授“神經(jīng)網(wǎng)絡(luò)”人臉運(yùn)動(dòng)的一般規(guī)律。

然后,他們訓(xùn)練AI使用參考表達(dá)式來(lái)映射源特征的移動(dòng)。研究人員稱,這使得人工智能即使只有一張圖片可用,也能創(chuàng)建deepfakes。

科學(xué)家們寫(xiě)道:“更多的源圖像在最終動(dòng)畫(huà)中提供了更詳細(xì)的結(jié)果。在一項(xiàng)用戶研究中,一段用三十二張圖片而不是一張圖片制作的視頻達(dá)到了堪稱完美的真實(shí)性?!?/p>

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:人工智能

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知