設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

一句話就能魔改視頻主角,谷歌新「AI 導(dǎo)演」引網(wǎng)友熱議

量子位 2023/2/6 18:07:07 責(zé)編:夢澤

原文標(biāo)題:《一句話就能魔改視頻主角,谷歌新「AI 導(dǎo)演」驚呆網(wǎng)友:這畫質(zhì)也太贊了》

谷歌整出了個(gè)新“AI 導(dǎo)演”,一句話甚至能把視頻主角給換了。

你看,青青草地上,一只小熊正在跳舞。

難道現(xiàn)在的熊都這么有藝術(shù)細(xì)胞了嘛??

No,No,No!草地上原有的其實(shí)是只猴子。

要從猴變熊,只用跟這個(gè) AI 說一句:

一只小熊隨著音樂節(jié)拍跳著舞,扭動他的整個(gè)身子。(A bear dancing and jumping to upbeat music, moving his whole body)

除了會“魔改”視頻,這個(gè)名為 Dreamix 的 AI 還能把靜態(tài)圖片變成動畫 —— 也是一句話就搞定。

比如給此 AI 看一張“海龜游泳照”,再告訴它:

水下拍到一只海龜在游泳,后面有只鯊魚正在靠近。(Underwater shot of a sea turle with a shark apporching from behind)

好家伙,一句話不僅讓海龜游起來了,還憑空加了條鯊魚。

這效果,讓不少圍觀網(wǎng)友都紛紛點(diǎn)贊。

有人甚至斷言,AIGC 將在接下的兩年時(shí)間繼續(xù)掀起熱潮,甚至比千禧年間的發(fā)展更加瘋狂。

導(dǎo)演視頻,只用一句話

一經(jīng)公開就能受到盛贊,這個(gè) AI 究竟如何?不妨再看看其更多的“導(dǎo)演”作品來感受一下。

首先,在更換視頻角色方面,這是原本的田野:

這是 AI 放火燒掉的田野:

這是人的手在寫字:

這是 AI 生成的機(jī)器人手在寫字:

同樣以人寫字的視頻為原型,如果把提示句子換成“人的手在畫圓”,還會有不同的生成效果:

而在靜態(tài)圖變動畫方面,原圖是霧蒙蒙的叢林:

而 AI 給這片林子加了一只奔跑的獨(dú)角獸,而且鏡頭還按句子提示給拉遠(yuǎn)了。

還有這樣一張河谷風(fēng)景圖:

AI 不僅讓溪水流動起來,還給岸邊加上了來洗澡水牛,給天空加上了飛翔的小鳥。

看到這里,有人可能會覺得欠點(diǎn)火候:動畫倒是做出來了,但畫質(zhì)也犧牲了挺多啊。

那不妨多給 AI 看幾張圖。

比如一口氣給 AI 看 7 張玩具火警的照片:

然后再讓它根據(jù)一句話生成視頻,這下畫質(zhì)就會清楚很多。

至于這個(gè)”AI 導(dǎo)演”是怎么做的,谷歌表示,關(guān)鍵在于“老朋友”擴(kuò)散模型 (Diffusion Model) 。

擴(kuò)散模型,也是火出圈的 AIGC 作畫神器 DALL·E 2 的核心。

谷歌研究人員指出,其實(shí)之前已有類似的“文字生成視頻”AI 了,但若僅僅在輸入視頻上對視頻擴(kuò)散模型進(jìn)行微調(diào),會限制運(yùn)動變化的程度。

而此 AI 與眾不同之處在于:

團(tuán)隊(duì)使用了一個(gè)“混合目標(biāo)”,除了對原始目標(biāo)進(jìn)行微調(diào)外,還會對無序幀集進(jìn)行微調(diào)。

他們采用了一種深度學(xué)習(xí)中專門的注意力機(jī)制:Masked Temporal Attention,幫助模型專注于輸入信息的特定部分,忽略其他無關(guān)的部分。

—— 這提高了模型處理序列數(shù)據(jù)的能力,生成視頻中的動態(tài)更多樣化,且效果也比較自然。

在擴(kuò)散模型和 Masked Temporal Attention 的加持下,對于更換視頻主角來說,輸入其實(shí)已經(jīng)被省略了 —— 只需進(jìn)行微調(diào),結(jié)果的保真度也相當(dāng)不錯(cuò)。

參考鏈接:

  • [1] https://dreamix-video-editing.github.io/

  • [2] https://www.youtube.com/watch?v=QWUmk6GuqIQ

  • [3] https://www.reddit.com/r/MachineLearning/comments/10tovhn/n_r_google_announces_dreamix_a_model_that/

本文來自微信公眾號:量子位 (ID:QbitAI),作者:Alex

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:AI,視頻模型

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知