設置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

抖音跳舞不用真人出鏡,一張照片就能生成高質(zhì)量視頻!字節(jié)新技術(shù)連抱抱臉 CTO 都下場體驗了

量子位 2023/12/6 23:05:51 責編:問舟

看!現(xiàn)在正有四位小姐姐在你面前大秀熱舞:

以為是某些主播在短視頻平臺發(fā)布的作品?

No,No,No。真實答案是:假的,生成的,而且還是只靠了一張圖的那種!

真實的打開方式是這樣的:

這就是來自新加坡國立大學和字節(jié)跳動最新的一項研究,名叫 MagicAnimate。

它的作用簡單來說可以總結(jié)為一個公式:一張圖片 + 一組動作 = 毫無違和感的視頻。

然后啊,這項技術(shù)一經(jīng)公布,可謂是在科技圈里掀起了不小的波瀾,眾多科技大佬和極客們紛紛下場耍了起來。

就連 HuggingFace CTO 都拿自己的頭像體驗了一把:

順便還風趣地開了句玩笑:

這算是健身了吧?我這周可以不去健身房了。

還有相當與時俱進的網(wǎng)友,拿著剛出爐的 GTA6(俠盜獵車手 6)預告片中的人物玩了一把:

甚至就連表情包們也成了網(wǎng)友們 pick 的對象……

MagicAnimate 可以說是把科技圈的目光聚焦到了自己身上,因此也有網(wǎng)友調(diào)侃說:

OpenAI 可以休息一下了。

著實是火。

一張圖即可生成一段舞

那么如此火爆的 MagicAnimate,該如何“食用”?

話不多說,我們現(xiàn)在就來手把手地體驗一次。

目前項目團隊已經(jīng)在 HuggingFace 中開放了在線體驗的頁面:

操作也是非常得簡單,只需三步即可:

  • 上傳一張靜態(tài)人物照片

  • 上傳想要生成的動作 demo 視頻

  • 調(diào)整參數(shù),點擊“Animate”即可

例如下面就是鄙人照片和一段近期席卷全球的《科目三》舞蹈片段:

視頻源:抖音(ID:QC0217)

也可以選擇頁面下方提供的模版進行體驗:

不過需要注意的是,由于 MagicAnimate 目前過于火爆,在生成的過程中可能會出現(xiàn)“宕機”的情況:

即便成功“食用”,可能也得排大隊……

(沒錯!截至發(fā)稿,還是沒有等到結(jié)果?。?/figcaption>

除此之外,MagicAnimate 在 GitHub 中也給出了本地體驗的方式,感興趣的小伙伴可以試試哦~

那么接下來的一個問題便是:

怎么做到的?

整體而言,MagicAnimate 采用的是基于擴散模型(diffusion)的一個框架,目的就是增強時間一致性、保持參考圖像的真實性,并提高動畫保真度。

為此,團隊首先開發(fā)了一個視頻擴散模型(Temporal Consistency Modeling)來編碼時間信息。

這個模型通過在擴散網(wǎng)絡中加入時間注意力模塊,來編碼時間信息,從而確保動畫中各幀之間的時間一致性。

其次,為了保持幀間的外觀一致性,團隊引入了一種新的外觀編碼器(Appearance Encoder)來保留參考圖像的復雜細節(jié)。

這個編碼器與以往使用 CLIP 編碼的方法不同,能夠提取密集的視覺特征來引導動畫,從而更好地保留身份、背景和服裝等信息。

在這兩項創(chuàng)新技術(shù)的基礎之上,團隊進一步采用了一種簡單的視頻融合技術(shù)(Video Fusion Technique)來促進長視頻動畫的平滑過渡。

最終,在兩個基準上的實驗表明,MagicAnimate 的結(jié)果要遠優(yōu)于以往的方法。

尤其是在具有挑戰(zhàn)性的 TikTok 舞蹈數(shù)據(jù)集上,MagicAnimate 在視頻保真度方面比最強基線高出 38% 以上!

團隊所給出的定性比較如下:

以及與 cross-ID 的 SOTA 基線相比,結(jié)果如下:

One More Thing

不得不說,諸如 MagicAnimate 的項目最近著實是有點火爆。

這不,在它“出道”前不久,阿里團隊也發(fā)布了一個名叫 Animate Anyone 的項目,同樣是只要“一張圖”和“想要的動作”:

由此,也有網(wǎng)友發(fā)出了疑問:

這似乎是 MagicAnimate 和 AnimateAnyone 之間的戰(zhàn)爭。誰更勝一籌?

論文地址:

  • https://arxiv.org/abs/2311.16498

參考鏈接:

  • [1]https://github.com/magic-research/magic-animate

  • [2]https://twitter.com/cocktailpeanut/status/1732052908227588263

  • [3]https://twitter.com/ProductHunt/status/1732116454647136449

  • [4]https://twitter.com/Gradio/status/1731992981715231162

  • [5]https://twitter.com/dylan_ebert_/status/1732152096621813954

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:抖音,TiktokMagicAnimate

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應用 魔方 最會買 要知