設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

蘋(píng)果開(kāi)發(fā)生成式 AI 技術(shù) HUGS:30 分鐘內(nèi)創(chuàng)建“數(shù)字化身”

2023/12/20 7:18:40 來(lái)源:IT之家 作者:故淵 責(zé)編:故淵

IT之家 12 月 20 日消息,蘋(píng)果機(jī)器學(xué)習(xí)研究團(tuán)隊(duì)近日發(fā)布博文,展示了全新的生成式 AI 技術(shù)-- HUGS,能夠在 30 分鐘內(nèi)分析短視頻,然后映射創(chuàng)建新的動(dòng)作和角度。

蘋(píng)果研究員 Anurag Ranjan 發(fā)布推文,表示 HUGS 的全稱(chēng)叫作 Human Gaussian Splats,使用機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺(jué),在原始輸入數(shù)據(jù)較少的情況下,創(chuàng)建出逼真的人像元素。

蘋(píng)果官方介紹中表示神經(jīng)渲染技術(shù)目前已經(jīng)有了長(zhǎng)足的進(jìn)步,但最適合的場(chǎng)景依然是靜態(tài)場(chǎng)景的攝影測(cè)量,還無(wú)法推廣到環(huán)境中自由移動(dòng)的人類(lèi)。

HUGS 使用 3D Gaussian Splatting 的技術(shù),在場(chǎng)景中創(chuàng)建可移動(dòng)的人類(lèi)。

該方法本身需要少量的主體視頻,通常在場(chǎng)景中運(yùn)動(dòng),并顯示盡可能多的表面供系統(tǒng)工作。

在某些情況下,該技術(shù)對(duì)源輸入數(shù)據(jù)的要求很低,最少可以低至 50 到 100 幀的單目視頻,相當(dāng)于 2 到 4 秒的 24fps 視頻。

蘋(píng)果聲稱(chēng),該系統(tǒng)已經(jīng)過(guò)訓(xùn)練,可以“在 30 分鐘內(nèi)解開(kāi)靜態(tài)場(chǎng)景和完全可動(dòng)畫(huà)化的人類(lèi)化身”。

蘋(píng)果表示 SMPL 體模型雖然用于初始化人類(lèi)高斯模型,但無(wú)法捕獲每個(gè)細(xì)節(jié)。對(duì)于未建模的元素(如布料和頭發(fā)),該過(guò)程可以偏離 SMPL 模型,來(lái)填補(bǔ)模型捕獲中的空白。

蘋(píng)果官方表示從訓(xùn)練視頻到以 60fps 的渲染速度輸出,能夠在半小時(shí)完成人體建模和“最先進(jìn)的渲染質(zhì)量”動(dòng)畫(huà),這比 NeuMan 和 Vid2Avatar 等其它方法快 100 倍。

IT之家附上論文參考地址如下:

Project: https://machinelearning.apple.com/research/hugs

Xiv: https://arxiv.org/abs/2311.17910

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:蘋(píng)果AI

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知