IT之家 6 月 2 日消息,英偉達(dá)公司于本周宣布推出一款名為 Neuralangelo 的 AI 模型,該模型能夠?qū)⒁曨l片段轉(zhuǎn)化為細(xì)節(jié)層次豐富、具備貼圖的 3D 模型。
IT之家查詢得知,此前也已經(jīng)有數(shù)個(gè)基于視頻內(nèi)容生成 3D 模型的 AI,但這些 AI 往往在面對(duì)低對(duì)比度視頻時(shí)便無法著手。而英偉達(dá)的 Neuralangelo 模型采用了即時(shí)神經(jīng)繪圖(instant neural graphics primitives),并利用了自家的 Instant NeRF 技術(shù),因此即使是對(duì)于低對(duì)比度的視頻,也可以從中捕捉到微妙的細(xì)節(jié),并轉(zhuǎn)換為更具備商業(yè)價(jià)值的 3D 模型。
英偉達(dá)強(qiáng)調(diào),Neuralangelo 的獨(dú)到之處主要表現(xiàn)在其“準(zhǔn)確性”與“普適性”:
“準(zhǔn)確性”即該模型可以準(zhǔn)確呈現(xiàn)復(fù)雜材料的質(zhì)地,例如屋頂瓦片、玻璃窗格和光滑的大理石;
“普適性”即創(chuàng)作者們能夠簡(jiǎn)單使用智能手機(jī)拍攝的影片素材,即可創(chuàng)作出逼真的物件,并將其整合到他們的項(xiàng)目中。
Neuralangelo 模型利用從不同角度拍攝的物品的視頻作為輸入素材,來生成創(chuàng)作者們所需要的模型。一旦 Neuralangelo 確定了視頻中相機(jī)的運(yùn)動(dòng)規(guī)律,它就會(huì)生成模型的 3D 輪廓,并開始在上面雕刻出細(xì)節(jié)。
預(yù)計(jì)英偉達(dá)將在 6 月 18 日至 22 日舉行的電腦視覺與樣式辨識(shí)(Computer Vision and Pattern Recognition,CVPR)大會(huì)上發(fā)布 Neuralangelo 模型。在內(nèi)部演示中,英偉達(dá)展示了 Neuralangelo 模型重建的米開朗基羅著名雕刻作品《大衛(wèi)》、英偉達(dá)位于灣區(qū)的辦公室、及平板拖車等日常見到的物品的 3D 還原模型。
除了 Neuralangelo,英偉達(dá)還將在大會(huì)上展示一款名為 DiffCollage 的模型。DiffCollage 是一種能夠通過文字提示詞生成視頻的 AI 模型,可以生成 360 度全景圖像與循環(huán)動(dòng)態(tài)圖像,并再將這些圖像擴(kuò)展為具體的視頻。
英偉達(dá)研究部高級(jí)主任、論文作者 Ming-Yu Liu 對(duì)這項(xiàng)研究的意義給出了暢想:
Neuralangelo 提供的 3D 重建能力將給創(chuàng)作者帶來巨大好處,幫助他們?cè)跀?shù)字世界中重建真實(shí)世界。這個(gè)工具最終將使開發(fā)人員能夠?qū)⒕?xì)的物體 —— 不論是小型雕像,還是大型建筑 —— 導(dǎo)入視頻游戲或工業(yè)數(shù)字孿生的虛擬環(huán)境中。
IT之家的小伙伴們可以在這里找到論文的具體內(nèi)容。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。