設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

可從單張圖像創(chuàng)建多視圖 3D 視頻,Stability AI 發(fā)布 Stable Video 3D 模型

2024/3/21 10:53:01 來(lái)源:IT之家 作者:溯波(實(shí)習(xí)) 責(zé)編:汪淼

IT之家 3 月 21 日消息,Stability AI 近日發(fā)布了 Stable Video 3D 模型,該模型可從單張圖像創(chuàng)建多視圖 3D 視頻。

Stable Video 3D 模型原理

▲ 圖源 Stability AI,下同

Stable Video 3D 包含兩個(gè)變體,其中 SV3D_u 能基于單個(gè)圖像輸入生成軌道視頻,無(wú)需相機(jī)調(diào)節(jié);而 SV3D_p 擴(kuò)展了 SVD3_u 的功能,其可容納軌道視圖,允許沿著指定的攝像機(jī)路徑創(chuàng)建 3D 視頻。

相較之前的 Stable Zero123 模型或開(kāi)源替代品 Zero123-XL,Stable Video 3D 在質(zhì)量上有明顯提高,并具有更好的多視圖功能和更熟練的泛化能力,能更忠實(shí)地展現(xiàn)輸入圖像的三維全貌。

Stable Video 3D 模型對(duì)比之前模型

Stability AI 表示,新模型的水平提升有賴于其基石 Stable Video Diffusion 模型,同時(shí) Stable Video 3D 添加了攝像機(jī)路徑調(diào)節(jié),可生成圍繞物體的任意軌道。

Stable Video 3D 利用其多視圖一致性來(lái)優(yōu)化 3D NeRF 和網(wǎng)格表示,以提高直接從新視圖生成的 3D 網(wǎng)格的質(zhì)量。

為此 Stability AI 設(shè)計(jì)了一種新的掩碼分?jǐn)?shù)蒸餾采樣損失技術(shù),可提高 3D 預(yù)測(cè)質(zhì)量。同時(shí)其解糾纏照明優(yōu)化也減少了照明問(wèn)題,提升了陰影質(zhì)量。

Stability AI 表示 Stable Video 3D 已可通過(guò)其 Stability AI 會(huì)員訂閱(IT之家注:對(duì)于一般個(gè)人每月 20 美元)商業(yè)使用;而對(duì)于非商業(yè)用途,則可在 Hugging Face 平臺(tái)上下載模型權(quán)重。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:人工智能,AI模型,Stability AI

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知