可從單張圖像創(chuàng)建多視圖 3D 視頻，Stability AI 發(fā)布 Stable Video 3D 模型

2024/3/21 10:53:01 來(lái)源：IT之家作者：溯波（實(shí)習(xí)） 責(zé)編：汪淼

評(píng)論：

IT之家 3 月 21 日消息，Stability AI 近日發(fā)布了 Stable Video 3D 模型，該模型可從單張圖像創(chuàng)建多視圖 3D 視頻。

Stable Video 3D 模型原理

▲ 圖源 Stability AI，下同

Stable Video 3D 包含兩個(gè)變體，其中 SV3D_u 能基于單個(gè)圖像輸入生成軌道視頻，無(wú)需相機(jī)調(diào)節(jié)；而 SV3D_p 擴(kuò)展了 SVD3_u 的功能，其可容納軌道視圖，允許沿著指定的攝像機(jī)路徑創(chuàng)建 3D 視頻。

相較之前的 Stable Zero123 模型或開(kāi)源替代品 Zero123-XL，Stable Video 3D 在質(zhì)量上有明顯提高，并具有更好的多視圖功能和更熟練的泛化能力，能更忠實(shí)地展現(xiàn)輸入圖像的三維全貌。

Stable Video 3D 模型對(duì)比之前模型

Stability AI 表示，新模型的水平提升有賴于其基石 Stable Video Diffusion 模型，同時(shí) Stable Video 3D 添加了攝像機(jī)路徑調(diào)節(jié)，可生成圍繞物體的任意軌道。

Stable Video 3D 利用其多視圖一致性來(lái)優(yōu)化 3D NeRF 和網(wǎng)格表示，以提高直接從新視圖生成的 3D 網(wǎng)格的質(zhì)量。

為此 Stability AI 設(shè)計(jì)了一種新的掩碼分?jǐn)?shù)蒸餾采樣損失技術(shù)，可提高 3D 預(yù)測(cè)質(zhì)量。同時(shí)其解糾纏照明優(yōu)化也減少了照明問(wèn)題，提升了陰影質(zhì)量。

Stability AI 表示 Stable Video 3D 已可通過(guò)其 Stability AI 會(huì)員訂閱（IT之家注：對(duì)于一般個(gè)人每月 20 美元）商業(yè)使用；而對(duì)于非商業(yè)用途，則可在 Hugging Face 平臺(tái)上下載模型權(quán)重。

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

可從單張圖像創(chuàng)建多視圖 3D 視頻，Stability AI 發(fā)布 Stable Video 3D 模型

相關(guān)文章