IT之家 6 月 21 日消息,快手可靈新功能“圖生視頻”和“視頻續(xù)寫”今日上線。
圖生視頻功能,支持將靜態(tài)圖像轉(zhuǎn)化為 5 秒鐘視頻,用戶可通過提示詞文本控制圖像中物體的運動;視頻續(xù)寫功能,支持對生成視頻一鍵續(xù)寫和連續(xù)多次續(xù)寫,最長可生成約 3 分鐘視頻;此外文生視頻新增 9:16 和 1:1 視頻尺寸選擇。
IT之家附快手可靈官方網(wǎng)站:https://kling.kuaishou.com/
可靈是由快手自研打造的視頻生成大模型,能夠生成大幅度的合理運動,模擬物理世界特性。
可靈使用了 DiT 架構(gòu),快手對模型中的隱空間編 / 解碼、時序建模等模塊進行了升維處理。
在隱空間編 / 解碼上,快手自研了 3D VAE 網(wǎng)絡(luò),實現(xiàn)時空同步壓縮,獲得了較高的重建質(zhì)量,在訓(xùn)練性能和效果之間取得了平衡。在時序信息建模上,快手設(shè)計了一款全注意力機制作為時空建模模塊。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。