IT之家 12 月 3 日消息,騰訊今日宣布,混元大模型上線并開源文生視頻能力,參數(shù)量 130 億,支持中英文雙語輸入。
官方宣稱,騰訊混元視頻生成大模型可以生成“超寫實的”高質量視頻,生成的畫面不容易變形;在鏡面或鏡子場景中,可以做到鏡面反射動作和外面完全同步,光影反射基本符合物理規(guī)律。
據(jù)介紹,騰訊混元視頻生成大模型采用 DiT 架構,適配了新一代文本編碼器提升語義遵循,更好地應對多個主體描繪,實現(xiàn)更加細致的指令和畫面呈現(xiàn)。
在“騰訊元寶 App”,進入“AI 應用”,選擇“AI 視頻”,可申請試用。
騰訊表示,本次開源包含模型權重、推理代碼、模型算法等完整模型,可供企業(yè)與個人開發(fā)者免費使用和開發(fā)生態(tài)插件。
IT之家附相關鏈接如下:
Huggingface:https://huggingface.co/tencent/HunyuanVideo
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。