騰訊混元大模型上線并開源文生視頻能力：支持中英文雙語輸入，參數(shù)量 130 億

2024/12/3 15:43:27 來源：IT之家作者：沛霖（實習） 責編：沛霖

評論：

IT之家 12 月 3 日消息，騰訊今日宣布，混元大模型上線并開源文生視頻能力，參數(shù)量 130 億，支持中英文雙語輸入。

▲ 提示詞：肩攝視角平移切入，清晨陽光透過紗簾灑落。畫面中央是一位老爺爺，正在木工臺前專注雕刻。攝影機徐徐推近，特寫他布滿皺紋的手指和木屑紛飛。背景虛化的老房間里，木工工具整齊排列，墻上掛滿完成的作品。

官方宣稱，騰訊混元視頻生成大模型可以生成“超寫實的”高質量視頻，生成的畫面不容易變形；在鏡面或鏡子場景中，可以做到鏡面反射動作和外面完全同步，光影反射基本符合物理規(guī)律。

騰訊混元大模型上線并開源文生視頻能力：支持中英文雙語輸入，參數(shù)量 130 億

▲ 提示詞：超大水管浪尖，沖浪者在浪尖起跳，完成空中轉體。攝影機從海浪內部穿越而出，捕捉陽光透過海水的瞬間。水花在空中形成完美弧線，沖浪板劃過水面留下軌跡。最后定格在沖浪者穿越水簾的完美瞬間。

騰訊混元大模型上線并開源文生視頻能力：支持中英文雙語輸入，參數(shù)量 130 億

▲ 提示詞：手持長焦跟拍，磨砂金屬車廂在高速中留下光帶。隧道燈光斷續(xù)閃過，映照出乘客若隱若現(xiàn)的側臉。防護玻璃上的水珠隨速度扭曲變形，構建出城市地下的光影迷宮。

據(jù)介紹，騰訊混元視頻生成大模型采用 DiT 架構，適配了新一代文本編碼器提升語義遵循，更好地應對多個主體描繪，實現(xiàn)更加細致的指令和畫面呈現(xiàn)。

騰訊混元大模型上線并開源文生視頻能力：支持中英文雙語輸入，參數(shù)量 130 億

▲ 提示詞：超廣角俯拍，熱氣球節(jié)。數(shù)百只彩色熱氣球緩緩升空，篝火在地面點亮黎明。云層被晨光染成粉色，構成壯觀的空中景觀。

在“騰訊元寶 App”，進入“AI 應用”，選擇“AI 視頻”，可申請試用。

騰訊混元大模型上線并開源文生視頻能力：支持中英文雙語輸入，參數(shù)量 130 億

騰訊表示，本次開源包含模型權重、推理代碼、模型算法等完整模型，可供企業(yè)與個人開發(fā)者免費使用和開發(fā)生態(tài)插件。

IT之家附相關鏈接如下：

廣告聲明：文內含有的對外跳轉鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結果僅供參考，IT之家所有文章均包含本聲明。

相關文章