IT之家 3 月 13 日消息,近日,YouTube 頻道 WVFRM Podcast 在其節(jié)目中,邀請(qǐng)了 OpenAI 旗下文生視頻模型 Sora 的核心團(tuán)隊(duì)成員參與訪談。
IT之家注:三名成員包括 Bill Peebles、Tim Brooks 和 Aditya Ramesh,均為 Sora 項(xiàng)目負(fù)責(zé)人。
這三名負(fù)責(zé)人談到了 Sora 何時(shí)可供用戶使用的問題,其稱目前 Sora 仍處于反饋獲取階段,“還不是一個(gè)產(chǎn)品,短期之內(nèi)不會(huì)向公眾開放?!?/p>
對(duì)于什么時(shí)候把它變成一個(gè)產(chǎn)品,我們目前甚至沒有任何時(shí)間表。我們正處于獲取反饋階段。我們肯定會(huì)改進(jìn)它,但我們應(yīng)該如何改進(jìn)它是一個(gè)懸而未決的問題。
談及 Sora 的原理時(shí),負(fù)責(zé)人表示,其工作原理是分析大量視頻數(shù)據(jù)、學(xué)習(xí)生成逼真的視頻,工作方法融合了 GPT 等大語言模型及 DALL-E 等擴(kuò)散模型的技術(shù),架構(gòu)類似于“介于兩者之間”—— 架構(gòu)上更像 GPT,訓(xùn)練方式類似于 DALL-E。
而對(duì)于 Sora 的訓(xùn)練數(shù)據(jù)來源問題,負(fù)責(zé)人則稱不能透露太多細(xì)節(jié),僅表示是基于公開可用的數(shù)據(jù)、OpenAI 授權(quán)數(shù)據(jù)的組合進(jìn)行訓(xùn)練的。
據(jù)IT之家此前報(bào)道,Sora 能夠根據(jù)文本快速生成相對(duì)高質(zhì)量的視頻,但業(yè)內(nèi)人士認(rèn)為,目前這類 AI 工具仍存在局限性,無法完全取代人類創(chuàng)作者的工作。
“很多人說好萊塢完了,” 電影概念藝術(shù)家和插畫師 Reid Southen 表示,“但我并不這么認(rèn)為。好萊塢的制作流程非常復(fù)雜,這些視頻也存在很多問題,尤其是時(shí)間一致性和額外肢體等瑕疵。”
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。