IT之家 3 月 13 日消息,近日,YouTube 頻道 WVFRM Podcast 在其節(jié)目中,邀請了 OpenAI 旗下文生視頻模型 Sora 的核心團隊成員參與訪談。
IT之家注:三名成員包括 Bill Peebles、Tim Brooks 和 Aditya Ramesh,均為 Sora 項目負責人。
這三名負責人談到了 Sora 何時可供用戶使用的問題,其稱目前 Sora 仍處于反饋獲取階段,“還不是一個產(chǎn)品,短期之內(nèi)不會向公眾開放?!?/p>
對于什么時候把它變成一個產(chǎn)品,我們目前甚至沒有任何時間表。我們正處于獲取反饋階段。我們肯定會改進它,但我們應(yīng)該如何改進它是一個懸而未決的問題。
談及 Sora 的原理時,負責人表示,其工作原理是分析大量視頻數(shù)據(jù)、學(xué)習(xí)生成逼真的視頻,工作方法融合了 GPT 等大語言模型及 DALL-E 等擴散模型的技術(shù),架構(gòu)類似于“介于兩者之間”—— 架構(gòu)上更像 GPT,訓(xùn)練方式類似于 DALL-E。
而對于 Sora 的訓(xùn)練數(shù)據(jù)來源問題,負責人則稱不能透露太多細節(jié),僅表示是基于公開可用的數(shù)據(jù)、OpenAI 授權(quán)數(shù)據(jù)的組合進行訓(xùn)練的。
據(jù)IT之家此前報道,Sora 能夠根據(jù)文本快速生成相對高質(zhì)量的視頻,但業(yè)內(nèi)人士認為,目前這類 AI 工具仍存在局限性,無法完全取代人類創(chuàng)作者的工作。
“很多人說好萊塢完了,” 電影概念藝術(shù)家和插畫師 Reid Southen 表示,“但我并不這么認為。好萊塢的制作流程非常復(fù)雜,這些視頻也存在很多問題,尤其是時間一致性和額外肢體等瑕疵?!?/p>
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。