設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

谷歌 Gemini 1.5 Pro 銳評 Sora 生成的視頻:視覺上很吸引人,但存諸多不合理之處

2024/2/19 11:27:21 來源:IT之家 作者:遠洋 責編:遠洋

IT之家 2 月 19 日消息,近日,谷歌的人工智能模型 Gemini 1.5 對 OpenAI Sora 生成的一段視頻進行了評價,稱其在視覺上很吸引人,但一些不合理之處可以看出其不是真實的視頻。

IT之家此前報道,雙方分別發(fā)布了各自的最新技術(shù):谷歌推出 Gemini 1.5 Pro,OpenAI 則推出了文本轉(zhuǎn)視頻工具 Sora。Sora 的發(fā)布時機引發(fā)猜測,有人認為 OpenAI 是為了轉(zhuǎn)移公眾對谷歌 Gemini 1.5 的注意力。

谷歌一位高管在 X 平臺上分享了對 Sora 生成視頻的詳細分析,Gemini 1.5 Pro 以 Sora 生成的日本一條既有雪景又有櫻花盛開的街道視頻為例,指出視頻存在明顯不合理之處。

根據(jù) Gemini 1.5 Pro 的分析,大雪紛飛和盛開的櫻花同時出現(xiàn)并不符合常理,因為櫻花通常在春季開放,不會伴有降雪。而且雪的下落方式非常均勻,這不是現(xiàn)實生活中通常的降雪方式。此外,視頻中的人物雖然身處大雪環(huán)境,卻并未穿著任何冬裝,這也顯得非常違和。

Gemini 1.5 在分析中總結(jié)道:“總而言之,這段視頻雖然視覺上很吸引人,但其中的矛盾之處表明它并非現(xiàn)實生活中的場景。”

Sora 是一款能夠生成長達 60 秒視頻的文本轉(zhuǎn)視頻工具,可以創(chuàng)建包含細節(jié)豐富的場景、復雜攝像機運動以及具有豐富情感的多個人物畫面,許多人將其稱為視頻生成領(lǐng)域的 “ChatGPT 時刻”。

而谷歌的 Gemini 1.5 則擁有驚人的 100 萬詞條上下文窗口,遠超 GPT-4 Turbo 的 12.8 萬和 Anthropic Claude 2.1 的 20 萬。這意味著它可以一次處理大量信息,包括 1 小時的視頻、11 小時的音頻以及超過 30,000 行代碼或 70 萬字的代碼庫。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:Gemini,Sora人工智能

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知