谷歌 Gemini 1.5 Pro 銳評(píng) Sora 生成的視頻：視覺(jué)上很吸引人，但存諸多不合理之處

2024/2/19 11:27:21 來(lái)源：IT之家作者：遠(yuǎn)洋 責(zé)編：遠(yuǎn)洋

評(píng)論：

IT之家 2 月 19 日消息，近日，谷歌的人工智能模型 Gemini 1.5 對(duì) OpenAI Sora 生成的一段視頻進(jìn)行了評(píng)價(jià)，稱(chēng)其在視覺(jué)上很吸引人，但一些不合理之處可以看出其不是真實(shí)的視頻。

IT之家此前報(bào)道，雙方分別發(fā)布了各自的最新技術(shù)：谷歌推出 Gemini 1.5 Pro，OpenAI 則推出了文本轉(zhuǎn)視頻工具 Sora。Sora 的發(fā)布時(shí)機(jī)引發(fā)猜測(cè)，有人認(rèn)為 OpenAI 是為了轉(zhuǎn)移公眾對(duì)谷歌 Gemini 1.5 的注意力。

谷歌一位高管在 X 平臺(tái)上分享了對(duì) Sora 生成視頻的詳細(xì)分析，Gemini 1.5 Pro 以 Sora 生成的日本一條既有雪景又有櫻花盛開(kāi)的街道視頻為例，指出視頻存在明顯不合理之處。

谷歌 Gemini 1.5 Pro 銳評(píng) Sora 生成的視頻：視覺(jué)上很吸引人，但存諸多不合理之處

根據(jù) Gemini 1.5 Pro 的分析，大雪紛飛和盛開(kāi)的櫻花同時(shí)出現(xiàn)并不符合常理，因?yàn)闄鸦ㄍǔＴ诖杭鹃_(kāi)放，不會(huì)伴有降雪。而且雪的下落方式非常均勻，這不是現(xiàn)實(shí)生活中通常的降雪方式。此外，視頻中的人物雖然身處大雪環(huán)境，卻并未穿著任何冬裝，這也顯得非常違和。

Gemini 1.5 在分析中總結(jié)道：“總而言之，這段視頻雖然視覺(jué)上很吸引人，但其中的矛盾之處表明它并非現(xiàn)實(shí)生活中的場(chǎng)景。”

Sora 是一款能夠生成長(zhǎng)達(dá) 60 秒視頻的文本轉(zhuǎn)視頻工具，可以創(chuàng)建包含細(xì)節(jié)豐富的場(chǎng)景、復(fù)雜攝像機(jī)運(yùn)動(dòng)以及具有豐富情感的多個(gè)人物畫(huà)面，許多人將其稱(chēng)為視頻生成領(lǐng)域的 “ChatGPT 時(shí)刻”。

而谷歌的 Gemini 1.5 則擁有驚人的 100 萬(wàn)詞條上下文窗口，遠(yuǎn)超 GPT-4 Turbo 的 12.8 萬(wàn)和 Anthropic Claude 2.1 的 20 萬(wàn)。這意味著它可以一次處理大量信息，包括 1 小時(shí)的視頻、11 小時(shí)的音頻以及超過(guò) 30,000 行代碼或 70 萬(wàn)字的代碼庫(kù)。

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

谷歌 Gemini 1.5 Pro 銳評(píng) Sora 生成的視頻：視覺(jué)上很吸引人，但存諸多不合理之處

相關(guān)文章

谷歌 Gemini 1.5 Pro 銳評(píng) Sora 生成的視頻：視覺(jué)上很吸引人，但存諸多不合理之處