IT之家 2 月 19 日消息,近日,谷歌的人工智能模型 Gemini 1.5 對 OpenAI Sora 生成的一段視頻進行了評價,稱其在視覺上很吸引人,但一些不合理之處可以看出其不是真實的視頻。
IT之家此前報道,雙方分別發(fā)布了各自的最新技術(shù):谷歌推出 Gemini 1.5 Pro,OpenAI 則推出了文本轉(zhuǎn)視頻工具 Sora。Sora 的發(fā)布時機引發(fā)猜測,有人認為 OpenAI 是為了轉(zhuǎn)移公眾對谷歌 Gemini 1.5 的注意力。
谷歌一位高管在 X 平臺上分享了對 Sora 生成視頻的詳細分析,Gemini 1.5 Pro 以 Sora 生成的日本一條既有雪景又有櫻花盛開的街道視頻為例,指出視頻存在明顯不合理之處。
根據(jù) Gemini 1.5 Pro 的分析,大雪紛飛和盛開的櫻花同時出現(xiàn)并不符合常理,因為櫻花通常在春季開放,不會伴有降雪。而且雪的下落方式非常均勻,這不是現(xiàn)實生活中通常的降雪方式。此外,視頻中的人物雖然身處大雪環(huán)境,卻并未穿著任何冬裝,這也顯得非常違和。
Gemini 1.5 在分析中總結(jié)道:“總而言之,這段視頻雖然視覺上很吸引人,但其中的矛盾之處表明它并非現(xiàn)實生活中的場景。”
Sora 是一款能夠生成長達 60 秒視頻的文本轉(zhuǎn)視頻工具,可以創(chuàng)建包含細節(jié)豐富的場景、復雜攝像機運動以及具有豐富情感的多個人物畫面,許多人將其稱為視頻生成領(lǐng)域的 “ChatGPT 時刻”。
而谷歌的 Gemini 1.5 則擁有驚人的 100 萬詞條上下文窗口,遠超 GPT-4 Turbo 的 12.8 萬和 Anthropic Claude 2.1 的 20 萬。這意味著它可以一次處理大量信息,包括 1 小時的視頻、11 小時的音頻以及超過 30,000 行代碼或 70 萬字的代碼庫。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。