設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

Sora 無(wú)法替代人類(lèi),亞馬遜工程師斷言:實(shí)際工作沖突不可能靠 AI 解決

新智元 2024/2/27 12:45:24 責(zé)編:遠(yuǎn)洋

  新智元報(bào)道  

編輯:Aeneas

【新智元導(dǎo)讀】Sora 一出,讓很多人心生恐懼:飯碗徹底被砸了!這位亞馬遜工程師卻告訴我們:真的不必?fù)?dān)心生成式 AI 會(huì)搶人類(lèi)的飯碗,頂多擔(dān)心一下你的人類(lèi)同行吧。

這一周,OpenAI 視頻 AI 工具 Sora 一出現(xiàn),可謂是炸翻了天?!革埻氡2蛔×恕沟目謶?,真實(shí)地?fù)糁辛嗽S多人。

不過(guò),亞馬遜的一位工程師 Cameron Gould 則認(rèn)為,其實(shí)并不必對(duì) AI 如此懼怕,它并不會(huì)導(dǎo)致我們失去工作。

為什么?原因如下。

Prompt 的自相矛盾

首先,生成式 AI 應(yīng)用在創(chuàng)意內(nèi)容時(shí),生成的一般是圖像、視頻以及一般的非虛構(gòu)內(nèi)容。

給一個(gè)生成式 AI 模型 prompt,就像照看一個(gè)惡毒的孩子,他的唯一目標(biāo),就是通過(guò)「從字面上理解你所說(shuō)的一切」來(lái)惹惱你。

你必須用詞準(zhǔn)確,不能在不重要的細(xì)節(jié)上浪費(fèi)一個(gè)字符,因?yàn)檫@可能就會(huì)使結(jié)果向完全不同的方向傾斜。但是同時(shí),你又需要提供盡可能多的詳細(xì)信息,讓模型不會(huì)誤解你。這種自相矛盾的操作,簡(jiǎn)直太糟糕了!

跟計(jì)算機(jī)進(jìn)行單向?qū)υ?,試圖理解它為什么沒(méi)能產(chǎn)生自己想要的結(jié)果,能讓人產(chǎn)生一種連續(xù) 3 小時(shí)撞墻的沖動(dòng)……

Gould 表示,在自己作為軟件工程師的職業(yè)生涯中,其實(shí)已經(jīng)習(xí)慣了和計(jì)算機(jī)的這種單向?qū)υ挘墒?AI 給他的體驗(yàn),絕對(duì)更糟。

它不是一種可預(yù)測(cè)的編程語(yǔ)言,擁有冪等的函數(shù)。

它完全是一個(gè)黑匣子,幾乎每次都可以在相同的輸入下,產(chǎn)生完全不同的結(jié)果。即使在 prompt 里要求 AI 要保持一致性,它也未必會(huì)聽(tīng)你的。

市值數(shù)十億的公司,就曾受到這一現(xiàn)實(shí)的困擾。最近,加拿大一家法庭裁定,加拿大航空公司必須向其中一名乘客支付賠償金,因?yàn)榱奶鞕C(jī)器人提供了誤導(dǎo)性建議,導(dǎo)致該乘客為機(jī)票支付了近一倍的費(fèi)用。

速度確實(shí)快,但……

當(dāng)然,盡管在一致性方面存在缺陷,但生成式 AI 可以幫我們快速產(chǎn)出東西來(lái)。

比如上面這張圖,就是用生成式 AI 創(chuàng)建的,只花了幾秒鐘就做出來(lái)了。所以,AI 可以讓我們比藝術(shù)家出圖的速度更快,這件事是有可能的。

而 Sora 也讓普羅大眾就可以用比以往快許多倍的方式,生成更復(fù)雜的媒體素材。所以,由于現(xiàn)在一個(gè)人可以做幾個(gè)人的工作,我們真的不需要那么多的藝術(shù)家、軟件工程師、撰稿人了嗎?

不,它的細(xì)節(jié)不對(duì)

答案并沒(méi)有那么簡(jiǎn)單。使用生成式 AI 創(chuàng)作藝術(shù)時(shí),可能你時(shí)常會(huì)想:「不,這不是我想要的。」這也是在論壇上常常出現(xiàn)的觀點(diǎn)。

有人會(huì)反駁說(shuō):這是因?yàn)槟愕?prompt 缺乏細(xì)節(jié),你需要給出更具體的 prompt。這個(gè)觀點(diǎn)確實(shí)有道理。

我們自己的圖片和票房收入超過(guò) 1 億美元的專(zhuān)業(yè)電影,有何不同?我們自己的個(gè)人博客,和專(zhuān)業(yè)的全職作家的博客,有何不同?我們自己做的游戲視頻標(biāo)題,和 30 小時(shí)的 AAA 視頻游戲標(biāo)題,有何不同?

答案就是細(xì)節(jié)。

AI 生圖

正是細(xì)節(jié),將業(yè)余愛(ài)好者和專(zhuān)業(yè)人士區(qū)分開(kāi)。

如果想使用生成式 AI 來(lái)創(chuàng)作與專(zhuān)業(yè)內(nèi)容一樣令人印象深刻的作品,我們將需要一個(gè)包含大量細(xì)節(jié)的提示。此外,還需要大量的試驗(yàn)和錯(cuò)誤,才能讓模型產(chǎn)生我們想要的東西。

生成式 AI 只是一種工具,類(lèi)似于自動(dòng)完成、編譯器、拼寫(xiě)檢查器或任何其他輔助工具。它不會(huì)為你做任何工作,除非是它自己的苦差事。

AI 生圖

讓我們回到 Sora 的例子。

它只能生成無(wú)聲的視頻。其中沒(méi)有音頻,沒(méi)有對(duì)話,沒(méi)有一個(gè)對(duì)象可以說(shuō)話,或者發(fā)出聲音。

但如果我們想用它拍電影,就需要用它 ——

生成腳本?

閱讀劇本?

生成視頻以配合腳本?

究竟是現(xiàn)代電影的哪些方面,讓電影變得有趣呢?突然間,我們就需要集成一堆不同的生成式 AI 工具,才能完成工作。

當(dāng)然,OpenAI 有一個(gè)名為 Jukebox 的音樂(lè)生成工具,它可以在視頻中添加音樂(lè),但卻無(wú)法添加對(duì)話。

在一段視頻中,該如何添加對(duì)話呢?這項(xiàng)任務(wù)聽(tīng)起來(lái)太艱巨了。我們不僅需要生成一個(gè)特定場(chǎng)景的視頻,還需要讓場(chǎng)景中角色的嘴部動(dòng)作和臺(tái)詞保持一致。此外,視頻生成器還需要知道單詞是怎樣說(shuō)出的。不僅僅是語(yǔ)氣,還有節(jié)奏。

想象一下,要解決全部這些細(xì)節(jié),需要多大的人力才能解決?

細(xì)節(jié),變得相當(dāng)困難。在每一個(gè)步驟的每一個(gè)級(jí)別上,都有大量會(huì)影響實(shí)質(zhì)性后果的細(xì)節(jié)。

Gould 表示,自己最近讀到一篇非常喜歡的博文《現(xiàn)實(shí)擁有驚人的細(xì)節(jié)量》。

現(xiàn)實(shí)的細(xì)節(jié)是無(wú)限的,然而 AI 模型的 token 卻是有限的。

它只能帶你走這么遠(yuǎn),之后,我們就需要依靠其他人來(lái)完成工作。

目前為止,人類(lèi)仍然做著最繁重的工作。

殖民宇宙的一些重要細(xì)節(jié)

更少的細(xì)節(jié),更多的變化

專(zhuān)注于細(xì)節(jié),聽(tīng)起來(lái)實(shí)在是太累了。如果讓你保持簡(jiǎn)單,會(huì)發(fā)生什么呢?如果你只需要提供很短的描述,只用幾分鐘就可以寫(xiě)出來(lái)?

最終,你會(huì)得到多樣化的結(jié)果,大部分與你的想法完全不一致。你需要在成百甚至上千個(gè)結(jié)果中,才能找到你想要的那一個(gè),因?yàn)?prompt 太通用了。你可能永遠(yuǎn)都找不到一個(gè)能用的結(jié)果。

如果 prompt 太簡(jiǎn)單,模型天馬行空的想象力,會(huì)提供無(wú)限的排列供你選擇。比如輸入這個(gè) prompt——「一個(gè)男人」,你會(huì)得到各式各樣的男人。

但實(shí)際上,我想要的是一個(gè)藍(lán)頭發(fā)、棕色眼睛、留著小胡子、穿著一件黑色夾克、戴著兜帽的男人。

如果只輸入「一個(gè)男人」作為提示,需要多長(zhǎng)的時(shí)間才能找到確切的輸出呢?

深度和廣度之間有一個(gè)平衡點(diǎn),你可以最大限度地減少你的努力。這就需要對(duì)細(xì)節(jié)進(jìn)行大量批判性思考,并進(jìn)行大量搜索。

AI 不會(huì)取代我們

所以,為什么說(shuō) AI 不會(huì)取代我們?因?yàn)?,企業(yè)并不是為了解決生成圖像、視頻剪輯這類(lèi)小問(wèn)題而存在的。企業(yè)是為利益相關(guān)者解決更大型、更復(fù)雜的問(wèn)題。

解決這些問(wèn)題最困難的部分,就是后勤工作。解決大型、復(fù)雜的問(wèn)題需要一大群?jiǎn)栴}解決者的時(shí)間和精力,而所有這些問(wèn)題解決者又需要由其他問(wèn)題解決者組織起來(lái),以保持事情的進(jìn)展。

如果隨機(jī)抓來(lái)兩個(gè)人,讓他們自我管理、自我組織工作,很可能他們的標(biāo)準(zhǔn)和時(shí)間表會(huì)不一致。如果你要讓他們一起工作,你就得設(shè)立標(biāo)準(zhǔn),讓他們?cè)谕瑯拥臅r(shí)間工作,并且產(chǎn)生相同質(zhì)量的結(jié)果。

凝聚力是一種力量,你需要做一些工作,讓獨(dú)立的單位保持一致。一個(gè)團(tuán)隊(duì)單獨(dú)運(yùn)行,可以順利完成任務(wù);但是當(dāng)我們把多個(gè)團(tuán)隊(duì)引入單個(gè)環(huán)境中時(shí),就會(huì)出現(xiàn)很多沖突。

多個(gè)相互依賴的團(tuán)隊(duì)朝著一個(gè)目標(biāo)努力時(shí),需要一定的凝聚力,才能完成有意義的事。

這項(xiàng)「凝聚力」工作其實(shí)很復(fù)雜,經(jīng)常需要解決人際沖突,而這些沖突通常是不合邏輯的、情緒化的。

顯然,AI 無(wú)法解決這種類(lèi)型的沖突。

總結(jié)來(lái)說(shuō)就是 ——

  • 企業(yè)通過(guò)為很多人 / 企業(yè)解決大問(wèn)題來(lái)賺錢(qián)

  • 大問(wèn)題很難解決,因?yàn)樯婕昂芏鄨F(tuán)隊(duì)

  • 我們需要精心策劃如何統(tǒng)籌這些團(tuán)隊(duì),來(lái)解決人際沖突,并保持凝聚力

  • 在解決人際沖突方面,人是最可靠的資源

很顯然,機(jī)器人根本無(wú)法勝任這些工作,它們的表現(xiàn)會(huì)很糟糕。

AI 不會(huì)搶走你的工作

當(dāng)我們仔細(xì)看一下目前生成式 AI 的現(xiàn)狀,這個(gè)事實(shí)是顯而易見(jiàn)的 —— 目前沒(méi)有任何方法,可以讓工作自動(dòng)化。

提示界面和模型缺乏自主性和批判性思維,導(dǎo)致了關(guān)鍵的局限性。沒(méi)錯(cuò),生成式 AI 的確可以讓我們提高工作效率,但也就僅此而已。

這句話已經(jīng)被越來(lái)越多人所贊同:AI 不會(huì)搶走你的工作。真正會(huì)對(duì)你造成威脅的,是會(huì)比你更熟練地使用 AI 工具的人。

生成式 AI 是幫助你加快速度的絕佳資源,但它不會(huì)完全自動(dòng)化你的工作。你要做的,就是把它們添加到你的工具箱,熟練地掌握它們。

參考資料:

  • https://www.camggould.com/posts/The-AI-Endgame/

本文來(lái)自微信公眾號(hào):新智元 (ID:AI_era)

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:SoraOpenAI,人工智能

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知