ChatGPT 之后性能怪獸來(lái)了?馬庫(kù)斯 7 大「黑暗」預(yù)測(cè):GPT-4 帶不來(lái) AGI

新智元 2022/12/27 18:52:09 責(zé)編:遠(yuǎn)生

ChatGPT 的爆火,點(diǎn)燃了人們對(duì)通用人工智能的熱情。在全世界對(duì) GPT-4 翹首以盼時(shí),馬庫(kù)斯卻做出 7 大預(yù)測(cè),給大家潑了盆冷水。性能提升卻不能理解世界,大型語(yǔ)言模型會(huì)是 AGI 的未來(lái)嗎?

2022 年接近尾聲之際,OpenAI 發(fā)布了名為 ChatGPT 的聊天機(jī)器人,迅速走紅網(wǎng)絡(luò)。

發(fā)布后不到兩周,已有超過(guò)一百萬(wàn)人注冊(cè)在線試用。用戶(hù)只要輸入文本,就能立即得到一段段的不可思議的文章、故事和詩(shī)歌。

它的文筆很好,以至于有些人用它在 Tinder 上寫(xiě)約會(huì)的開(kāi)場(chǎng)白(「你介意我坐這里嗎?你做臀沖的樣子讓我的腿有點(diǎn)發(fā)軟。」)

不僅如此,令世界各地的教育工作者相當(dāng)震驚的是,學(xué)生們開(kāi)始使用 ChatGPT 來(lái)撰寫(xiě)學(xué)期論文。還有一些人正在使用它來(lái)嘗試重塑搜索引擎。一時(shí)之間,全世界都在討論 ChatGPT 的神奇。

盡管如此,馬庫(kù)斯表示,我們不能對(duì)聊天機(jī)器人濾鏡太厚。

雖然 ChatGPT 看起來(lái)無(wú)所不知,但它也很容易出錯(cuò)。在接受采訪時(shí),馬庫(kù)斯表示,ChatGPT 和之前一樣,相關(guān)系統(tǒng)「仍然不可靠,仍然不了解現(xiàn)實(shí)世界,仍然不了解心理世界并且仍然充滿(mǎn)錯(cuò)誤?!?/p>

也就是說(shuō),ChatGPT 時(shí)常胡編亂造;它所說(shuō)的相當(dāng)一部分根本不是真的。

例如,在用戶(hù)的誘導(dǎo)下,ChatGPT 可以說(shuō)出油條非常適合手術(shù),因?yàn)椤杆鼈凅w積小巧,可以在手術(shù)過(guò)程中實(shí)現(xiàn)更高的精確度和控制,降低并發(fā)癥的風(fēng)險(xiǎn)并改善手術(shù)的整體結(jié)果」 。

聊天機(jī)器人一本正經(jīng)地說(shuō)胡話,以至于著名的網(wǎng)站 Stack Overflow 已經(jīng)暫時(shí)禁止計(jì)算機(jī)生成的回答。

而錯(cuò)誤是無(wú)窮無(wú)盡的。雖然 ChatGPT 經(jīng)常根據(jù)用戶(hù)反饋進(jìn)行調(diào)整,但在產(chǎn)品發(fā)布幾周后,仍有很多網(wǎng)友對(duì)它的回答感到無(wú)語(yǔ):

類(lèi)似的錯(cuò)誤頻頻發(fā)生,連 OpenAI 的首席執(zhí)行官 Sam Altman 也不得不承認(rèn)現(xiàn)實(shí):

ChatGPT 仍有諸多局限,但足以創(chuàng)造出偉大的假象。

現(xiàn)在靠 ChatGPT 去完成重要任務(wù)還為時(shí)尚早。關(guān)于提高魯棒性和真實(shí)性,我們要做的還有很多。

簡(jiǎn)而言之,ChatGPT 雖然聽(tīng)起來(lái)像是星際迷航中的計(jì)算機(jī)一樣科幻,但目前,人們還不能完全信任它。

當(dāng)然,ChatGPT 是 2022 年 AI 愛(ài)好者的禮物。那么 2023 年呢?

2023 年,硅谷乃至整個(gè)世界翹首以盼的,是 GPT-4。

GPT-4:AI 界的「天降紫微星」

實(shí)際嘗試過(guò) GPT-4 的人都對(duì)該產(chǎn)品印象深刻。根據(jù)一些傳言,GPT-4 將于 2023 年春天發(fā)布。屆時(shí),它將使 ChatGPT 黯然失色;可以肯定的是,會(huì)有更多人談?wù)撍?/p>

在許多方面,人們對(duì) GPT-4 的期望值非常高:

風(fēng)投公司 DVC 創(chuàng)始人 Nick Davidov 表示:GPT-4 的出現(xiàn),會(huì)帶來(lái)「和新冠疫情類(lèi)似的經(jīng)濟(jì)沖擊」。GPT-4 的快速傳播和使用,可以「迅速提高數(shù)億知識(shí)工作者的生產(chǎn)力」。

從技術(shù)上講,GPT-4 內(nèi)部將會(huì)有更多的參數(shù),更多的處理器和內(nèi)存,并接受更多數(shù)據(jù)的訓(xùn)練。

GPT-1 接受了 4.6GB 數(shù)據(jù)的訓(xùn)練,而到了 GPT-3,數(shù)據(jù)量直接飆升至 750GB。由此可見(jiàn),GPT-4 的訓(xùn)練量會(huì)更加驚人,甚至?xí)?duì)整個(gè)互聯(lián)網(wǎng)的大部分進(jìn)行學(xué)習(xí)。

OpenAI 深知,更大的訓(xùn)練量意味著更好的輸出。經(jīng)過(guò)每次迭代,GPT 的表現(xiàn)變得越來(lái)越像人類(lèi)。對(duì)于 GPT-4,可能會(huì)進(jìn)化成為一個(gè)性能怪物。

但它會(huì)解決之前遇到的問(wèn)題嗎?馬庫(kù)斯對(duì)此仍然打了個(gè)問(wèn)號(hào)。

盡管 GPT-4 看起來(lái)肯定會(huì)比它的前任更聰明,但其內(nèi)部架構(gòu)仍然存在問(wèn)題。

馬庫(kù)斯稱(chēng),他懷疑人們?cè)?GPT-4 時(shí),會(huì)有一種似曾相識(shí)的感覺(jué):先是火遍全網(wǎng),然后過(guò)了幾天,人們發(fā)現(xiàn)許多問(wèn)題仍然存在。

根據(jù)當(dāng)前信息,GPT-4 在架構(gòu)上與 GPT-3 基本相同。如果是這樣,可以預(yù)料到,一些基本問(wèn)題仍然無(wú)法解決:聊天機(jī)器人依然缺乏了解世界運(yùn)作方式的內(nèi)部模型。

因此,GPT-4 無(wú)法在抽象層面上理解事物。它可能更擅長(zhǎng)幫學(xué)生寫(xiě)論文,但它仍然不會(huì)真正了解世界,答案的字里行間仍會(huì)透露機(jī)器的特征。

關(guān)于 GPT-4 的七大預(yù)測(cè)

因此,盡管 AI 界對(duì) GPT-4 的到來(lái)滿(mǎn)心歡喜,馬庫(kù)斯卻給出了 7 個(gè)不太積極的預(yù)測(cè)。

1. GPT-4 仍然會(huì)像它的前輩一樣,犯下各種愚蠢的錯(cuò)誤。它有時(shí)可能會(huì)很好地完成給定的任務(wù),有時(shí)卻罷工不干,但你并不能提前預(yù)料到即將出現(xiàn)的是哪種情況。

2. GPT-4 對(duì)物理、心理和數(shù)學(xué)方面的推理依然靠不住。它或許能夠解決部分之前未能挑戰(zhàn)成功的項(xiàng)目,但在面對(duì)更長(zhǎng)和更復(fù)雜的場(chǎng)景時(shí)依然束手無(wú)策。

比如,當(dāng)被問(wèn)及醫(yī)學(xué)問(wèn)題時(shí),它要么拒絕回答,要么偶爾會(huì)說(shuō)出聽(tīng)起來(lái)很有道理但很危險(xiǎn)的廢話。盡管它已經(jīng)吞噬了互聯(lián)網(wǎng)上的大量?jī)?nèi)容,但它并不能足夠可信和完整地提供可靠的醫(yī)療建議。

3. 流暢幻象(fluent hallucinations)仍將十分常見(jiàn),而且很容易被誘發(fā)。也就是說(shuō),大型語(yǔ)言模型依然是一個(gè)能被輕易用于制作聽(tīng)起來(lái)很有道理但卻完全錯(cuò)誤的信息的工具。

4. GPT-4 的自然語(yǔ)言輸出仍然無(wú)法以可靠的方式為下游程序提供服務(wù)。利用它構(gòu)建虛擬助手的開(kāi)發(fā)者會(huì)發(fā)現(xiàn),自己無(wú)法可靠地將用戶(hù)語(yǔ)言映射到用戶(hù)的意圖上。

5. GPT-4 本身不會(huì)是一個(gè)能解決任意任務(wù)的通用人工智能。如果沒(méi)有外部的輔助,它既不能在 Diplomacy 中擊敗 Meta 的 Cicero;也不能可靠地駕駛汽車(chē);更不能驅(qū)動(dòng)《變形金剛》里的「擎天柱」,或者像《杰森一家》里的「Rosie」那樣多才多藝。

6. 人類(lèi)「想要什么」與機(jī)器「去做什么」之間的「對(duì)接」,依然是一個(gè)關(guān)鍵且尚未解決的問(wèn)題。GPT-4 仍將無(wú)法控制自己的輸出,一些建議是令人驚訝的糟糕,掩蓋偏見(jiàn)的例子也會(huì)在幾天或幾個(gè)月內(nèi)被發(fā)現(xiàn)。

7. 當(dāng) AGI(通用人工智能)實(shí)現(xiàn)時(shí),像 GPT-4 這樣的大型語(yǔ)言模型,或許會(huì)成為最終解決方案的一部分,但也僅限于其中的一部分。單純的「擴(kuò)展」,也就是建立更大的模型直到它吸收了整個(gè)互聯(lián)網(wǎng),在一定程度上會(huì)被證明是有用的。但值得信賴(lài)的、與人類(lèi)價(jià)值觀相一致的通用人工智能,一定會(huì)來(lái)自于結(jié)構(gòu)化程度更高的系統(tǒng)。它將具有更多的內(nèi)置知識(shí),并包含明確的推理和計(jì)劃工具。而這些,都是現(xiàn)在的 GPT 系統(tǒng)所缺乏的。

馬庫(kù)斯認(rèn)為,在十年內(nèi),也許更少,人工智能的重點(diǎn)將從對(duì)大型語(yǔ)言模型的擴(kuò)展,轉(zhuǎn)向與更廣泛的技術(shù)相結(jié)合。

酷炫的東西總是好玩的,但這并不意味著它能帶領(lǐng)我們走向可信的通用人工智能。

對(duì)此,馬庫(kù)斯預(yù)測(cè),我們?cè)诮窈笮枰氖且粋€(gè)可以將顯性知識(shí)和世界模型作為核心的全新架構(gòu)。

參考資料:

  • https://garymarcus.substack.com/p/what-to-expect-when-youre-expecting

本文來(lái)自微信公眾號(hào):新智元 (ID:AI_era),編輯:昕朋、好困

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:ChatGPT,AGI

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知