ChatGPT 之后性能怪獸來(lái)了？馬庫(kù)斯 7 大「黑暗」預(yù)測(cè)：GPT-4 帶不來(lái) AGI

新智元 2022/12/27 18:52:09 責(zé)編：遠(yuǎn)生

評(píng)論：

ChatGPT 的爆火，點(diǎn)燃了人們對(duì)通用人工智能的熱情。在全世界對(duì) GPT-4 翹首以盼時(shí)，馬庫(kù)斯卻做出 7 大預(yù)測(cè)，給大家潑了盆冷水。性能提升卻不能理解世界，大型語(yǔ)言模型會(huì)是 AGI 的未來(lái)嗎？

2022 年接近尾聲之際，OpenAI 發(fā)布了名為 ChatGPT 的聊天機(jī)器人，迅速走紅網(wǎng)絡(luò)。

發(fā)布后不到兩周，已有超過(guò)一百萬(wàn)人注冊(cè)在線試用。用戶只要輸入文本，就能立即得到一段段的不可思議的文章、故事和詩(shī)歌。

它的文筆很好，以至于有些人用它在 Tinder 上寫(xiě)約會(huì)的開(kāi)場(chǎng)白（「你介意我坐這里嗎？你做臀沖的樣子讓我的腿有點(diǎn)發(fā)軟?！梗?/p>

不僅如此，令世界各地的教育工作者相當(dāng)震驚的是，學(xué)生們開(kāi)始使用 ChatGPT 來(lái)撰寫(xiě)學(xué)期論文。還有一些人正在使用它來(lái)嘗試重塑搜索引擎。一時(shí)之間，全世界都在討論 ChatGPT 的神奇。

ChatGPT 之后性能怪獸來(lái)了？馬庫(kù)斯 7 大「黑暗」預(yù)測(cè)：GPT-4 帶不來(lái) AGI

盡管如此，馬庫(kù)斯表示，我們不能對(duì)聊天機(jī)器人濾鏡太厚。

雖然 ChatGPT 看起來(lái)無(wú)所不知，但它也很容易出錯(cuò)。在接受采訪時(shí)，馬庫(kù)斯表示，ChatGPT 和之前一樣，相關(guān)系統(tǒng)「仍然不可靠，仍然不了解現(xiàn)實(shí)世界，仍然不了解心理世界并且仍然充滿錯(cuò)誤。」

也就是說(shuō)，ChatGPT 時(shí)常胡編亂造；它所說(shuō)的相當(dāng)一部分根本不是真的。

例如，在用戶的誘導(dǎo)下，ChatGPT 可以說(shuō)出油條非常適合手術(shù)，因?yàn)椤杆鼈凅w積小巧，可以在手術(shù)過(guò)程中實(shí)現(xiàn)更高的精確度和控制，降低并發(fā)癥的風(fēng)險(xiǎn)并改善手術(shù)的整體結(jié)果」。

ChatGPT 之后性能怪獸來(lái)了？馬庫(kù)斯 7 大「黑暗」預(yù)測(cè)：GPT-4 帶不來(lái) AGI

聊天機(jī)器人一本正經(jīng)地說(shuō)胡話，以至于著名的網(wǎng)站 Stack Overflow 已經(jīng)暫時(shí)禁止計(jì)算機(jī)生成的回答。

而錯(cuò)誤是無(wú)窮無(wú)盡的。雖然 ChatGPT 經(jīng)常根據(jù)用戶反饋進(jìn)行調(diào)整，但在產(chǎn)品發(fā)布幾周后，仍有很多網(wǎng)友對(duì)它的回答感到無(wú)語(yǔ)：

ChatGPT 之后性能怪獸來(lái)了？馬庫(kù)斯 7 大「黑暗」預(yù)測(cè)：GPT-4 帶不來(lái) AGI

類似的錯(cuò)誤頻頻發(fā)生，連 OpenAI 的首席執(zhí)行官 Sam Altman 也不得不承認(rèn)現(xiàn)實(shí)：

ChatGPT 之后性能怪獸來(lái)了？馬庫(kù)斯 7 大「黑暗」預(yù)測(cè)：GPT-4 帶不來(lái) AGI

ChatGPT 仍有諸多局限，但足以創(chuàng)造出偉大的假象。
現(xiàn)在靠 ChatGPT 去完成重要任務(wù)還為時(shí)尚早。關(guān)于提高魯棒性和真實(shí)性，我們要做的還有很多。

簡(jiǎn)而言之，ChatGPT 雖然聽(tīng)起來(lái)像是星際迷航中的計(jì)算機(jī)一樣科幻，但目前，人們還不能完全信任它。

當(dāng)然，ChatGPT 是 2022 年 AI 愛(ài)好者的禮物。那么 2023 年呢？

2023 年，硅谷乃至整個(gè)世界翹首以盼的，是 GPT-4。

GPT-4：AI 界的「天降紫微星」

實(shí)際嘗試過(guò) GPT-4 的人都對(duì)該產(chǎn)品印象深刻。根據(jù)一些傳言，GPT-4 將于 2023 年春天發(fā)布。屆時(shí)，它將使 ChatGPT 黯然失色；可以肯定的是，會(huì)有更多人談?wù)撍?/p>

在許多方面，人們對(duì) GPT-4 的期望值非常高：

ChatGPT 之后性能怪獸來(lái)了？馬庫(kù)斯 7 大「黑暗」預(yù)測(cè)：GPT-4 帶不來(lái) AGI

風(fēng)投公司 DVC 創(chuàng)始人 Nick Davidov 表示：GPT-4 的出現(xiàn)，會(huì)帶來(lái)「和新冠疫情類似的經(jīng)濟(jì)沖擊」。GPT-4 的快速傳播和使用，可以「迅速提高數(shù)億知識(shí)工作者的生產(chǎn)力」。

從技術(shù)上講，GPT-4 內(nèi)部將會(huì)有更多的參數(shù)，更多的處理器和內(nèi)存，并接受更多數(shù)據(jù)的訓(xùn)練。

GPT-1 接受了 4.6GB 數(shù)據(jù)的訓(xùn)練，而到了 GPT-3，數(shù)據(jù)量直接飆升至 750GB。由此可見(jiàn)，GPT-4 的訓(xùn)練量會(huì)更加驚人，甚至?xí)?duì)整個(gè)互聯(lián)網(wǎng)的大部分進(jìn)行學(xué)習(xí)。

OpenAI 深知，更大的訓(xùn)練量意味著更好的輸出。經(jīng)過(guò)每次迭代，GPT 的表現(xiàn)變得越來(lái)越像人類。對(duì)于 GPT-4，可能會(huì)進(jìn)化成為一個(gè)性能怪物。

但它會(huì)解決之前遇到的問(wèn)題嗎？馬庫(kù)斯對(duì)此仍然打了個(gè)問(wèn)號(hào)。

盡管 GPT-4 看起來(lái)肯定會(huì)比它的前任更聰明，但其內(nèi)部架構(gòu)仍然存在問(wèn)題。

ChatGPT 之后性能怪獸來(lái)了？馬庫(kù)斯 7 大「黑暗」預(yù)測(cè)：GPT-4 帶不來(lái) AGI

馬庫(kù)斯稱，他懷疑人們?cè)?GPT-4 時(shí)，會(huì)有一種似曾相識(shí)的感覺(jué)：先是火遍全網(wǎng)，然后過(guò)了幾天，人們發(fā)現(xiàn)許多問(wèn)題仍然存在。

根據(jù)當(dāng)前信息，GPT-4 在架構(gòu)上與 GPT-3 基本相同。如果是這樣，可以預(yù)料到，一些基本問(wèn)題仍然無(wú)法解決：聊天機(jī)器人依然缺乏了解世界運(yùn)作方式的內(nèi)部模型。

因此，GPT-4 無(wú)法在抽象層面上理解事物。它可能更擅長(zhǎng)幫學(xué)生寫(xiě)論文，但它仍然不會(huì)真正了解世界，答案的字里行間仍會(huì)透露機(jī)器的特征。

關(guān)于 GPT-4 的七大預(yù)測(cè)

因此，盡管 AI 界對(duì) GPT-4 的到來(lái)滿心歡喜，馬庫(kù)斯卻給出了 7 個(gè)不太積極的預(yù)測(cè)。

1. GPT-4 仍然會(huì)像它的前輩一樣，犯下各種愚蠢的錯(cuò)誤。它有時(shí)可能會(huì)很好地完成給定的任務(wù)，有時(shí)卻罷工不干，但你并不能提前預(yù)料到即將出現(xiàn)的是哪種情況。

2. GPT-4 對(duì)物理、心理和數(shù)學(xué)方面的推理依然靠不住。它或許能夠解決部分之前未能挑戰(zhàn)成功的項(xiàng)目，但在面對(duì)更長(zhǎng)和更復(fù)雜的場(chǎng)景時(shí)依然束手無(wú)策。

比如，當(dāng)被問(wèn)及醫(yī)學(xué)問(wèn)題時(shí)，它要么拒絕回答，要么偶爾會(huì)說(shuō)出聽(tīng)起來(lái)很有道理但很危險(xiǎn)的廢話。盡管它已經(jīng)吞噬了互聯(lián)網(wǎng)上的大量?jī)?nèi)容，但它并不能足夠可信和完整地提供可靠的醫(yī)療建議。

3. 流暢幻象（fluent hallucinations）仍將十分常見(jiàn)，而且很容易被誘發(fā)。也就是說(shuō)，大型語(yǔ)言模型依然是一個(gè)能被輕易用于制作聽(tīng)起來(lái)很有道理但卻完全錯(cuò)誤的信息的工具。

4. GPT-4 的自然語(yǔ)言輸出仍然無(wú)法以可靠的方式為下游程序提供服務(wù)。利用它構(gòu)建虛擬助手的開(kāi)發(fā)者會(huì)發(fā)現(xiàn)，自己無(wú)法可靠地將用戶語(yǔ)言映射到用戶的意圖上。

5. GPT-4 本身不會(huì)是一個(gè)能解決任意任務(wù)的通用人工智能。如果沒(méi)有外部的輔助，它既不能在 Diplomacy 中擊敗 Meta 的 Cicero；也不能可靠地駕駛汽車；更不能驅(qū)動(dòng)《變形金剛》里的「擎天柱」，或者像《杰森一家》里的「Rosie」那樣多才多藝。

6. 人類「想要什么」與機(jī)器「去做什么」之間的「對(duì)接」，依然是一個(gè)關(guān)鍵且尚未解決的問(wèn)題。GPT-4 仍將無(wú)法控制自己的輸出，一些建議是令人驚訝的糟糕，掩蓋偏見(jiàn)的例子也會(huì)在幾天或幾個(gè)月內(nèi)被發(fā)現(xiàn)。

7. 當(dāng) AGI（通用人工智能）實(shí)現(xiàn)時(shí)，像 GPT-4 這樣的大型語(yǔ)言模型，或許會(huì)成為最終解決方案的一部分，但也僅限于其中的一部分。單純的「擴(kuò)展」，也就是建立更大的模型直到它吸收了整個(gè)互聯(lián)網(wǎng)，在一定程度上會(huì)被證明是有用的。但值得信賴的、與人類價(jià)值觀相一致的通用人工智能，一定會(huì)來(lái)自于結(jié)構(gòu)化程度更高的系統(tǒng)。它將具有更多的內(nèi)置知識(shí)，并包含明確的推理和計(jì)劃工具。而這些，都是現(xiàn)在的 GPT 系統(tǒng)所缺乏的。

馬庫(kù)斯認(rèn)為，在十年內(nèi)，也許更少，人工智能的重點(diǎn)將從對(duì)大型語(yǔ)言模型的擴(kuò)展，轉(zhuǎn)向與更廣泛的技術(shù)相結(jié)合。

酷炫的東西總是好玩的，但這并不意味著它能帶領(lǐng)我們走向可信的通用人工智能。

對(duì)此，馬庫(kù)斯預(yù)測(cè)，我們?cè)诮窈笮枰氖且粋€(gè)可以將顯性知識(shí)和世界模型作為核心的全新架構(gòu)。

參考資料：

https://garymarcus.substack.com/p/what-to-expect-when-youre-expecting

本文來(lái)自微信公眾號(hào)：新智元（ID：AI_era），編輯：昕朋、好困

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

ChatGPT 之后性能怪獸來(lái)了？馬庫(kù)斯 7 大「黑暗」預(yù)測(cè)：GPT-4 帶不來(lái) AGI

GPT-4：AI 界的「天降紫微星」

關(guān)于 GPT-4 的七大預(yù)測(cè)

相關(guān)文章

ChatGPT 之后性能怪獸來(lái)了？馬庫(kù)斯 7 大「黑暗」預(yù)測(cè)：GPT-4 帶不來(lái) AGI