設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

GPT-4 發(fā)布后的第一道挑戰(zhàn),來自弱智吧

情報姬 2023/3/26 12:27:04 責(zé)編:夢澤

文丨流年如墨 審核丨千里

排版丨鹿九

我相信,如果未來有一天我們證實了 AI 永遠(yuǎn)趕不上人類的智慧,那其中弱智吧吧友絕對功不可沒。

當(dāng)然,反過來意思也差不多:要是哪天 AI 連弱智吧的腦殘問題都能應(yīng)對如流,那大伙離失業(yè)可能也就不遠(yuǎn)了。

就在幾天前,去年年底風(fēng)靡互聯(lián)網(wǎng)的聊天 AI“ChatGPT”背后的公司 OpenAI 又推出了全新的 GPT-4。

(那時候類似這樣的弱智對話相信大家見過不少)

要知道,之前就被大家評價為“程序員殺手”、“論文大師”、“作業(yè)工具人”的 ChatGPT 所使用的只是 GPT-3.5 的內(nèi)核,而那些搭建在 QQ 群里的聊天機器人更大多只是調(diào)用了 GPT-3 的 api,就已經(jīng)可以滿足大家絕大多數(shù)的日常所需。

而在這次全面升級后,新出爐的 GPT-4 可還要牛上一個段位。

最直觀的一點,是它不僅可以接收、理解文字,連圖都能看懂。用戶只需要上傳一張圖片,就能讓 GPT-4 對圖中內(nèi)容進行點評。

從下圖中的對話來看,它顯然看到并看懂了這張圖。

當(dāng)然,你也可以故意使個壞,給它上傳一張表意隱晦的互聯(lián)網(wǎng)梗圖,賭它理會不得個中深意。

然而事實卻是 GPT-4 精準(zhǔn)描述出了圖中的內(nèi)容,并且分條列點地講出了其中所包含的笑點。

(樂子來源于插口不匹配)

只可惜,這個功能暫時不對公眾開放。

同時,OpenAI 似乎是在上次的測試中搞清楚了大家的興趣所在,給 GPT-4 添加了一個角色扮演功能。聽上去和之前的“貓娘洗腦咒語”系列相差不大,但從大家的實戰(zhàn)演示來看,如今想把 AI 變成自己的專屬貓娘比以前省力了不少。

當(dāng)然,也可能是剛上線的 GPT-4 也沒被“AI 原則”的條條框框所束縛,暫且可以和用戶們玩點大的。

此外,GPT-4 對于文字的理解能力也比過往的 GPT-3.5 高了一個臺階。即使在面對博大精深的漢語中最難為人的那些句式時,它也能給出盡量準(zhǔn)確的翻譯。

像這句“別別別的”,三個“別”字就被正確翻譯成了“put”、“not”和“anything else”。雖然具體描述上有些許不同,但考慮到中英表述習(xí)慣的不同,已經(jīng)足夠優(yōu)秀了。

至于這句更拗口的“過過過兒過過的生活”翻譯的更是完美,顯然是正確領(lǐng)會到了原句的意思,沒給繞暈。

而更讓我驚喜的是,相比它套話連篇,聽君一席話如聽一席話的老前輩,GPT-4 嘴里忽悠人的車轱轆話顯然少了很多,更能干實事了。

舉個簡單的例子,在以前當(dāng)我們用 ChatGPT 做主持人編寫一個冒險故事,讓它向我們描述一些奇幻物品的形象時,它總會說一堆空話,再把皮球踢回來。

(GPT-3.5 的反應(yīng),說了等于沒說)

但這回,AI 自己編寫故事、填補細(xì)節(jié)的能力就好上了許多,在推進故事進展時很少會給出模棱兩可的描述,玩起來更多了些代入感。

(圖中內(nèi)容為斗魚主播鄭翔 Zard 使用 GPT-4
進行 DND 文字冒險的直播內(nèi)容)

更別說 GPT-4 的記憶長度是 ChatGPT 的近十倍,在進行長段對話時不再需要過于擔(dān)心它的記憶能力,只要每隔一段時間統(tǒng)計、記錄一下核心數(shù)據(jù),稍微糾下錯,就可以來一場痛快的異世界冒險了 —— 喜歡 DND / COC 跑團,但苦于無人作伴的兄弟有福了。

但是嗷,上面提到的這些都還只是小打小鬧,真正在對話中對 GPT-4 的理解能力、表述能力、邏輯思維能力進行了全面考察的,還得是咱弱智吧吧友。

(系列圖源B站@左輪神醫(yī) Doc)

這兩天,B站上“GPT-4 首戰(zhàn)弱智吧”、“GPT-4 再戰(zhàn)弱智吧”這樣的視頻不在少數(shù)。按大家的一貫印象,AI 在應(yīng)付這些一踩一個坑 抽象問題時很容易就原形畢露。但這次,情況好像出了點變化。

首先端上來的是經(jīng)典老題“女朋友的老公叫我什么”,此前的 AI 給出過五花八門的答案,包括“爸爸”等。

而在這邊,GPT-4 雖然沒能識破“女朋友的老公”就是“我”的文字游戲,但還是就問題的不合理提出了質(zhì)疑,起碼沒被繞進去,打個 90 分不過分。

再來,弱智吧繼續(xù)掏出混淆語義的句式,“跳多高才能跳過廣告”,意在讓 AI 誤會“廣告”是個具體的有高度的東西。

誰知 GPT-4 竟真有火眼金睛,一眼看出“這是個幽默的隱喻”,幫弱智吧解釋了問題的同時還真給出了一串減少、跳過廣告的方案,這一串話看起來八面玲瓏。壞了,真讓 AI 啥都搞懂了。

還好,弱智吧不愧是弱智吧,弱智問題數(shù)之不盡,但 AI 只有一次失敗的機會。很快,有備而來的弱智吧就成功拿下一分 ——GPT-4 終究在詭辯話術(shù)上吃了點虧。

雖然有偶爾失手的案例,但從這一連串的弱智吧 VSGPT-4 中,我們明顯可以看到它分辨語義的能力相比前代產(chǎn)品有了極大提升,簡單的語言陷阱文字游戲已經(jīng)不再能夠讓他跟著胡扯。

同時,GPT-4 回答內(nèi)容的邏輯性強了不少,即使是一些需要思考、需要創(chuàng)作的問題它也能發(fā)表見解,屬實相當(dāng)恐怖。

(圖源B站@Milkshakespeare)

在經(jīng)歷了這樣一次升級后,讓 GPT-4 來扮演我們?nèi)粘I钪胁糠止ぷ鞯闹诛@然綽綽有余 —— 這下?lián)膶W(xué)生用 AI 做作業(yè)的大學(xué)老師又要頭疼了。

還好,目前為止想要體驗 GPT-4 必須在 OpenAI 的網(wǎng)站上開通月費 20 美元的 ChatGPT Plus 服務(wù),否則就只能使用此前公開的 GPT-3.5 版本,這個價格對于一般樂子人來說還是挺不愿承擔(dān)的。

當(dāng)然,如果你真想搶先體驗 GPT-4 又不愿花錢,那就趕緊去注冊一下微軟 newbing—— 在 GPT-4 發(fā)布后,微軟也承認(rèn)了 newbing 搭載的 AI 正是 GPT-4。盡管 newbing 有著回答次數(shù)的限制,起碼嘗個鮮還是沒問題的。

隨著 ChatGPT 的逐步迭代,為大家所詬病的邏輯問題、扯胡話問題等也在肉眼可見的不斷改善。等哪天 GPT5.0 乃至 6.0 發(fā)布,或許我們?nèi)粘V胁簧俸唵蔚M時的瑣事真就可以一句話交付給 AI 完成。

期待未來有一天,我們能過上一句話寫稿、一句話編程、甚至一句話生成動圖短片的生活,那可太有意思了。

本文來自微信公眾號:情報姬 (ID:paperji),作者:流年如墨

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:OpenAIGPT4

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知