設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

陶哲軒甩出調(diào)教 GPT-4 聊天記錄,點擊領(lǐng)取大佬的研究助理

量子位 2023/6/26 12:32:13 責(zé)編:夢澤

鵝妹子嚶,天才數(shù)學(xué)家陶哲軒搞數(shù)學(xué)研究,已經(jīng)離不開普通人手里的“數(shù)學(xué)菜雞”GPT 了!

就在他最新解決的一個數(shù)學(xué)難題下面,陶哲軒明確指出自己“使用了 GPT-4”,后者給他提出了一種可行的解決方法。

借助 GPT-4,他不僅成功地突破了這一難題,還將答案分享在了 MathOverflow 上:

它給我提供了最終的解題思路,接下來我只需要繼續(xù)計算就行。

為了給更多數(shù)學(xué)家分享用 GPT-4 工作的便利性,陶哲軒還將自己的聊天記錄 po 了出來,里面完整地記載了他和 GPT-4 的對話。

可以看見,在這份聊天記錄中,他把 GPT-4 稱呼為“專業(yè)數(shù)學(xué)合作者”,而不僅僅是一個普通的數(shù)學(xué)助手。

這個身份屬實不一般了,不知道之后陶哲軒寫論文的時候會不會把 GPT-4 列為共同作者(手動狗頭)。

不僅如此,戳對話記錄底部的“continue this conversation”按鈕,還能一鍵把對話記錄導(dǎo)入自己的 ChatGPT 中,突然闖入人類大師和 AI 的交談。

陶哲軒解決了什么新問題?

陶哲軒研究的問題,是一個兩天前在數(shù)學(xué)網(wǎng)站 MathOverflow 上更新的提問。

這個名叫“優(yōu)雅的遞歸之 A301897”問題,具體長這樣:

其中,A301897 是一個被整數(shù)數(shù)列網(wǎng)站 OEIS 收錄的數(shù)列:

這個數(shù)列中有一系列來自長度為 n 的排列 b 的數(shù),它們有一個共同點,就是滿足 Diaconis-Graham 不等式且等號成立。

Diaconis-Graham 不等式由戴康尼斯(Persi Diaconis)和葛立恒(沒錯,就是“最大數(shù)”之父 Ronald Graham)于 1977 年共同提出,屬于概率統(tǒng)計方面的研究。

顯然,這一大段提問中不僅夾雜著大量專業(yè)數(shù)學(xué)公式,而且還涉及需要跳轉(zhuǎn)的網(wǎng)頁資料

作為數(shù)學(xué)公認(rèn)不太好的“數(shù)學(xué)菜雞”,GPT-4 真的能像一名專業(yè)數(shù)學(xué)家那樣快速讀懂公式、給出解決問題的專業(yè)建議嗎?

事實上,相比直接把問題復(fù)制粘貼給 GPT-4,陶哲軒做了三件事

  • 首先,做一些提示工程,明確 GPT-4 的“身份”和“目標(biāo)”。其中身份是“一個擅長給技巧性建議的數(shù)學(xué)合作專家”,目標(biāo)是“提供一些建議”而非解決問題。

  • 然后,相比直接把大段公式復(fù)制進(jìn) GPT-4 提問欄(確實可以這樣做),陶哲軒選擇將問題描述轉(zhuǎn)成 Markdown 格式。

  • 最后,涉及需要 GPT-4 自己查找資料的內(nèi)容,陶哲軒將它轉(zhuǎn)變成一個引用注釋,并在結(jié)尾給出網(wǎng)址。

完整的提問過程長這樣:

也就是說,相比讓 GPT-4 直接化身數(shù)學(xué)家去“解決問題”,陶哲軒只是把它當(dāng)成一個提供靈感來源的“專家”,給自己建議一些研究的方向。

GPT-4 很快給出了 8 個具體的建議:

1、理解問題:在深入證明之前,確保你理解了問題中的每一項。如果你不熟悉 Diaconis-Graham 不等式,研究一下它,了解表達(dá)式 a (n) 和 R (n, q) 中的每一項代表什么。

2、簡化表達(dá):有時候,復(fù)雜的表達(dá)可以被簡化。例如,你可能想看看表達(dá)式中 a (n) 的二項式系數(shù)是否可以簡化,或者是否可以用更簡單的方式計算總和。

3、歸納法:由于 R (n, q) 是遞歸定義的,因此證明猜想的一種自然方法是使用數(shù)學(xué)歸納法。你可能想要證明,如果這個猜想對 n 成立,那么它對 n+1 也成立。

4、生成函數(shù):另一種方法是使用生成函數(shù)。嘗試找到 a (n) 和 R (n, 0) 的生成函數(shù),然后證明它們是相等的。這有時可以把一個復(fù)雜的組合問題變成一個更簡單的代數(shù)問題。

5、漸近分析:正如你提到的,分析 a (n) 和 R (n, 0) 的漸近行為可能會對它們的關(guān)系有一些深入的了解。這有時可以用斯特林的階乘近似來實現(xiàn),或者通過分析表達(dá)式中的主導(dǎo)項來實現(xiàn)。

6、數(shù)值證據(jù):雖然不是證明,但收集數(shù)值證據(jù)有時可以讓我們了解如何證明一個猜想。因為你有 PARI / GP 代碼,可以用數(shù)值來檢查猜想,你可能想讀一讀每個序列的前幾項,看看是否能發(fā)現(xiàn)任何模式。

7、尋找類似問題:有時,一個問題或猜想是一個已知問題的泛化或變體。在組合文獻(xiàn)中尋找類似的問題或定理,看看它們的證明是否可以適用于這個問題。

8、尋求反饋和合作:不要猶豫,從同事那里尋求反饋,或者在 MathOverflow 這樣的論壇上發(fā)布你的部分結(jié)果。協(xié)作和同行評議通常是解決復(fù)雜數(shù)學(xué)問題的關(guān)鍵。

最終,陶哲軒使用建議 4,也就是生成函數(shù)的方法,成功解決了問題。

當(dāng)然,解決問題的過程并不需要用到 GPT-4,采用 MAPLE 工作表 + 紙筆手動計算就能完成。陶哲軒也嘗試了漸進(jìn)分析(建議 5)的方法,不過事實證明還是用生成函數(shù)更有效。

簡單來說,陶哲軒只是用 GPT-4 給自己提供不同的解題思路,也就是“解題靈感”,但具體怎么解答,也就是更加數(shù)學(xué)的方法,他則不會交給 GPT-4 來完成。

至于“查資料”這種 GPT-4 的應(yīng)用,陶哲軒也發(fā)揮到了極致。

例如在思考問題時,他還會把自己的“靈光乍現(xiàn)”拿出來和 GPT-4 討論一下,例如他覺得這個問題和卡特蘭數(shù)(Catalan numbers)有相似之處,希望 GPT-4 幫他查找一下對應(yīng)的資料。

GPT-4 很快給出了對應(yīng)的回答,這也促使陶哲軒對另一個問題產(chǎn)生了新的靈感。

簡單來說,陶哲軒在短短兩段與 GPT-4 的對話中,展示了數(shù)學(xué)家使用 GPT-4 的正確姿勢 —— 找靈感和查資料。

這樣一來,即使“數(shù)學(xué)菜雞”如 GPT-4,也能成為數(shù)學(xué)家的 AI 助理了。

大佬是怎么玩兒 GPT 的

分享人類大師和 AI 的聊天記錄之余,陶哲軒的乳齒象博文里還附帶著一份貼心指南,是他使用 ChatGPT 和 GPT-4 的經(jīng)驗之談。

根據(jù)他過去的實操經(jīng)驗,最要緊的第一點:

不要試圖讓 AI 直接回答問題,因為這幾乎肯定會得到一些看起來專業(yè)的廢話。

為了避免 GPT 成為廢話文學(xué)大王,行之有效的方案如下:

讓 AI 扮演合作者的角色,而后讓它提供策略建議

Like this:

除此之外,“數(shù)學(xué)菜雞”GPT,在大數(shù)學(xué)家手里能有什么用處?

陶哲軒大概的意思是醬嬸兒的:

ChatGPT 數(shù)學(xué)能力雖然不咋滴,但對做學(xué)術(shù)研究的人來說是個發(fā)散思維的好工具。

(對普通人來說有點不太專業(yè),但對搞數(shù)學(xué)的學(xué)術(shù)人員來說剛剛好)

怎么解釋用來“發(fā)散思維”這句話呢?

陶哲軒表達(dá)出來的觀點是,既然 ChatGPT 在具體數(shù)學(xué)問題上給出的答案是不完全正確的,那不如索性發(fā)揮發(fā)揮它生成答案部分正確的特性。

簡而言之,就是讓它幫你找靈感 balabalabla:

在處理數(shù)學(xué)問題時,可以讓 ChatGPT 這類大語言模型做一些半成品的語義搜索工作。

也就是說,ChatGPT 不用提供確切的答案,只用生成一些可能的提示。

這樣一來,依據(jù) GPT 生成的提示 + 傳統(tǒng)搜索引擎搜索,就能很輕松 get 答案。

而且他還自曝,在 GPT-4 發(fā)布之前,他本人就從微軟那里獲得了訪問資格。

也就是和微軟 154 頁《AGI 的火花》論文里同款,未經(jīng)過安全訓(xùn)練但能力更強的滿血版。

從陶哲軒的反饋中可以看到,GPT-4 非常擅長在和人類對話時進(jìn)行一些 cosplay,比如充當(dāng)富有同情心的傾聽者、熱情洋溢的反饋者、富有創(chuàng)造力的靈感來源、翻譯者或教師,或者是魔鬼的代言人。

與此同時,對于 AI 在數(shù)學(xué)研究中的表現(xiàn),陶哲軒給出的大膽卻又嚴(yán)謹(jǐn)?shù)念A(yù)言:

當(dāng)與形式證明驗證器、互聯(lián)網(wǎng)搜索和數(shù)學(xué)符號包等工具整合時,2026 年的 AI,如果使用得當(dāng),將成為數(shù)學(xué)研究中值得信賴的共同作者,而且在許多其他領(lǐng)域也是如此。

除了數(shù)學(xué)研究,GPT-4 已經(jīng)是陶哲軒生活中的全方位小助手了。

他經(jīng)常使用 GPT-4 回答一些隨意、措辭含糊的問題,這些問題以前需要在搜索引擎里精心調(diào)整關(guān)鍵詞才行。

還有位同事,因為親戚拿到重癥診斷而郁郁寡歡。為此,陶哲軒讓大手一揮,讓 GPT-4 洋洋灑灑寫了封慰問信。

結(jié)果呢?同事眼含熱淚,被感動哭了。

最后說回陶哲軒用 GPT-4 解決數(shù)學(xué)難題這事兒上來。

在 MathOverflow 下,有的網(wǎng)友覺得他不應(yīng)該用 GPT 來回答數(shù)學(xué)問題,感覺是個很敏感的話題。

但還是有人表示了資瓷,表示覺得真的是泰庫辣~

陶哲軒倒是毫不避諱地站出來表明了自己的立場,他倒不覺得有啥不好:

現(xiàn)在的擔(dān)憂,跟維基百科流行初期時大家討論的重點也沒啥區(qū)別……

現(xiàn)在在維基百科上 get 初始線索,并且在引為論點時附上鏈接,展現(xiàn)它是我論據(jù)的一部分,都是大伙兒習(xí)以為常的事情。

并且陶哲軒看法還挺堅定,那就是“相信大家以后也會覺得用 GPT 來支持研究,沒啥不妥當(dāng)?shù)哪亍?/strong>~

加入陶哲軒和 GPT-4 的對話:

https://chat.openai.com/share/53aab67e-6974-413c-9e60-6366e41d8414

參考鏈接:

  • [1]https://mathoverflow.net/questions/449361/elegant-recursion-for-a301897

  • [2]https://mathstodon.xyz/@tao/110601051375142142

  • [3]https://finmath.stanford.edu/~cgates/PERSI/papers/77_04_spearmans.pdf

本文來自微信公眾號:量子位 (ID:QbitAI),作者:衡宇 蕭簫

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:陶哲軒,GPT4

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知