首頁 > 智能時代>人工智能

陶哲軒支持！AI 奧林匹克數(shù)學(xué)獎來了，獎金 500 萬美元，尋找能得 IMO 金牌的大模型

量子位 2023/11/28 23:18:09 責(zé)編：遠(yuǎn)洋

評論：

專門為 AI 設(shè)立的 IMO 國際奧林匹克數(shù)學(xué)競賽來了 ——

獎金足足 1000 萬美元那種！

陶哲軒支持！AI 奧林匹克數(shù)學(xué)獎來了，獎金 500 萬美元，尋找能得 IMO 金牌的大模型

該比賽號稱要“代表新的圖靈測試”，怎么比？

和人類最聰明的數(shù)學(xué)小天才們正面 PK，拿到同樣標(biāo)準(zhǔn)的金牌。

可別小看這一賽事，就連數(shù)學(xué)大牛陶哲軒都來了，并在官網(wǎng)傾力推薦：

這個比賽提供了一套鑒別 AI 解決問題策略的基準(zhǔn)，而這正是我們現(xiàn)在需要的。

陶哲軒支持！AI 奧林匹克數(shù)學(xué)獎來了，獎金 500 萬美元，尋找能得 IMO 金牌的大模型

消息一出，網(wǎng)友們是相當(dāng)興奮。

陶哲軒支持！AI 奧林匹克數(shù)學(xué)獎來了，獎金 500 萬美元，尋找能得 IMO 金牌的大模型

如 IMO 主席所說：到底哪個大模型能和世界上最聰明的一波年輕人相媲美？

所謂“重賞之下，必有勇夫”，有著自己路數(shù)的 AI 也著實(shí)令人期待。

AI 參賽 IMO，最高拿 500 萬美元

這項(xiàng)比賽的簡稱 AI-MO。

陶哲軒支持！AI 奧林匹克數(shù)學(xué)獎來了，獎金 500 萬美元，尋找能得 IMO 金牌的大模型

它的初衷就是推動大語言模型的數(shù)學(xué)推理能力，鼓勵開發(fā)能夠匹配人類數(shù)學(xué)最高水平（IMO 競賽）的新 AI 模型。

為什么選 IMO 為基準(zhǔn)？

IMO 的題目一般分為代數(shù)、幾何、數(shù)論和組合數(shù)學(xué)四大類，不需要高等數(shù)學(xué)知識，但需要參賽者有正確的思維方式和數(shù)學(xué)素養(yǎng)。

統(tǒng)計(jì)顯示，其金牌獲得者奪得菲爾茲獎的可能性是普通劍橋博士畢業(yè)生的 50 倍。

此外，有一半的菲爾茲獎獲得者曾參加過 IMO 競賽。

基于該比賽，這項(xiàng)專門為 AI 舉辦的 AI-MO 大賽將于 2024 年初開放。

組委會要求，參加的 AI 模型必須和人類選手采用相同的格式處理題目，并且必須生成人類可讀的最終答案，然后由專家小組使用 IMO 標(biāo)準(zhǔn)對其進(jìn)行評分。

比賽結(jié)果將隨明年 7 月在英國巴斯舉行的第 65 屆 IMO 大會一同揭曉。

最終，達(dá)到金牌水平的 AI 將獲得 500 萬美元的大獎。

剩余“實(shí)現(xiàn)了關(guān)鍵里程碑”的 AI 模型們則瓜分剩下的進(jìn)步獎，總金額也是 500 萬美元。

值得一提的是，為了拿到獲獎資格，參賽者必須遵守 AI-MO 公共共享協(xié)議，也就是獲獎模型必須得開源。

至于具體的規(guī)則，組委會還在商議中，以及目前官方還在招募顧問委員會成員（特別需要數(shù)學(xué)家、AI 和機(jī)器學(xué)習(xí)專家）和領(lǐng)導(dǎo)這項(xiàng)比賽的總監(jiān)，都是付費(fèi)的且可以完全遠(yuǎn)程，不知道哪些大佬會加入。

不過需要注意的是，AI-MO 并非 IMO 官方發(fā)起的比賽。

其真正的發(fā)起機(jī)構(gòu)是 XTX Markets，一家位于英國倫敦、搞機(jī)器學(xué)習(xí)量化交易的非銀行金融機(jī)構(gòu)。

陶哲軒支持！AI 奧林匹克數(shù)學(xué)獎來了，獎金 500 萬美元，尋找能得 IMO 金牌的大模型

別的不說，XTX Markets 主打一個豪氣。

它還在去年和牛津大學(xué)一起設(shè)立了一個專門鼓勵女學(xué)生研究數(shù)學(xué)的獎學(xué)金。

陶哲軒支持！AI 奧林匹克數(shù)學(xué)獎來了，獎金 500 萬美元，尋找能得 IMO 金牌的大模型

而對于比賽本身，有網(wǎng)友也開始了一波猜測：哪個 AI 模型最有希望？

帶 Wolfram 插件的 GPT-4 第一個被拎出來，不過它也最先被潑了冷水。

陶哲軒支持！AI 奧林匹克數(shù)學(xué)獎來了，獎金 500 萬美元，尋找能得 IMO 金牌的大模型

但，它背后的 OpenAI 還是被人看好（盡管大型科技公司并不是該比賽的目標(biāo)受眾）。

陶哲軒支持！AI 奧林匹克數(shù)學(xué)獎來了，獎金 500 萬美元，尋找能得 IMO 金牌的大模型

有悲觀的網(wǎng)友則直接斷言：

比賽是挺酷的，但五年內(nèi)應(yīng)該沒有誰能做到。

陶哲軒支持！AI 奧林匹克數(shù)學(xué)獎來了，獎金 500 萬美元，尋找能得 IMO 金牌的大模型

與此同時，有人也認(rèn)為：

訓(xùn)練出這樣一個模型并不算難，難的是獲取和處理數(shù)據(jù)，畢竟這些題目不單單涉及文本，還包括很多復(fù)雜含義的圖像和符號。

陶哲軒支持！AI 奧林匹克數(shù)學(xué)獎來了，獎金 500 萬美元，尋找能得 IMO 金牌的大模型

一切皆等 2024 年揭曉。

值得一提的是，AI-MO 并非第一場 AI 挑戰(zhàn) IMO 的比賽。

2019 年，OpenAI、微軟、斯坦福大學(xué)和谷歌等高校機(jī)構(gòu)的幾位研究人員，就已經(jīng)發(fā)起過一場名為 IMO Grand Challenge 的比賽了。

此前挑戰(zhàn)尚未有人成功

IMO Grand Challenge，同樣是為了找到能拿下 IMO 金牌的 AI 而設(shè)立的比賽。

陶哲軒支持！AI 奧林匹克數(shù)學(xué)獎來了，獎金 500 萬美元，尋找能得 IMO 金牌的大模型

來看看這場數(shù)學(xué)比賽為 AI 設(shè)立的 5 點(diǎn)規(guī)則：

關(guān)于格式。為了確保證明過程的嚴(yán)謹(jǐn)性和可驗(yàn)證性，問題和證明都需要通過形式化（formal，機(jī)器可驗(yàn)證）的方式來完成。

也就是說，IMO 問題會通過 Lean 定理證明器，將問題轉(zhuǎn)變成基于 Lean 編程語言的表達(dá)輸入給 AI，AI 同樣需要用 Lean 編程語言寫出證明。

關(guān)于得分。AI 的每個證明題都會在 10 分鐘內(nèi)被判斷對錯，因?yàn)檫@也是 IMO 裁判評分的時間。與人類不同，AI 沒有“部分得分”這一說法。

陶哲軒支持！AI 奧林匹克數(shù)學(xué)獎來了，獎金 500 萬美元，尋找能得 IMO 金牌的大模型

關(guān)于資源。和人類一樣，AI 每天需要用 4.5 小時解決 3 道題（共比賽兩天），計(jì)算資源沒有限制。

關(guān)于可復(fù)現(xiàn)性。AI 必須開源，并在 IMO 第一天結(jié)束前公開模型、而且可復(fù)現(xiàn)。要求 AI 不能聯(lián)網(wǎng)。

關(guān)于挑戰(zhàn)本身。最大的挑戰(zhàn)是讓 AI 像人類一樣獲得金牌??。

這場比賽由 7 位 AI 研究學(xué)者和數(shù)學(xué)家發(fā)起：

OpenAI 的 Daniel Selsam、微軟的 Leonardo de Moura、帝國理工學(xué)院的 Kevin Buzzard、匹茲堡大學(xué)的 Reid Barton、斯坦福大學(xué)的 Percy Liang、谷歌 AI 的 Sarah Loos 和拉德堡德大學(xué)的 Freek Wiedijk。

如今 4 年過去，陸陸續(xù)續(xù)也收到了一些參賽者的關(guān)注。

不過，雖然不少 AI 和數(shù)學(xué)研究者都試圖挑戰(zhàn)過這一領(lǐng)域、或是領(lǐng)域中的一個小目標(biāo)，但距離最終的奪得 IMO 冠軍目標(biāo)都還有很遠(yuǎn)。

甚至有建議認(rèn)為這場比賽要不要設(shè)立一個“簡單模式”：

陶哲軒支持！AI 奧林匹克數(shù)學(xué)獎來了，獎金 500 萬美元，尋找能得 IMO 金牌的大模型