首頁(yè) > 智能時(shí)代>人工智能

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

量子位 2023/10/8 15:13:14 責(zé)編：遠(yuǎn)洋

評(píng)論：

傳奇程序員卡馬克（John Carmack），與強(qiáng)化學(xué)習(xí)之父薩頓（Richard Sutton）強(qiáng)強(qiáng)聯(lián)手了，All in AGI。

2030 年向公眾展示通用人工智能的目標(biāo)是可行的。

并且與主流方法不同，不依賴大模型范式，更追求實(shí)時(shí)的在線學(xué)習(xí)。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

兩人在薩頓任教的阿爾伯塔大學(xué)機(jī)器智能研究所（Amii）特別活動(dòng)上宣布了這一消息。

薩頓會(huì)加入卡馬克的 AI 創(chuàng)業(yè)公司 Keen Technologies，同時(shí)保持在阿爾伯塔的教職。

兩人在活動(dòng)中都承認(rèn)，與擁有成百上千員工的大公司相比，Keen Technologies 的團(tuán)隊(duì)規(guī)模很小。

目前還在剛起步階段，公司整個(gè)技術(shù)團(tuán)隊(duì)都到了現(xiàn)場(chǎng) —— 只有站著的這 4 個(gè)人。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

其融資規(guī)模 2000 萬(wàn)美元，與 OpenAI、Anthropic 這樣動(dòng)輒幾十億的也沒(méi)法比。

但他們相信，最終 AGI 的源代碼是一個(gè)人就能編寫的量級(jí)，可能只有幾萬(wàn)行。

而且當(dāng)前 AI 領(lǐng)域正處在杠桿效應(yīng)最大的特殊時(shí)刻，小團(tuán)隊(duì)也有機(jī)會(huì)做出大貢獻(xiàn)。

傳奇程序員與強(qiáng)化學(xué)習(xí)之父

卡馬克的傳奇經(jīng)歷，從開(kāi)發(fā)世界第一款 3D 游戲，到轉(zhuǎn)型造火箭，再到加入 Oculus 成為后來(lái) Meta VR 關(guān)鍵人物的故事都已被人熟知。

后來(lái)他與 AI 結(jié)緣，還和 OpenAI 有關(guān)。

他曾在另一場(chǎng)訪談中透露，Sam Altman 曾邀他加入 OpenAI，認(rèn)為他能在系統(tǒng)優(yōu)化方面發(fā)揮重要作用。

但卡馬克當(dāng)時(shí)認(rèn)為自己對(duì)機(jī)器學(xué)習(xí)范式的現(xiàn)代 AI 沒(méi)有任何了解，也就沒(méi)有答應(yīng)。

這卻成了他開(kāi)始了解 AI 的一個(gè)契機(jī)。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

他向 OpenAI 的首席科學(xué)家 Ilya Sutskever 要了一個(gè)入門必讀清單，從頭開(kāi)始自學(xué)，先對(duì)傳統(tǒng)機(jī)器學(xué)習(xí)算法有了基本的了解。

等有了空閑，打算繼續(xù)涉足深度學(xué)習(xí)的時(shí)候，他來(lái)了個(gè)一周編程挑戰(zhàn)：

打印幾篇 LeCun 的經(jīng)典論文，在斷網(wǎng)情況下動(dòng)手實(shí)踐，從推反向傳播公式開(kāi)始。

一周過(guò)去后，他帶著用 C++ 手搓的卷積神經(jīng)網(wǎng)絡(luò)結(jié)束閉關(guān)，沒(méi)有借助 Python 上的現(xiàn)代深度學(xué)習(xí)框架。

只能說(shuō)佩服大神了。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

此時(shí)他的主業(yè)還是在 Facebook（后改名 Meta）旗下 Oculus 研究 VR，帶領(lǐng)團(tuán)隊(duì)推出了 Ouclus Go 和 Quest 等產(chǎn)品。

不過(guò)這個(gè)過(guò)程中，他與公司管理層之間也逐漸產(chǎn)生矛盾和分歧，認(rèn)為公司內(nèi)部效率低下，也曾公開(kāi)發(fā)表不滿。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

2019 年，他辭去 Oculus CTO 職位轉(zhuǎn)而擔(dān)任“顧問(wèn) CTO”，開(kāi)始把更多精力轉(zhuǎn)向 AI。

2022 年 8 月，他宣布新 AI 創(chuàng)業(yè)公司 Keen Technologies 宣布融資 2000 萬(wàn)美元，投資者包括紅杉資本，GitHub 前 CEO Nat Friedman 等。

后續(xù)他也透露，其實(shí)區(qū)區(qū) 2000 萬(wàn)美元，自己就拿得出手。

但是從別人那里拿錢能給他一種危機(jī)和緊迫感，有更強(qiáng)烈的決心把事情做好。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

2022 年底，他正式離開(kāi) Meta，并將 VR 視為已經(jīng)過(guò)去的一個(gè)人生階段，接下來(lái)完全轉(zhuǎn)向 AI。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

除了這條明面上的主線之外，卡馬克與 AI 還有一些莫名的緣分。

當(dāng)年他的 3D 游戲激發(fā)了對(duì)圖形計(jì)算的需求，GPU 也是從游戲領(lǐng)域開(kāi)始發(fā)展壯大。

到如今正是 GPU 的算力支持了 AI 的爆發(fā)，他談到這些時(shí)仍為自己的貢獻(xiàn)感到自豪。

……

今天的另一位主角薩頓也同樣是位傳奇人物。

他被譽(yù)為強(qiáng)化學(xué)習(xí)之父，為強(qiáng)化時(shí)間差異學(xué)習(xí)和策略梯度等方法做出重要貢獻(xiàn)，也是強(qiáng)化學(xué)習(xí)標(biāo)準(zhǔn)教科書(shū)的合著者。

2017 年他以杰出科學(xué)家身份加入 DeepMind，參與了 AlphaGo 系列研究，他的學(xué)生 David Silver 則是 AlphaGo 主要負(fù)責(zé)人之一。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

薩頓寫過(guò)一篇著名短文 The Bitter Lesson，認(rèn)為試圖把人類經(jīng)驗(yàn)教給 AI 是行不通的，至今為止所有突破都是依靠算力提升，繼續(xù)利用算力的規(guī)模效應(yīng)才是正確道路。

兩人正式交流之前，卡馬克就曾表達(dá)過(guò)對(duì)這篇文章的關(guān)注和認(rèn)同。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

但兩人真正直接交流，是薩頓主動(dòng)聯(lián)系的。

幾個(gè)月前，卡馬克宣布 AGI 創(chuàng)業(yè)公司融資之后，收到了薩頓的郵件。

薩頓想要問(wèn)他他在研究的道路上應(yīng)該走純學(xué)術(shù)、商業(yè)化還是非盈利組織路線的問(wèn)題。

但在后續(xù)郵件交流中，兩人發(fā)現(xiàn)在 AI 研究方向和理念上存在驚人的一致性，漸漸確立了合作關(guān)系。

具體來(lái)說(shuō)，兩人達(dá)成了 4 個(gè)共識(shí)：

都認(rèn)為當(dāng)前 AGI 發(fā)展被限制在很窄的幾個(gè)方向上，過(guò)多依賴大數(shù)據(jù)和大算力而忽視了創(chuàng)新
都認(rèn)為太早商業(yè)化會(huì)阻礙 AGI 的發(fā)展
都認(rèn)為最終 AGI 不會(huì)太復(fù)雜，一個(gè)人就能掌握全部原理，甚至一個(gè)人就能寫出主要的代碼。
都認(rèn)為 2030 年出現(xiàn) AGI 原型是一個(gè)可行的目標(biāo)。

不只依賴大模型，小團(tuán)隊(duì)也有機(jī)會(huì)

很大膽的目標(biāo)，現(xiàn)場(chǎng)觀眾也是這么認(rèn)為的。

面對(duì)“小團(tuán)隊(duì)如何搞定這么宏大的目標(biāo)”的提問(wèn)，卡馬克認(rèn)為實(shí)現(xiàn) AGI 所需的數(shù)據(jù)量和算力需求可能沒(méi)有想象中那么大。

把人類一整年眼中所見(jiàn)拍成每秒 30 幀的視頻，可以裝在拇指大小的 U 盤里。
而 1 歲兒童只擁有這么多經(jīng)驗(yàn)數(shù)據(jù)，已經(jīng)展現(xiàn)出明顯的智能。
如果算法對(duì)了，就不需要用整個(gè)互聯(lián)網(wǎng)的數(shù)據(jù)讓 AGI 去學(xué)習(xí)。

對(duì)于算力需求，他也是用這種直覺(jué)式的思維去考慮：人腦的計(jì)算能力也有限，遠(yuǎn)遠(yuǎn)達(dá)不到一個(gè)大型算力集群的程度。

比一個(gè)服務(wù)器節(jié)點(diǎn)（node）要大，也比一個(gè)機(jī)柜（rack）要大，但最大也就再高出一個(gè)數(shù)量級(jí)。

而且隨著時(shí)間推移，算法會(huì)更加高效，所需的算力還會(huì)持續(xù)下降。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

如果說(shuō)卡馬克在 3D 游戲、火箭和 VR，這些看似不搭邊的工作領(lǐng)域上有什么共同點(diǎn)，那就是對(duì)大型實(shí)時(shí)反饋系統(tǒng)的優(yōu)化。

這也是當(dāng)初 Sam Altman 邀請(qǐng)他加入 OpenAI 時(shí)看中的地方。

他設(shè)想中的 AGI 架構(gòu)應(yīng)該是模塊化和分布式的，而不是一個(gè)巨大的集中模型。

學(xué)習(xí)也應(yīng)該是持續(xù)的在線學(xué)習(xí)，而不是現(xiàn)在的預(yù)訓(xùn)練之后大部分參數(shù)就不再更新。

我的底線是，如果一個(gè)系統(tǒng)不能以 30hz 的頻率運(yùn)行，也就是訓(xùn)練時(shí) 33 毫秒左右更新一次，我就不會(huì)用它。

他進(jìn)一步表示，作為能自己寫原始 Cuda 代碼和能自己管理網(wǎng)絡(luò)通信的底層系統(tǒng)程序員，可能會(huì)去做一些其他人根本不會(huì)考慮的工作。

甚至不僅局限于現(xiàn)有的深度學(xué)習(xí)框架，會(huì)嘗試更高效的網(wǎng)絡(luò)架構(gòu)和計(jì)算方法。

總體目標(biāo)是模擬一個(gè)具有內(nèi)在動(dòng)機(jī)和持續(xù)學(xué)習(xí)能力的虛擬智能體，在虛擬環(huán)境中持續(xù)學(xué)習(xí)。

不要機(jī)器人，因?yàn)橹圃旎鸺慕?jīng)歷讓他認(rèn)為打交道的物理對(duì)象越少越好。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

與卡馬克剛涉足 AGI 不久相比，薩頓在這個(gè)問(wèn)題上已經(jīng)花費(fèi)了幾十年，他有更具體的研究計(jì)劃。

雖然這次活動(dòng)上沒(méi)有說(shuō)太多，但主體部分已經(jīng)以“阿爾伯塔計(jì)劃”的形式寫在一篇 arXiv 論文里。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

阿爾伯塔計(jì)劃提出了一個(gè)統(tǒng)一的智能體框架，強(qiáng)調(diào)普遍經(jīng)驗(yàn)而不是特殊的訓(xùn)練集，關(guān)注時(shí)間一致性，優(yōu)先考慮能隨算力產(chǎn)生規(guī)模效應(yīng)的方法，以及多智能體交互。

還提出了一個(gè)分為 12 步的路線圖。

前 6 步專注于設(shè)計(jì) model-free 的持續(xù)學(xué)習(xí)方法，后 6 步引入環(huán)境模型和規(guī)劃。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

其中最后一步稱為智能增強(qiáng) （Intelligence Amplification），一個(gè)智能體可以根據(jù)一些通用原則，利用它所學(xué)到的知識(shí)來(lái)放大和增強(qiáng)另一個(gè)智能體的行動(dòng)、感知和認(rèn)知。

薩頓認(rèn)為這種增強(qiáng)是充分發(fā)揮人工智能潛力的重要組成部分。

在這個(gè)過(guò)程中，確定評(píng)估 AI 進(jìn)步的指標(biāo)非常重要但也十分困難，團(tuán)隊(duì)正在探索不同的發(fā)展。

另外，卡馬克一直是開(kāi)源的倡導(dǎo)者，但在 AGI 的問(wèn)題上他表示會(huì)保持一定開(kāi)放性，但不會(huì)全部公開(kāi)算法細(xì)節(jié)。

作為一個(gè)小團(tuán)隊(duì)，卡馬克認(rèn)為需要保持開(kāi)拓精神，關(guān)注長(zhǎng)遠(yuǎn)發(fā)展而不是短期利益，

不會(huì)過(guò)早考慮商業(yè)化，沒(méi)有像 ChatGPT 這樣可以公開(kāi)發(fā)布的中間形態(tài)。

對(duì)于 2030 年能做到什么地步，卡馬克認(rèn)為“有可以向公眾展示的 AGI”，薩頓的表述是“AI 原型可以顯示出生命跡象（signs of life）”。

2030 成關(guān)鍵節(jié)點(diǎn)

2030 與 AGI，并不是第一次同時(shí)出現(xiàn)。

頂尖 AI 團(tuán)隊(duì)不約而同都把 2030 年前后作為實(shí)現(xiàn) AGI 的關(guān)鍵節(jié)點(diǎn)。

比如 OpenAI，在拿出 20% 總算力成立超級(jí)智能對(duì)齊部門的公告里寫著，我們相信超級(jí)智能在這個(gè)十年段到來(lái)。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

甚至投資界也出現(xiàn)類似的觀點(diǎn)，孫正義剛剛在軟銀世界企業(yè)大會(huì)上也拿出來(lái)這樣一張 PPT。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

除了 OpenAI 和 Keen Technologies，致力于開(kāi)發(fā) AGI 的組織并不多。

OpenAI 最大的競(jìng)爭(zhēng)對(duì)手，剛剛拿 40 億美元融資的 Anthropic，其 CEO Dario Amodei 在最近一次訪談中提到，兩三年內(nèi) AI 能表現(xiàn)得像一個(gè)受過(guò)良好教育的人類。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

Transformer 作者 Vaswani 與 Palmer 離開(kāi)谷歌時(shí)，創(chuàng)辦了 AdeptAI，目標(biāo)也是打造通用智能。

不過(guò)目前兩人今年初突然離開(kāi)這家公司，聯(lián)合創(chuàng)始人中只留下一位 David Luan（最右）。

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

兩位 Transformer 作者另外創(chuàng)辦了一家 Essential AI，這家公司的愿景就沒(méi)那么“仰望星空”了，是比較務(wù)實(shí)的大模型商業(yè)化。

國(guó)內(nèi)方面明確喊出 AGI 目標(biāo)的同樣也不多，主要有 MiniMax 和楊植麟新創(chuàng)辦的月之暗面。

參考鏈接：

[1]https://www.amii.ca/latest-from-amii/john-carmack-and-rich-sutton-agi/
[2]https://www.youtube.com/watch?v=uTMtGT1RjlY
[3]https://arxiv.org/abs/2208.11173

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型

傳奇程序員與強(qiáng)化學(xué)習(xí)之父

不只依賴大模型，小團(tuán)隊(duì)也有機(jī)會(huì)

2030 成關(guān)鍵節(jié)點(diǎn)

相關(guān)文章

強(qiáng)化學(xué)習(xí)之父入局 AGI 創(chuàng)業(yè)！聯(lián)手傳奇程序員卡馬克，放話不依賴大模型