OpenAI 一次性拿出 20% 總算力,投入全新研究方向 ——
超級智能對齊(Superalignment)。
先說說 OpenAI 的 20% 總算力什么概念?
光是微軟此前專門給他們打造的一臺超級計算機(jī),就有 285000 塊 CPU 和上萬塊英偉達(dá) A100 GPU。
外界沒人知道 OpenAI 現(xiàn)在擁有多少 H100 GPU,只知道他們總?cè)谫Y 113 億美元,還要算上微軟額外提供的 Azure 云算力。
這番大手筆,仿佛直接在科技圈扔下一個炸彈。
再看這份公告中的微妙用詞區(qū)別:
不是通用人工智能(AGI),甚至干脆去掉了人工二字。
直接越級瞄準(zhǔn)如何控制超級智能,其定義為比人類聰明得多的 AI 系統(tǒng)(much smarter than us)。
正文則明晃晃地寫著:雖然看起來還很遙遠(yuǎn),但我們相信超級智能將在這個十年段到來。
現(xiàn)在是 2023 年下半年,總共留給人類的時間還有 6 年半。
OpenAI 給自己定的時限更短,只有 4 年。
控制“奧創(chuàng)”需要“賈維斯”
有網(wǎng)友將 OpenAI 公布的研究方法形容為“賈維斯 vs 奧創(chuàng)”。
OpenAI 明白靠人類自己已無法完成,提出新概念自動對齊研究員(automated alignment researcher)
也就是先訓(xùn)練一個大致達(dá)到人類水平的 AI 研究員,再投入大量算力快速迭代。
翻譯一下:先努力達(dá)到技術(shù)奇點,然后直接開啟大爆炸。
整個計劃的基石,就是先打造第一個自動對齊研究員。
為此 OpenAI 提出一個臨時解決方案,分為三項:
開發(fā)一個可擴(kuò)展的訓(xùn)練方法
為了在人類難以評估的任務(wù)上提供訓(xùn)練信號,需要利用 AI 來協(xié)助評估其他 AI 系統(tǒng),稱為“可擴(kuò)展的監(jiān)督”。
驗證第一步產(chǎn)生的模型
為了驗證系統(tǒng)的一致性,自動搜索有問題的行為和有問題的內(nèi)部結(jié)構(gòu)。
對整個管道流程做壓力測試
通過故意訓(xùn)練不對齊的模型來測試整個管道,并確認(rèn)技術(shù)可以檢測到最糟糕的錯誤類型,也就是對抗性測試。
為什么說是臨時解決方案?
OpenAI 預(yù)計隨著對問題進(jìn)一步了解,研究重點將發(fā)生實質(zhì)性變化,很可能增加全新的研究領(lǐng)域。
再翻譯一下:只能走一步看一步。
首席科學(xué)家?guī)ш?,成立全新部門
研究頂級的問題需要頂級的團(tuán)隊。
OpenAI 聯(lián)創(chuàng)和首席科學(xué)家 Ilya Sutskever 將與此前的對齊團(tuán)隊負(fù)責(zé)人 Jan Leike 共同領(lǐng)導(dǎo)新部門。
而成員不光包括 OpenAI 自己的員工,也包括來自其它公司的研究人員。
Ilya Sutskever 是 2012 年開啟深度學(xué)習(xí)時代的 AlexNet 作者之一,也是 AlphaGo 作者之一,此前已將 AI 對齊作為他的核心研究重點,總引用數(shù)超過 40 萬。
Jan Leike 則是 ChatGPT 的前身 InstructGPT 論文作者之一,并且早在 2017 年就參與了 OpenAI 與 DeepMind 合作的人類反饋強(qiáng)化學(xué)習(xí)方法。
Jan Leike 認(rèn)為,OpenAI 此次投資很可能比全人類此前對 AI 對齊研究的所有投資加起來還多。
算上這二位,目前新團(tuán)隊已有 10 位成員。
新一輪招聘也隨之開啟,分為研究經(jīng)理(年薪 42 萬-50 萬美元),研究科學(xué)家與研究工程師(年薪 24.5 萬-45 萬美元),兩種級別三個崗位。
誰來監(jiān)管監(jiān)管者?
對于 OpenAI 的大動作,學(xué)術(shù)界有不同觀點。
認(rèn)同的學(xué)者表示:自然智能通過競爭的進(jìn)化獎勵產(chǎn)生,AI 通過對齊人類利益的進(jìn)化獎勵產(chǎn)生,并期待未來的效果。
但也有人表示 OpenAI 從根本上就錯誤地理解了“對齊”這個概念。
他認(rèn)為對齊不能是強(qiáng)制控制,而應(yīng)該是使雙方利益一致,類似于“堵不如疏”。
有網(wǎng)友吐槽“真不敢相信,AGI 很可能在鴿了很久的《上古卷軸 6》游戲之前到來?!?/p>
評論區(qū)有人指出,到時候你想玩什么游戲讓 AI 去做就好了。
也有網(wǎng)友靈魂發(fā)問,誰又來監(jiān)管監(jiān)管者呢?
參考鏈接:
[1]https://openai.com/blog/introducing-superalignment
[2]https://twitter.com/OpenAI/status/1676638358087553024
[3]https://www.reddit.com/r/singularity/comments/14rh1l1/superintelligence_possible_in_the_next_7_years/
本文來自微信公眾號:量子位 (ID:QbitAI),作者:夢晨
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。