設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

OpenAI 內(nèi)部模型曝光:已達(dá) GPT 4.5 水平,編程能力躋身全球 Top50 程序員

量子位 2025/2/9 11:56:04 責(zé)編:汪淼

除了 o1 / o3,OpenAI 另一個尚未公開的內(nèi)部推理模型曝光了。爆料者正是 CEO 阿爾特曼本人。

據(jù)他透露,與全球頂尖程序員相比,當(dāng)前這一內(nèi)部模型的編程能力已達(dá) Top50,甚至今年年底將排名第一。

而且針對大家近來尤為關(guān)注的算力問題,他更是直言:

在內(nèi)部,我們已經(jīng)達(dá)到了 GPT 4.5,而達(dá)到 GPT 5.5 并不需要 100 倍以上的計算能力。

除此之外,也是在東京大學(xué)的這場對話活動中,阿爾特曼由 AI 對教育的影響引出了更多話題,包括 AI 時代需要何種人才,以及一系列對內(nèi)部模型進(jìn)展的爆料。

這場對話由東京大學(xué)的校長(Teruo Fujii)和執(zhí)行副校長(Kaori Hayashi,女)主持,OpenAI 首席產(chǎn)品官 Kevin Weil 陪同阿爾特曼參加。

期間,他們暢談了 AI 的應(yīng)用和未來,并和學(xué)生進(jìn)行了面對面問答。

以下為重點(diǎn)內(nèi)容整理 & 摘錄。

內(nèi)部模型已達(dá) GPT 4.5,升級成 5.5 不再需要 100 倍算力升級

主持人簡短開場后,活動由學(xué)生提問開啟。

談及 AI 對教育的影響以及未來這一領(lǐng)域的發(fā)展,阿爾特曼直言教育是 OpenAI 最關(guān)注的幾個領(lǐng)域之一。

目前已經(jīng)能看到 ChatGPT 如何為學(xué)生提供各種輔助,未來類似 AI 工具只是改變了環(huán)境和部分人類習(xí)慣,對于人類來說可能是一種解放,不用過于擔(dān)心 AI 會改變一切。

另外,由于科學(xué)發(fā)現(xiàn)可能呈現(xiàn) 10~100 倍增速,由 AI 推動的生產(chǎn)力進(jìn)步可能極大促進(jìn)社會發(fā)展。

接下來副校長也提了一個問題,AI 時代需要怎樣的人才和技能?

對此阿爾特曼回應(yīng)稱,顯然人類現(xiàn)在已經(jīng)很難在數(shù)學(xué)、編程等具體任務(wù)中優(yōu)于 AI,因此圍繞弄清楚人們需要什么,去培養(yǎng)個人的開創(chuàng)性視野、快速適應(yīng)能力等也就更加重要。

Kevin 總結(jié)了一個更簡單的辦法,從現(xiàn)在開始將 AI 用起來,將之融入工作生活。一旦遇到新問題,嘗試用 AI 解決,以此逐漸跟上 AI 發(fā)展的步伐。

隨后,有學(xué)生提到了算力進(jìn)化問題,如果擁有 100 倍計算能力,可以期望 GPT 具有哪些新特性?

阿爾特曼稱,GPT 系列代表了曾經(jīng)的一個范式,專注預(yù)訓(xùn)練部分,GPT 1、2、3、4 的每一次升級都大致意味著 100 倍算力升級,隨之也產(chǎn)生了更強(qiáng)的能力。

目前內(nèi)部模型已經(jīng)達(dá)到 GPT 4.5 水平,照舊范式推測,達(dá)到 GPT 5.5 也需要 100 倍算力升級。然而,隨著 o1 系列推理模型取得新突破,一種令人難以置信的新計算效率誕生了。

這也意味著類似升級不再需要 100 倍算力,通過強(qiáng)化學(xué)習(xí)等技術(shù)我們也能得到更強(qiáng)的模型能力。

之后阿爾特曼梳理了 OpenAI 在推理模型上取得的一系列進(jìn)展,按網(wǎng)友總結(jié)下來就是:

編程能力上,o1 排名為 9800;僅過去幾個月,o3 將排名拉到第 175 位;如今一個內(nèi)部模型在基準(zhǔn)測試中排名約為 TOP50,而且年底就能直接登頂。

“我們希望朝著開源前進(jìn)”

接下來,阿爾特曼談到了更多未來計劃。

o3 的發(fā)布已經(jīng)為未來 6~12 個月的研究點(diǎn)明了方向,OpenAI 將盡可能推動小型、功能強(qiáng)大且速度極快的推理模型,同時也會繼續(xù)推進(jìn) GPT 6/7 等。

過程中,他著重 cue 到了 OpenAI 最近向 Pro 用戶推出的“深度研究”(Deep Research)功能,這是一個使用推理來綜合大量在線信息并為用戶完成多步驟研究任務(wù)的智能體,能幫助用戶進(jìn)行深入、復(fù)雜的信息查詢與分析。

在他看來,OpenAI 一大重點(diǎn)也是發(fā)布更多此類智能體,而且夢想之一是搞一個編程智能體。

總之,今年的主線任務(wù)是,到年底能夠有一個模型,即便用戶問出非常難的問題,它也能在運(yùn)行并思考幾小時后準(zhǔn)確作答。

然后看點(diǎn)來了,基于中國 DeepSeek 選擇開源后廣受好評這一事實(shí),有學(xué)生當(dāng)面提問:

是否有計劃重新考慮開源?

阿爾特曼這次倒是很干脆,直接承認(rèn)“我們將這樣做”,“我們希望朝著開源前進(jìn)”

但是(沒錯有一個但是),目前不知道開源什么,也不知道應(yīng)該選擇什么時候開源。

在這之后,阿爾特曼又回答了對腦機(jī)接口、太空工程和 AI 機(jī)器人等前沿科技的看法。

雖然眾所周知他和馬斯克不對付,但他這次竟然直言:

(像 Neuralink 這樣的)腦機(jī)接口公司是自己過去 6 個月見過的最有趣的

本文來自微信公眾號:量子位(ID:QbitAI),作者:一水,原標(biāo)題《OpenAI 內(nèi)部模型曝光!編程能力躋身全球 Top50 程序員,年底不再有人類對手》

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:OpenAI,編程AI,程序員AI

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知