設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

GPT-4 升級(jí)被曝引入 Q*:推理 / 數(shù)學(xué)更強(qiáng)廢話更少,OpenAI 重奪競(jìng)技場(chǎng)王位

量子位 2024/4/12 18:33:29 責(zé)編:問舟
感謝IT之家網(wǎng)友 Diixx 的線索投遞!

啥?新版 GPT-4 是在 Q * 的輸出上微調(diào)的?

在競(jìng)技場(chǎng)重回榜一的新版 GPT-4 Turbo,成功再次踩中大家嗨點(diǎn)。

它此次的性能提升體現(xiàn)在數(shù)學(xué)、推理、代碼上,而且輸出內(nèi)容廢話更少。

最讓大家感到興奮的是其數(shù)學(xué) / 推理能力,現(xiàn)在可以在一些問題上完勝其他大模型。比如“求 y=x^4-5x^2-x+4 和 y=x^2-3x 交點(diǎn)的 y 坐標(biāo)之和?!敝挥凶钚掳?GPT-4 Turbo 能測(cè)出來。

這條推特被公開承認(rèn)自己參與過 Q * 的 Lukasz Kaiser 轉(zhuǎn)發(fā)。

Noam Brown 也發(fā)推表示新版 GPT-4 Turbo 在推理能力上大幅提升 —— 要知道,這位 OpenAI 科學(xué)家一直被外界認(rèn)為正在研究 Q*。

各方信息匯總后,網(wǎng)友們一拍腦袋反應(yīng)過來,這其中會(huì)不會(huì)就引入了 Q * 啊?

數(shù)學(xué)方面的提升意味著其中可能包含了一個(gè)數(shù)學(xué)模型,可能是 Q*。

(以及他的數(shù)學(xué)題測(cè)試推特被 OpenAI 的人轉(zhuǎn)發(fā)了)

好家伙,難道 OpenAI 在悄悄搞大事?

新 GPT-4 的“新馬腳”?

OpenAI 官方公告表示,最新版本的 GPT-4 Turbo 全方位大提升,現(xiàn)在 ChatGPT 用戶可直接體驗(yàn)。

網(wǎng)友立馬沖去實(shí)測(cè),有人給出評(píng)估結(jié)果,特別是數(shù)學(xué) / 推理能力有了重大提升。

實(shí)際問題測(cè)試中,在多個(gè)數(shù)學(xué)推理題上,GPT-4 Turbo 都沒有翻車,但是如 Command-R plus、Clauede-3 Opus 等都有失誤。

比如一道乘電梯的推理題。陷阱在于這部神奇電梯無論坐幾層,最后都會(huì)停在一層。GPT-4 Turbo 理解了這層邏輯,最后給出了正確答案。

還有在修改二叉樹問題上,GPT-4 Turbo 不僅回答正確,而且過程清晰完整。

同時(shí)在“大海撈針”能力上,與之前版本對(duì)比,最新 GPT-4 Turbo 已經(jīng)是初版 GPT-4 能力的 4.3 倍。

競(jìng)技場(chǎng)的結(jié)果表明,在代碼能力方面,GPT-4 Turbo 也更強(qiáng)了。

文本輸出方面變得更加簡(jiǎn)潔。

生成代碼也少了很多廢話(下圖右側(cè)為新版本)。

有人補(bǔ)充說,生成速度上也更快了。

神秘 Q*:OpenAI 的最大秘密?

現(xiàn)在 Q * 已經(jīng)成了 OpenAI 的流量密碼了,只要出現(xiàn)這個(gè)關(guān)鍵字,網(wǎng)友們都會(huì)興奮不已。

畢竟當(dāng)初奧特曼宮斗大戲就和它有關(guān)聯(lián),還有人發(fā)出警告,Q * 預(yù)示著 AGI 即將出現(xiàn)。

不過官方一直沒有公開承認(rèn)過這個(gè)項(xiàng)目的存在,奧特曼拒絕回答,Transformer 作者公開承認(rèn)參與 Q * 也被 OpenAI 公關(guān)跳起來捂嘴。

從目前各方透露的信息來看,Q * 專注于邏輯和數(shù)學(xué)推理能力,數(shù)學(xué)能力突出。

Transformer 作者之一 Lukasz Kaiser 承認(rèn)自己參與了這個(gè)項(xiàng)目。

德?lián)?AI 之父、前 FAIR(Meta)研究科學(xué)家 Noam Brown 也被視為是 Q * 項(xiàng)目的重要成員(推測(cè)來自 LeCun)。

他加入 OpenAI 的動(dòng)作也被外界視為分析 Q * 的一個(gè)線索,“有理由懷疑 Q 是將 LLM 和 AlphaGo 結(jié)合起來,并用強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練”。

Noam Brown 開發(fā)出了第一個(gè)在打撲克牌上超越人類的 AI,后來加入 Meta 致力于讓 AI 學(xué)會(huì)玩 Diplomacy(外交游戲)。

目前,關(guān)于 Q * 的準(zhǔn)確信息還是非常少??赡軍W特曼還在等一個(gè)合適的時(shí)機(jī)來回應(yīng)外界。

One More Thing

btw,網(wǎng)友們意外捉到總裁 Brockman 轉(zhuǎn)發(fā)的一個(gè)視頻演示里的提示詞是:

創(chuàng)建一個(gè) python 腳本,使用 pytube 庫從 YouTube 下載視頻。

看來大家拿 GPT-4 干的事也都差不多嘛(doge)。

參考鏈接:

  • [1]https://twitter.com/lukaszkaiser

  • [2]https://twitter.com/skirano/status/1778122305471705489

  • [3]https://twitter.com/7oponaut/status/1777971159478194256

  • [4]https://twitter.com/ai_for_success/status/1778073765748064678

  • [5]https://www.understandingai.org/p/how-to-think-about-the-openai-q-rumors

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:OpenAIChatGPT

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知