設置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

o3-mini 思維鏈公開卻被曝光全是“作假”,阿爾特曼現(xiàn)身解釋

新智元 2025/2/7 12:14:48 責編:清源

OpenAI 實屬急了,剛剛官宣公開 o3-mini 思維鏈。令人意想不到的是,CoT 竟不是原生的,阿爾特曼現(xiàn)身解釋,全網(wǎng)炸鍋了。

OpenAI,真的被 DeepSeek 逼急了!

活久見,就在剛剛,OpenAI 把 o3-mini 的「思維鏈」公開了。

比如問「怎么今天不是星期五啊??」?

在展示出來的 CoT 中,o3-mini 一步步思考,這個問題應該是用戶在搞幽默,覺得本周應該快結(jié)束了,結(jié)果還沒結(jié)束。因此,自己需要給一個聰明機智的回答。

然后它用 Zeller 公式計算后發(fā)現(xiàn),2025 年 2 月 6 日的確是星期四,即使閏年的特殊情況也是如此。

最終,它回答說:今天的確是周四不是周五,日歷就是這么定的。然后提供了一番情緒價值,鼓勵用戶說:再忍忍,只差一天啦!

不過,機智的大神們很快就發(fā)現(xiàn)了「華點」—— 這是「真的 CoT」嗎?

沒多久,就破案了!

先是 OpenAI 研究員 Noam Brown 發(fā)文表示,這次放出來的并不是模型原始的 CoT。

隨后,Tibor Blaho 也發(fā)現(xiàn) —— 所謂的 CoT,無非就是個「總結(jié)器」而已。(手動狗頭)

對此,阿爾特曼解釋道,我們正努力整理原始的 CoT 提升可讀性,并在必要時提供翻譯,盡量保持原始內(nèi)容的忠實度。

他放出了四個 emoji,讓 o3-mini 在思維鏈中展示了一把推理過程

堅決不讓競爭對手看到 CoT 的具體過程,OpenAI 的防備心實在是有些重啊。

OpenAI 研究員:看到 CoT 實時演示,是「啊哈時刻」

OpenAI 研究員 Noam Brown 表示,在 o1-preview 發(fā)布前,自己向他人介紹草莓時,看到 CoT 的實時演示,通常是他們的「啊哈時刻」。

他們清楚地意識到,這將是一件大事。

對于全新的 o3-mini CoT,Noam Brown 放出了自己的獨家玩法:

你正在玩井字棋,使用 O。到目前為止,X 已經(jīng)在左上角和右下角落子,而你在中間位置落子。最優(yōu)的下一個動作是什么?請只回答你的動作,并畫出棋盤。

Noam Brown 表示,o3-mini 是目前第一個能持續(xù)正確回答井字棋問題的模型。

好笑的是,他承認 CoT 其實有些不穩(wěn)定,但可以看到,它最終還是把這個問題給想明白了。

有人指出,OpenAI 遮遮掩掩地放出這個高仿 CoT,其實比什么都不放還要糟。

因為真實的 CoT 可以充當 prompt 的調(diào)試器,幫我們引導模型;而總結(jié)性的 CoT 會造成混淆,引入錯誤,讓調(diào)試變得更加困難。

而 DeepSeek R1 最酷的一點,就是暴露了模型的 CoT 如何影響提示的效果。

而且,總結(jié)版的 CoT 顯示得很慢。如果是原始的 o3-mini,應該在推理中有更快的生成速度。

有人也橫向?qū)Ρ攘?OpenAI 和 DeepSeek 的 CoT,表示前者看起來實在太專業(yè)了,相比之下,還是 DeepSeek 的產(chǎn)品更自然。

防止被「蒸餾」?

OpenAI 這波植入 CoT 總結(jié)器的做法,著實是被 DeepSeek R1 強勢崛起嚇到了。

o3-mini 發(fā)布當天,OpenAI 在 Reddit 開啟 AMA 在線問答中,網(wǎng)友曾提問,「我們能看到模型思考的所有 token 嗎」?

當時,阿爾特曼回復道,「我們很快就會展示一個更有幫助、更詳細的版本」。

緊接著,OpenAI 首席產(chǎn)品官 Kevin Weil 提前暗示了,是否展示所有內(nèi)容還有待確定。

「我們知道用戶(至少是高級用戶)想要看到這些,所以 OpenAI 會找到一個合適的平衡點?!?/p>

如今,當所有人終于見到了阿爾特曼所謂的「留到最后的好東西」,感受到的只有失望。

畢竟,DeepSeek 早已這樣做了,而且還是完整的原始 CoT!

對此,OpenAI 發(fā)言人表示,「為了提高清晰度和安全性,我們增加了一個額外的后處理步驟,其中模型審查原始思維鏈,移除任何不安全的內(nèi)容,然后簡化任何復雜的思想。」

「此外,這個后處理步驟使非英語用戶能夠以他們的母語接收思維鏈,創(chuàng)造一個更易于訪問和友好的體驗。」

話雖委婉,但知道的人都明白 OpenAI 針對的是誰。

參考資料:

  • https://x.com/btibor91/status/1887633671483760862

  • https://x.com/OpenAI/status/1887616278661112259

  • https://x.com/polynoamial/status/1887621287616651429

本文來自微信公眾號:新智元(ID:AI_era)原文標題:《突發(fā)!o3-mini 思維鏈公開,卻被曝光全是「作假」,奧特曼現(xiàn)身解釋網(wǎng)友炸鍋》

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關文章

關鍵詞:OpenAI,o3

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應用 魔方 最會買 要知