首頁 > 智能時代>人工智能

o3-mini 思維鏈公開卻被曝光全是“作假”，阿爾特曼現(xiàn)身解釋

新智元 2025/2/7 12:14:48 責編：清源

評論：

OpenAI 實屬急了，剛剛官宣公開 o3-mini 思維鏈。令人意想不到的是，CoT 竟不是原生的，阿爾特曼現(xiàn)身解釋，全網(wǎng)炸鍋了。

OpenAI，真的被 DeepSeek 逼急了！

活久見，就在剛剛，OpenAI 把 o3-mini 的「思維鏈」公開了。

o3-mini 思維鏈公開卻被曝光全是“作假”，阿爾特曼現(xiàn)身解釋

比如問「怎么今天不是星期五啊??」？

在展示出來的 CoT 中，o3-mini 一步步思考，這個問題應該是用戶在搞幽默，覺得本周應該快結(jié)束了，結(jié)果還沒結(jié)束。因此，自己需要給一個聰明機智的回答。

然后它用 Zeller 公式計算后發(fā)現(xiàn)，2025 年 2 月 6 日的確是星期四，即使閏年的特殊情況也是如此。

最終，它回答說：今天的確是周四不是周五，日歷就是這么定的。然后提供了一番情緒價值，鼓勵用戶說：再忍忍，只差一天啦！

o3-mini 思維鏈公開卻被曝光全是“作假”，阿爾特曼現(xiàn)身解釋

不過，機智的大神們很快就發(fā)現(xiàn)了「華點」—— 這是「真的 CoT」嗎？

o3-mini 思維鏈公開卻被曝光全是“作假”，阿爾特曼現(xiàn)身解釋

沒多久，就破案了！

先是 OpenAI 研究員 Noam Brown 發(fā)文表示，這次放出來的并不是模型原始的 CoT。

隨后，Tibor Blaho 也發(fā)現(xiàn) —— 所謂的 CoT，無非就是個「總結(jié)器」而已。（手動狗頭）

o3-mini 思維鏈公開卻被曝光全是“作假”，阿爾特曼現(xiàn)身解釋

對此，阿爾特曼解釋道，我們正努力整理原始的 CoT 提升可讀性，并在必要時提供翻譯，盡量保持原始內(nèi)容的忠實度。

o3-mini 思維鏈公開卻被曝光全是“作假”，阿爾特曼現(xiàn)身解釋

他放出了四個 emoji，讓 o3-mini 在思維鏈中展示了一把推理過程

堅決不讓競爭對手看到 CoT 的具體過程，OpenAI 的防備心實在是有些重啊。

o3-mini 思維鏈公開卻被曝光全是“作假”，阿爾特曼現(xiàn)身解釋

OpenAI 研究員：看到 CoT 實時演示，是「啊哈時刻」

OpenAI 研究員 Noam Brown 表示，在 o1-preview 發(fā)布前，自己向他人介紹草莓時，看到 CoT 的實時演示，通常是他們的「啊哈時刻」。

他們清楚地意識到，這將是一件大事。

o3-mini 思維鏈公開卻被曝光全是“作假”，阿爾特曼現(xiàn)身解釋

對于全新的 o3-mini CoT，Noam Brown 放出了自己的獨家玩法：

你正在玩井字棋，使用 O。到目前為止，X 已經(jīng)在左上角和右下角落子，而你在中間位置落子。最優(yōu)的下一個動作是什么？請只回答你的動作，并畫出棋盤。

o3-mini 思維鏈公開卻被曝光全是“作假”，阿爾特曼現(xiàn)身解釋

Noam Brown 表示，o3-mini 是目前第一個能持續(xù)正確回答井字棋問題的模型。

好笑的是，他承認 CoT 其實有些不穩(wěn)定，但可以看到，它最終還是把這個問題給想明白了。

o3-mini 思維鏈公開卻被曝光全是“作假”，阿爾特曼現(xiàn)身解釋

有人指出，OpenAI 遮遮掩掩地放出這個高仿 CoT，其實比什么都不放還要糟。

因為真實的 CoT 可以充當 prompt 的調(diào)試器，幫我們引導模型；而總結(jié)性的 CoT 會造成混淆，引入錯誤，讓調(diào)試變得更加困難。

而 DeepSeek R1 最酷的一點，就是暴露了模型的 CoT 如何影響提示的效果。

o3-mini 思維鏈公開卻被曝光全是“作假”，阿爾特曼現(xiàn)身解釋

而且，總結(jié)版的 CoT 顯示得很慢。如果是原始的 o3-mini，應該在推理中有更快的生成速度。

o3-mini 思維鏈公開卻被曝光全是“作假”，阿爾特曼現(xiàn)身解釋

有人也橫向?qū)Ρ攘?OpenAI 和 DeepSeek 的 CoT，表示前者看起來實在太專業(yè)了，相比之下，還是 DeepSeek 的產(chǎn)品更自然。

o3-mini 思維鏈公開卻被曝光全是“作假”，阿爾特曼現(xiàn)身解釋

防止被「蒸餾」？

OpenAI 這波植入 CoT 總結(jié)器的做法，著實是被 DeepSeek R1 強勢崛起嚇到了。

o3-mini 發(fā)布當天，OpenAI 在 Reddit 開啟 AMA 在線問答中，網(wǎng)友曾提問，「我們能看到模型思考的所有 token 嗎」？

當時，阿爾特曼回復道，「我們很快就會展示一個更有幫助、更詳細的版本」。

o3-mini 思維鏈公開卻被曝光全是“作假”，阿爾特曼現(xiàn)身解釋

緊接著，OpenAI 首席產(chǎn)品官 Kevin Weil 提前暗示了，是否展示所有內(nèi)容還有待確定。

「我們知道用戶（至少是高級用戶）想要看到這些，所以 OpenAI 會找到一個合適的平衡點?！?/p>

o3-mini 思維鏈公開卻被曝光全是“作假”，阿爾特曼現(xiàn)身解釋

如今，當所有人終于見到了阿爾特曼所謂的「留到最后的好東西」，感受到的只有失望。

o3-mini 思維鏈公開卻被曝光全是“作假”，阿爾特曼現(xiàn)身解釋

畢竟，DeepSeek 早已這樣做了，而且還是完整的原始 CoT！

對此，OpenAI 發(fā)言人表示，「為了提高清晰度和安全性，我們增加了一個額外的后處理步驟，其中模型審查原始思維鏈，移除任何不安全的內(nèi)容，然后簡化任何復雜的思想。」

「此外，這個后處理步驟使非英語用戶能夠以他們的母語接收思維鏈，創(chuàng)造一個更易于訪問和友好的體驗。」

o3-mini 思維鏈公開卻被曝光全是“作假”，阿爾特曼現(xiàn)身解釋

話雖委婉，但知道的人都明白 OpenAI 針對的是誰。

參考資料：

https://x.com/btibor91/status/1887633671483760862
https://x.com/OpenAI/status/1887616278661112259
https://x.com/polynoamial/status/1887621287616651429

本文來自微信公眾號：新智元（ID：AI_era）原文標題：《突發(fā)！o3-mini 思維鏈公開，卻被曝光全是「作假」，奧特曼現(xiàn)身解釋網(wǎng)友炸鍋》

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

關鍵詞：OpenAI，o3

o3-mini 思維鏈公開卻被曝光全是“作假”，阿爾特曼現(xiàn)身解釋

OpenAI 研究員：看到 CoT 實時演示，是「啊哈時刻」

防止被「蒸餾」？

相關文章

o3-mini 思維鏈公開卻被曝光全是“作假”，阿爾特曼現(xiàn)身解釋

OpenAI 研究員：看到 CoT 實時演示，是「啊哈時刻」

防止被「蒸餾」？