Meta 員工在 TeamBlind 爆料,點(diǎn)燃了一把火。自詡開源先鋒的 Meta,直接被 DeepSeek 這家中國公司整得無地自容。不僅工程師爭分奪秒復(fù)現(xiàn)模型,年薪超過 DeepSeek 訓(xùn)練成本的高管們,心底也有點(diǎn)虛。
今天,Meta 員工在匿名社區(qū) TeamBlind 上的一個(gè)帖子,在業(yè)內(nèi)被傳瘋了。
DeepSeek,真實(shí)地給了美國人億點(diǎn)點(diǎn)「震撼」。
DeepSeek R1 是世界上首個(gè)與 OpenAI o1 比肩的 AI 模型,而且與 o1 不同,R1 還是開源模型「Open Source Model」,比 OpenAI 還 Open!
更有人曝料,DeepSeek 還只是個(gè)「副項(xiàng)目」,主業(yè)根本不是搞大模型!
這不,OpenAI 還沒慌呢,Meta 先慌了!
畢竟 Meta 一直自詡開源先鋒,但 DeepSeek 這種程度的開源,直接把它們拍在沙灘上。
更可怕的是,DeepSeek 的成本也太太太低了,這么比起來,Meta 拿著超高預(yù)算的團(tuán)隊(duì),就顯得很尷尬。
那些一個(gè)人拿的薪資,就超過整個(gè) DeepSeek V3 訓(xùn)練成本(僅 550 萬美元)的高管,尤其如坐針氈。
根據(jù)內(nèi)部 Meta 內(nèi)部人士爆料,DeepSeek 去年的 V3,已經(jīng)給他們壓力了。
現(xiàn)在,Meta 的工程師正在抓緊一切時(shí)間,爭分奪秒地分析 DeepSeek,試圖復(fù)制其中一切可能的技術(shù)。
以前,是全世界追著美國的大模型拿著放大鏡研究,現(xiàn)在情況竟倒轉(zhuǎn)了過來,美國人也開始逆向工程了。今夕是何夕?
中國大模型的狂飆猛進(jìn),真的讓我們感到了魔幻現(xiàn)實(shí)主義的味道。
Meta 工程師嚇瘋了
TeamBlind 上的帖子,全文曝料如下:
一切源于 DeepSeek V3 的出現(xiàn),它在基準(zhǔn)測試中已經(jīng)讓 Llama 4 相形見絀。更讓人難堪的是,一家「僅用 550 萬美元訓(xùn)練預(yù)算的中國公司」就做到了這一點(diǎn)。
工程師們正在爭分奪秒地分析 DeepSeek,試圖復(fù)制其中的一切可能技術(shù)。這絕非夸張。
管理層正為如何證明 GenAI 研發(fā)部門的巨額投入而發(fā)愁。當(dāng)部門里一個(gè)高管的薪資就超過訓(xùn)練整個(gè) DeepSeek V3 的成本,而且這樣的高管還有數(shù)十位,他們該如何向高層交代?
DeepSeek R1 的出現(xiàn)讓情況更加嚴(yán)峻。具體細(xì)節(jié)屬于機(jī)密,不便透露,不過很快就會公開了。
這本該是一個(gè)以工程為導(dǎo)向的精簡部門,但因?yàn)樘嗳讼胍忠槐?,人為膨脹招聘?guī)模,最終導(dǎo)致人人都付出了代價(jià)。
在成本上,「一個(gè)高管 = DeepSeek V3」,這對給高管們開出天價(jià)年薪的硅谷大廠們,實(shí)在是啪啪打臉。
更是有網(wǎng)友被震驚到:「DeepSeek R1 在 OpenAI、Meta、Grok 以及谷歌的屁股下點(diǎn)了一把火,就像 Open AI 在第一次推出 ChatGPT 時(shí)那樣震撼。如果去掉人力瓶頸,達(dá)到 o1 級性能真的不需要花太多錢!!」
有網(wǎng)友認(rèn)為,在這次 AI 浪潮中,Meta 的確落后了。
但也有網(wǎng)友為 Meta 解釋,畢竟 Meta 已經(jīng)開始行動了,雖然在 GenAI 領(lǐng)域的確「人浮于事」。
甚至,這個(gè)來自中國的 AI 已經(jīng)上了美國的新聞。措辭非??鋸?——「中國初創(chuàng)企業(yè) DeepSeek,威脅了美國 AI 的主導(dǎo)地位?!?/p>
「否認(rèn)、憤怒、絕望、接受,美國人正在進(jìn)行艱難的心理重建。這是他們歷史上從未見過的最強(qiáng)對手?!?/p>
不到 600 萬美元的成本,就能訓(xùn)出一個(gè)如此強(qiáng)的模型,這簡直是徹底扯掉了美國金融業(yè)的遮羞布。AI 產(chǎn)業(yè),真的需要動輒數(shù)萬億美元的投資么?
連帶著,特朗普和阿爾特曼搞的 5000 億美元星際之門,也一下子變得可疑了起來。
DeepSeek-R1 有多強(qiáng)?
「花小錢辦大事」,可見 DeepSeek 團(tuán)隊(duì)的確有「獨(dú)門秘籍」,在技術(shù)上恐怕也超越了 OpenAI。
DeepSeek 還發(fā)表了相關(guān)論文,介紹了 DeepSeek-R1 的大規(guī)模強(qiáng)化學(xué)習(xí)(RL)訓(xùn)練、未經(jīng)過監(jiān)督微調(diào)(SFT)作為預(yù)處理步驟等技術(shù)細(xì)節(jié)。
這種「技術(shù)自信」,讓部分美國網(wǎng)友都開始了「反思」。
為何 AI 圈,如此懼怕 DeepSeek?
來自 VB 最新一篇獨(dú)家文章,特意將 AI 界黑馬 DeepSeek 引發(fā) AI 界轟動做了全面分析。
就在幾天前,只有最專業(yè)的極客們才聽說過 DeepSeek。
它是一家成立于 2015 年幻方量化公司,背后投資者 High-Flyer Capital Management。
直到過去幾天,這家公司迅速成為硅谷最受關(guān)注的顛覆者,這主要?dú)w功于 DeepSeek R1 的誕生。
不用 SFT,僅憑強(qiáng)化學(xué)習(xí)就讓模型推理性能堪比 o1,而且在多項(xiàng)基準(zhǔn)測試中,R1 甚至超越了 o1。
令人瞠目結(jié)舌的是,如此強(qiáng)大的模型,訓(xùn)練成本僅 500 萬美金,使用的 GPU 數(shù)量也遠(yuǎn)遠(yuǎn)低于 OpenAI。
不僅如此,他們直接將其開源,Hugging Face 下載量和活躍度直接爆表。
而且,開發(fā)者可以自由微調(diào)訓(xùn)練,API 成本要比同等 o1 模型低 90% 還要多。
與 OpenAI 僅低性能模型上提供網(wǎng)頁搜索不同,DeepSeek 直接將 R1 與搜索功能深度整合。
在一步一步策略中,這家中國公司完勝了 OpenAI。
第一個(gè),但不是最后一個(gè)
這也不會是最后一個(gè),挑戰(zhàn)硅谷巨頭主導(dǎo)地位的中國 AI 模型。
最近,字節(jié)全新發(fā)布了「豆包 1.5 Pro」,在第三方基準(zhǔn)測試中,其性能與 GPT-4o 模型相當(dāng),但成本僅為后者的 1/50。
中國模型的快速迭代,已經(jīng)引起國際關(guān)注:
《經(jīng)濟(jì)學(xué)人》雜志剛剛發(fā)表了一篇關(guān)于 DeepSeek 成功以及其他中國企業(yè)的成功。
政治評論員 Matt Bruenig 的實(shí)際體驗(yàn),也更加印證了中國 AI 模型的實(shí)力。
最后一句話總結(jié):中國 AI 崛起了,美國還得適應(yīng)。
參考資料:
https://x.com/ClaudiuDP/status/1882460975661781376
https://www.teamblind.com/post/Meta-genai-org-in-panic-mode-KccnF41n
https://x.com/MatthewBerman/status/1882488222896521396
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。