首頁(yè) > 智能時(shí)代>人工智能

DeepSeek-R1 持續(xù)震撼硅谷：躋身競(jìng)技榜前三，創(chuàng)始人梁文鋒采訪(fǎng)被“拿放大鏡”看

量子位 2025/1/25 14:56:09 責(zé)編：清源

評(píng)論：

“神秘東方力量”DeepSeek 給硅谷帶來(lái)的影響，還在不斷泛起漣漪 ——

剛剛，DeepSeek-R1 躋身大模型競(jìng)技榜前三。以開(kāi)源、便宜 20 倍的“身價(jià)”與 ChatGPT-4o（2024.11.20）并列。

DeepSeek-R1 持續(xù)震撼硅谷：躋身競(jìng)技榜前三，創(chuàng)始人梁文鋒采訪(fǎng)被“拿放大鏡”看

在復(fù)雜提示詞 / 風(fēng)格控制榜單上，R1 位列第一。

DeepSeek-R1 持續(xù)震撼硅谷：躋身競(jìng)技榜前三，創(chuàng)始人梁文鋒采訪(fǎng)被“拿放大鏡”看

目前結(jié)果來(lái)看，它在各個(gè)維度上都保持領(lǐng)先。

DeepSeek-R1 持續(xù)震撼硅谷：躋身競(jìng)技榜前三，創(chuàng)始人梁文鋒采訪(fǎng)被“拿放大鏡”看

在衡量模型編程開(kāi)發(fā)能力的 WebDev 分榜上，R1 位列第二，與閉源的 Claude 3.5 Sonnet 相差不到 40 分。

DeepSeek-R1 持續(xù)震撼硅谷：躋身競(jìng)技榜前三，創(chuàng)始人梁文鋒采訪(fǎng)被“拿放大鏡”看

網(wǎng)友實(shí)測(cè)體驗(yàn)表示，確實(shí)如此，R1 在 30 場(chǎng) battle 中只輸了 4、5 次。

DeepSeek-R1 持續(xù)震撼硅谷：躋身競(jìng)技榜前三，創(chuàng)始人梁文鋒采訪(fǎng)被“拿放大鏡”看

另一邊，硅谷對(duì) DeepSeek 的好奇不減。

畢竟，它可是一個(gè)“副業(yè)”。

DeepSeek-R1 持續(xù)震撼硅谷：躋身競(jìng)技榜前三，創(chuàng)始人梁文鋒采訪(fǎng)被“拿放大鏡”看

創(chuàng)始人梁文鋒的中文采訪(fǎng)更是被翻譯成英文，“拿著放大鏡”逐字認(rèn)真閱讀。

DeepSeek-R1 持續(xù)震撼硅谷：躋身競(jìng)技榜前三，創(chuàng)始人梁文鋒采訪(fǎng)被“拿放大鏡”看

他提出的觀(guān)點(diǎn)也被總結(jié)成箴言，在互聯(lián)網(wǎng)上流傳。

真正的差距不是 1 年或 2 年，而在于是原創(chuàng)還是模仿。

DeepSeek-R1 持續(xù)震撼硅谷：躋身競(jìng)技榜前三，創(chuàng)始人梁文鋒采訪(fǎng)被“拿放大鏡”看

圖靈獎(jiǎng)得主 LeCun 也為 DeepSeek 做出中肯評(píng)價(jià)：

它代表了開(kāi)源的力量。
這意味著，開(kāi)源模型正在超越專(zhuān)有模型。

DeepSeek-R1 持續(xù)震撼硅谷：躋身競(jìng)技榜前三，創(chuàng)始人梁文鋒采訪(fǎng)被“拿放大鏡”看

值得一提的是，同為開(kāi)源領(lǐng)域代表的 Meta 剛剛公布了 2025 年在 AI 領(lǐng)域的布局計(jì)劃：650 億美元，投算力、投人才。

有爆料稱(chēng)，Meta 內(nèi)部已經(jīng)因?yàn)?DeepSeek 感到恐慌。

“他們讓 OpenAI 一次又一次看清自己”

所以，在硅谷視角里，他們更關(guān)心 DeepSeek 的哪些信息？

最首要的莫過(guò)于，DeepSeek 如何賺錢(qián)。

挖到的信息有點(diǎn)出乎意料，或許 DeepSeek 還沒(méi)想賺錢(qián)的事。

控股 DeepSeek 的是幻方量化，他們有一批頂級(jí)科學(xué)家，有充裕的算力資源，DeepSeek 其實(shí)是一個(gè)“副產(chǎn)物”。
在 2023 年末我就聽(tīng)說(shuō)他們?cè)谧?DeepSeek。即使在當(dāng)時(shí)的中國(guó)，還沒(méi)有人把他們當(dāng)回事。

DeepSeek-R1 持續(xù)震撼硅谷：躋身競(jìng)技榜前三，創(chuàng)始人梁文鋒采訪(fǎng)被“拿放大鏡”看

其次，為何 DeepSeek 能成功。梁文鋒在 2023 年 5 月 2024 年 7 月接受暗涌的兩次采訪(fǎng)，也被老外扒出來(lái)了。

他們最關(guān)心的五個(gè)方面分別是：

1、創(chuàng)新第一性原則：與其他致力于快速商業(yè)化的中國(guó) AI 公司不同，DeepSeek 專(zhuān)注于基礎(chǔ)的 AGI 研究和創(chuàng)新。他們認(rèn)為，中國(guó)必須從全球人工智能發(fā)展的“搭便車(chē)者”轉(zhuǎn)變?yōu)椤柏暙I(xiàn)者”。梁文鋒說(shuō)，創(chuàng)新不完全是商業(yè)驅(qū)動(dòng)的，還需要好奇心和創(chuàng)造欲。

2、革命性架構(gòu)：DeepSeek V2 中采用的新型 MLA（多頭潛在注意力機(jī)制）架構(gòu)，把顯存占用降到了過(guò)去最常用的 MHA 架構(gòu)的 5%-13%，實(shí)現(xiàn)了成本大幅降低。它的推理成本僅為 Llama 370B 的 1/7、GPT-4 Turbo 的 1/70。

這并不是為了挑起一場(chǎng)價(jià)格戰(zhàn) —— 他們只是在“成本上稍微有點(diǎn)利潤(rùn)”來(lái)定價(jià)。這種創(chuàng)新架構(gòu)繼續(xù)應(yīng)用于 V3 和 R1 模型中。

3、獨(dú)特的公司文化和人才戰(zhàn)略：DeepSeek 保持著一個(gè)完全自下而上的組織結(jié)構(gòu)，為研究人員提供無(wú)限的計(jì)算資源，優(yōu)先看創(chuàng)造熱情而不是證書(shū)。他們的突破性創(chuàng)新來(lái)自年輕的本土人才 —— 中國(guó)本土的應(yīng)屆畢業(yè)生和年輕技術(shù)人才，而非海外招聘。

4、致力于開(kāi)源：盡管行業(yè)開(kāi)始趨向于閉源模型（OpenAI 和 Mistral），DeepSeek 仍致力于開(kāi)源，并認(rèn)為開(kāi)源對(duì)于建立一個(gè)強(qiáng)大的技術(shù)生態(tài)系統(tǒng)至關(guān)重要。梁文鋒認(rèn)為，在顛覆性技術(shù)面前，閉源形成的護(hù)城河是短暫的。

他們的真正價(jià)值在于建立一個(gè)具備創(chuàng)新能力的組織。

5、底層計(jì)算挑戰(zhàn)：盡管擁有足夠的資金和技術(shù)，DeepSeek 也面臨來(lái)自底層計(jì)算的挑戰(zhàn)和壓力。目前公司還沒(méi)有新的融資計(jì)劃。梁文鋒認(rèn)為，面臨的主要制約因素不是資金，而是高端算力的使用權(quán)，這些芯片對(duì)于訓(xùn)練先進(jìn) AI 模型至關(guān)重要。

除此之外，采訪(fǎng)中的諸多細(xì)節(jié)也被網(wǎng)友認(rèn)真品味。

原文中，梁文鋒被問(wèn)道：怎么看待做量化同時(shí)做大量基礎(chǔ)研發(fā)，不燒錢(qián)嗎？

他回答：一件激動(dòng)人心的事，或許不能單純用錢(qián)衡量。就像家里買(mǎi)鋼琴，一來(lái)買(mǎi)得起，二來(lái)是因?yàn)橛幸蝗杭庇谠谏厦鎻椬鄻?lè)曲的人。

海外網(wǎng)友感慨：

這幫人是一群有點(diǎn)理想化的“技術(shù)狂”，他們堅(jiān)信自己能搞出通用人工智能（AGI），而且他們確實(shí)有這個(gè)資源和天賦。我真是太喜歡他們了！

DeepSeek-R1 持續(xù)震撼硅谷：躋身競(jìng)技榜前三，創(chuàng)始人梁文鋒采訪(fǎng)被“拿放大鏡”看

此外也避免不了一些對(duì)比：

梁文鋒展現(xiàn)出一種完全不同的心態(tài)，他們的成功當(dāng)之無(wú)愧，我也很期待看到他們一次又一次讓“OpenAI”認(rèn)清自己。

DeepSeek-R1 持續(xù)震撼硅谷：躋身競(jìng)技榜前三，創(chuàng)始人梁文鋒采訪(fǎng)被“拿放大鏡”看

當(dāng)然放眼 AI 領(lǐng)域的整體發(fā)展，能夠看到 DeepSeek，對(duì)于所有人而言或許都是興奮的。

盡管我忍不住覺(jué)得他們有點(diǎn)天真，畢竟在商業(yè)化上他們有點(diǎn)“自斷后路”。但看到一個(gè)團(tuán)隊(duì)堅(jiān)持理想并取得成功，確實(shí)讓人覺(jué)得很欣慰。

DeepSeek-R1 持續(xù)震撼硅谷：躋身競(jìng)技榜前三，創(chuàng)始人梁文鋒采訪(fǎng)被“拿放大鏡”看

隨著 R1 的驚艷亮相，DeepSeek 正在兌現(xiàn)自己所說(shuō)的一切。拓寬技術(shù)邊界、堅(jiān)持開(kāi)源、專(zhuān)注于技術(shù)開(kāi)發(fā)……

那么，DeepSeek 是如何走到現(xiàn)在的呢？

用 AI 做量化，再回到 AI

梁文鋒本碩均就讀于浙江大學(xué)信息與電子工程學(xué)專(zhuān)業(yè)。

2008 年，梁文鋒畢業(yè)，開(kāi)始帶領(lǐng)團(tuán)隊(duì)使用機(jī)器學(xué)習(xí)等技術(shù)探索全自動(dòng)量化交易。

當(dāng)時(shí)量化在國(guó)內(nèi)還是個(gè)新鮮概念，能否賺錢(qián)是個(gè)未知數(shù)。2010 年滬深 300 股指期貨推出，量化投資迎來(lái)春天。據(jù)公開(kāi)信息顯示，梁文鋒團(tuán)隊(duì)正是乘上這股東風(fēng)，很快自營(yíng)資金超過(guò) 5 億元。

與此同時(shí)，深度學(xué)習(xí)浪潮的齒輪開(kāi)始轉(zhuǎn)動(dòng)，人工智能率先在硅谷爆發(fā)。

2015 年，梁文鋒與校友共同創(chuàng)立幻方量化。僅僅 1 年后，他們就推出了旗下第一個(gè) AI 模型，第一份由深度學(xué)習(xí)生成的交易倉(cāng)位上線(xiàn)執(zhí)行，使用 GPU 進(jìn)行計(jì)算。

2017 年，幻方量化宣稱(chēng)實(shí)現(xiàn)投資策略全面 AI 化。

2018 年，幻方量化確立 AI 為公司的主要發(fā)展方向。

AI 加持下，幻方量化旗下基金回報(bào)率遠(yuǎn)超同期滬深 300 指數(shù)。2019 年，資金管理規(guī)模突破百億元。

2019 年，梁文鋒在當(dāng)年的金牛獎(jiǎng)?lì)C獎(jiǎng)儀式上，發(fā)表主題演講《一名程序員眼里中國(guó)量化投資的未來(lái)》，這是他少見(jiàn)的公開(kāi)演講。

演講全文的確充滿(mǎn)“程序員視角”：

量化公司是沒(méi)有基金經(jīng)理的，基金經(jīng)理就是一堆服務(wù)器。人來(lái)做投資決策的時(shí)候，它是一種藝術(shù)，要憑感覺(jué)。程序來(lái)決策的時(shí)候，它是一種科學(xué)，它有最優(yōu)解。

也是這一年，幻方量化開(kāi)始大規(guī)模布局 AI 算力，搭建起“螢火一號(hào)”集群。2021 年，“螢火二號(hào)”落成。這樣的算力基建，成為如今 DeepSeek 快速奔跑的底層支撐。

2021 年，幻方量化成為國(guó)內(nèi)首家突破千億規(guī)模的的量化私募大廠(chǎng)，被稱(chēng)為國(guó)內(nèi)量化私募“四大天王”之一。

值得一提的是，在幻方量化的官網(wǎng)上，AI 基礎(chǔ)科學(xué)研究始終占據(jù)重要位置，包括在大模型浪潮前。

DeepSeek-R1 持續(xù)震撼硅谷：躋身競(jìng)技榜前三，創(chuàng)始人梁文鋒采訪(fǎng)被“拿放大鏡”看

幻方量化曾表示，多年以來(lái)，該公司堅(jiān)持把營(yíng)收的大部分投入人工智能領(lǐng)域，建設(shè)領(lǐng)先的 AI 硬件基礎(chǔ)設(shè)施，進(jìn)行大規(guī)模的研究，探索人類(lèi)未知的奧秘。

我們相信幾乎所有的創(chuàng)新都是從大膽嘗試和點(diǎn)滴積累中孕育而來(lái)。

2023 年，幻方量化將下場(chǎng)做大模型的獨(dú)立新組織命名為深度求索，并強(qiáng)調(diào)將專(zhuān)注于做真正人類(lèi)級(jí)別的人工智能。

目標(biāo)不是復(fù)刻 ChatGPT，而是研究和揭秘 AGI 的更多未知信息。

DeepSeek 的故事也就開(kāi)始于這一刻。

一個(gè) 80 后程序員在攪動(dòng)中國(guó)量化市場(chǎng)后，完成資金積累，組建起年輕蓬勃的團(tuán)隊(duì)，似乎又回到了他原本的起點(diǎn)、回到 AI，但產(chǎn)生的能量正在全球掀起駭浪。

One More Thing

值得一提的是，幻方量化還長(zhǎng)期向慈善機(jī)構(gòu)捐贈(zèng)，官網(wǎng)披露公司員工“一只平凡的小豬”個(gè)人捐助 1.38 億元，支持 15 家慈善機(jī)構(gòu)的 23 個(gè)公益項(xiàng)目，在全國(guó)范圍內(nèi)幫助弱勢(shì)群體，促進(jìn)社會(huì)的公平和發(fā)展。

爆料消息稱(chēng)，這個(gè)員工就是梁文鋒本人。

參考鏈接：

[1]https://www.reddit.com/r/LocalLLaMA/comments/1i6dlvj/inside_deepseeks_bold_mission_ceo_liang_wenfeng/
[2]https://www.threads.net/@yannlecun/post/DFNvN3euNEV?xmt=AQGzPcW8Rr7oXT6-rHIoKzBNL5x2PNnaprvJBL6uIhgoQA
[3]https://finance.eastmoney.com/a/202501223304127161.html
[4]https://mp.weixin.qq.com/s/r9zZaEgqAa_lml_fOEZmjg

本文來(lái)自微信公眾號(hào)：量子位（ID：QbitAI），作者：明敏

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

DeepSeek-R1 持續(xù)震撼硅谷：躋身競(jìng)技榜前三，創(chuàng)始人梁文鋒采訪(fǎng)被“拿放大鏡”看

“他們讓 OpenAI 一次又一次看清自己”

用 AI 做量化，再回到 AI

One More Thing

相關(guān)文章

DeepSeek-R1 持續(xù)震撼硅谷：躋身競(jìng)技榜前三，創(chuàng)始人梁文鋒采訪(fǎng)被“拿放大鏡”看