“神秘東方力量”DeepSeek 給硅谷帶來的影響,還在不斷泛起漣漪 ——
剛剛,DeepSeek-R1 躋身大模型競技榜前三。以開源、便宜 20 倍的“身價”與 ChatGPT-4o(2024.11.20)并列。
在復雜提示詞 / 風格控制榜單上,R1 位列第一。
目前結(jié)果來看,它在各個維度上都保持領(lǐng)先。
在衡量模型編程開發(fā)能力的 WebDev 分榜上,R1 位列第二,與閉源的 Claude 3.5 Sonnet 相差不到 40 分。
網(wǎng)友實測體驗表示,確實如此,R1 在 30 場 battle 中只輸了 4、5 次。
另一邊,硅谷對 DeepSeek 的好奇不減。
畢竟,它可是一個“副業(yè)”。
創(chuàng)始人梁文鋒的中文采訪更是被翻譯成英文,“拿著放大鏡”逐字認真閱讀。
他提出的觀點也被總結(jié)成箴言,在互聯(lián)網(wǎng)上流傳。
真正的差距不是 1 年或 2 年,而在于是原創(chuàng)還是模仿。
圖靈獎得主 LeCun 也為 DeepSeek 做出中肯評價:
它代表了開源的力量。
這意味著,開源模型正在超越專有模型。
值得一提的是,同為開源領(lǐng)域代表的 Meta 剛剛公布了 2025 年在 AI 領(lǐng)域的布局計劃:650 億美元,投算力、投人才。
有爆料稱,Meta 內(nèi)部已經(jīng)因為 DeepSeek 感到恐慌。
“他們讓 OpenAI 一次又一次看清自己”
所以,在硅谷視角里,他們更關(guān)心 DeepSeek 的哪些信息?
最首要的莫過于,DeepSeek 如何賺錢。
挖到的信息有點出乎意料,或許 DeepSeek 還沒想賺錢的事。
控股 DeepSeek 的是幻方量化,他們有一批頂級科學家,有充裕的算力資源,DeepSeek 其實是一個“副產(chǎn)物”。
在 2023 年末我就聽說他們在做 DeepSeek。即使在當時的中國,還沒有人把他們當回事。
其次,為何 DeepSeek 能成功。梁文鋒在 2023 年 5 月 2024 年 7 月接受暗涌的兩次采訪,也被老外扒出來了。
他們最關(guān)心的五個方面分別是:
1、創(chuàng)新第一性原則:與其他致力于快速商業(yè)化的中國 AI 公司不同,DeepSeek 專注于基礎(chǔ)的 AGI 研究和創(chuàng)新。他們認為,中國必須從全球人工智能發(fā)展的“搭便車者”轉(zhuǎn)變?yōu)椤柏暙I者”。梁文鋒說,創(chuàng)新不完全是商業(yè)驅(qū)動的,還需要好奇心和創(chuàng)造欲。
2、革命性架構(gòu):DeepSeek V2 中采用的新型 MLA(多頭潛在注意力機制)架構(gòu),把顯存占用降到了過去最常用的 MHA 架構(gòu)的 5%-13%,實現(xiàn)了成本大幅降低。它的推理成本僅為 Llama 370B 的 1/7、GPT-4 Turbo 的 1/70。
這并不是為了挑起一場價格戰(zhàn) —— 他們只是在“成本上稍微有點利潤”來定價。這種創(chuàng)新架構(gòu)繼續(xù)應用于 V3 和 R1 模型中。
3、獨特的公司文化和人才戰(zhàn)略:DeepSeek 保持著一個完全自下而上的組織結(jié)構(gòu),為研究人員提供無限的計算資源,優(yōu)先看創(chuàng)造熱情而不是證書。他們的突破性創(chuàng)新來自年輕的本土人才 —— 中國本土的應屆畢業(yè)生和年輕技術(shù)人才,而非海外招聘。
4、致力于開源:盡管行業(yè)開始趨向于閉源模型(OpenAI 和 Mistral),DeepSeek 仍致力于開源,并認為開源對于建立一個強大的技術(shù)生態(tài)系統(tǒng)至關(guān)重要。梁文鋒認為,在顛覆性技術(shù)面前,閉源形成的護城河是短暫的。
他們的真正價值在于建立一個具備創(chuàng)新能力的組織。
5、底層計算挑戰(zhàn):盡管擁有足夠的資金和技術(shù),DeepSeek 也面臨來自底層計算的挑戰(zhàn)和壓力。目前公司還沒有新的融資計劃。梁文鋒認為,面臨的主要制約因素不是資金,而是高端算力的使用權(quán),這些芯片對于訓練先進 AI 模型至關(guān)重要。
除此之外,采訪中的諸多細節(jié)也被網(wǎng)友認真品味。
原文中,梁文鋒被問道:怎么看待做量化同時做大量基礎(chǔ)研發(fā),不燒錢嗎?
他回答:一件激動人心的事,或許不能單純用錢衡量。就像家里買鋼琴,一來買得起,二來是因為有一群急于在上面彈奏樂曲的人。
海外網(wǎng)友感慨:
這幫人是一群有點理想化的“技術(shù)狂”,他們堅信自己能搞出通用人工智能(AGI),而且他們確實有這個資源和天賦。我真是太喜歡他們了!
此外也避免不了一些對比:
梁文鋒展現(xiàn)出一種完全不同的心態(tài),他們的成功當之無愧,我也很期待看到他們一次又一次讓“OpenAI”認清自己。
當然放眼 AI 領(lǐng)域的整體發(fā)展,能夠看到 DeepSeek,對于所有人而言或許都是興奮的。
盡管我忍不住覺得他們有點天真,畢竟在商業(yè)化上他們有點“自斷后路”。但看到一個團隊堅持理想并取得成功,確實讓人覺得很欣慰。
隨著 R1 的驚艷亮相,DeepSeek 正在兌現(xiàn)自己所說的一切。拓寬技術(shù)邊界、堅持開源、專注于技術(shù)開發(fā)……
那么,DeepSeek 是如何走到現(xiàn)在的呢?
用 AI 做量化,再回到 AI
梁文鋒本碩均就讀于浙江大學信息與電子工程學專業(yè)。
2008 年,梁文鋒畢業(yè),開始帶領(lǐng)團隊使用機器學習等技術(shù)探索全自動量化交易。
當時量化在國內(nèi)還是個新鮮概念,能否賺錢是個未知數(shù)。2010 年滬深 300 股指期貨推出,量化投資迎來春天。據(jù)公開信息顯示,梁文鋒團隊正是乘上這股東風,很快自營資金超過 5 億元。
與此同時,深度學習浪潮的齒輪開始轉(zhuǎn)動,人工智能率先在硅谷爆發(fā)。
2015 年,梁文鋒與校友共同創(chuàng)立幻方量化。僅僅 1 年后,他們就推出了旗下第一個 AI 模型,第一份由深度學習生成的交易倉位上線執(zhí)行,使用 GPU 進行計算。
2017 年,幻方量化宣稱實現(xiàn)投資策略全面 AI 化。
2018 年,幻方量化確立 AI 為公司的主要發(fā)展方向。
AI 加持下,幻方量化旗下基金回報率遠超同期滬深 300 指數(shù)。2019 年,資金管理規(guī)模突破百億元。
2019 年,梁文鋒在當年的金牛獎頒獎儀式上,發(fā)表主題演講《一名程序員眼里中國量化投資的未來》,這是他少見的公開演講。
演講全文的確充滿“程序員視角”:
量化公司是沒有基金經(jīng)理的,基金經(jīng)理就是一堆服務器。人來做投資決策的時候,它是一種藝術(shù),要憑感覺。程序來決策的時候,它是一種科學,它有最優(yōu)解。
也是這一年,幻方量化開始大規(guī)模布局 AI 算力,搭建起“螢火一號”集群。2021 年,“螢火二號”落成。這樣的算力基建,成為如今 DeepSeek 快速奔跑的底層支撐。
2021 年,幻方量化成為國內(nèi)首家突破千億規(guī)模的的量化私募大廠,被稱為國內(nèi)量化私募“四大天王”之一。
值得一提的是,在幻方量化的官網(wǎng)上,AI 基礎(chǔ)科學研究始終占據(jù)重要位置,包括在大模型浪潮前。
幻方量化曾表示,多年以來,該公司堅持把營收的大部分投入人工智能領(lǐng)域,建設領(lǐng)先的 AI 硬件基礎(chǔ)設施,進行大規(guī)模的研究,探索人類未知的奧秘。
我們相信幾乎所有的創(chuàng)新都是從大膽嘗試和點滴積累中孕育而來。
2023 年,幻方量化將下場做大模型的獨立新組織命名為深度求索,并強調(diào)將專注于做真正人類級別的人工智能。
目標不是復刻 ChatGPT,而是研究和揭秘 AGI 的更多未知信息。
DeepSeek 的故事也就開始于這一刻。
一個 80 后程序員在攪動中國量化市場后,完成資金積累,組建起年輕蓬勃的團隊,似乎又回到了他原本的起點、回到 AI,但產(chǎn)生的能量正在全球掀起駭浪。
One More Thing
值得一提的是,幻方量化還長期向慈善機構(gòu)捐贈,官網(wǎng)披露公司員工“一只平凡的小豬”個人捐助 1.38 億元,支持 15 家慈善機構(gòu)的 23 個公益項目,在全國范圍內(nèi)幫助弱勢群體,促進社會的公平和發(fā)展。
爆料消息稱,這個員工就是梁文鋒本人。
參考鏈接:
[1]https://www.reddit.com/r/LocalLLaMA/comments/1i6dlvj/inside_deepseeks_bold_mission_ceo_liang_wenfeng/
[2]https://www.threads.net/@yannlecun/post/DFNvN3euNEV?xmt=AQGzPcW8Rr7oXT6-rHIoKzBNL5x2PNnaprvJBL6uIhgoQA
[3]https://finance.eastmoney.com/a/202501223304127161.html
本文來自微信公眾號:量子位(ID:QbitAI),作者:明敏
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。