設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

AI 科學(xué)家吳恩達長文盛贊 DeepSeek:中國正在生成式 AI 領(lǐng)域追趕美國

2025/2/1 16:36:16 來源:IT之家 作者:清源 責(zé)編:清源

IT之家 2 月 1 日消息,斯坦福大學(xué)計算機科學(xué)系客座教授吳恩達(Andrew Yan-Tak Ng)昨日在 X 平臺發(fā)文力挺 DeepSeek:“中國在生成式 AI 領(lǐng)域正追趕美國”。

IT之家附吳恩達觀點大意如下:

本周關(guān)于 DeepSeek 的討論讓人們更加清晰地看到了幾個顯而易見的發(fā)展趨勢:

  • 中國在生成式 AI 方面正在追趕美國,這對 AI 供應(yīng)鏈產(chǎn)生了深遠影響。

  • 開放權(quán)重模型正在將基礎(chǔ)模型層轉(zhuǎn)變?yōu)樯唐坊a(chǎn)品,為應(yīng)用開發(fā)者提供了更多機會。

  • 擴大規(guī)模并非推動 AI 進步的唯一途徑。盡管在處理能力上有著極大的關(guān)注和炒作,但算法創(chuàng)新正迅速降低訓(xùn)練成本。

大約一周前,總部位于中國的 DeepSeek 發(fā)布了其令人矚目的 DeepSeek-R1 模型,該模型在基準測試中的表現(xiàn)與 OpenAI 的 o1 相當(dāng)。更為重要的是,DeepSeek-R1 作為開放權(quán)重模型發(fā)布,并采用了寬松的 MIT 許可。上周在達沃斯會議上,許多非技術(shù)領(lǐng)域的商業(yè)領(lǐng)袖向我詢問了這款模型。而在周一,股市出現(xiàn)了“DeepSeek 拋售”:英偉達和其他多家美國科技公司的股價大幅下跌。(截至寫作時,一些股價已有回升。)

DeepSeek 讓許多人意識到以下幾點:

中國在生成式 AI 領(lǐng)域正趕超美國。2022 年 11 月 ChatGPT 發(fā)布時,美國在這一領(lǐng)域遠遠領(lǐng)先于中國。然而,過去兩年里,中國的進步非常迅速,許多來自中國的模型,如通義千問(我的團隊已經(jīng)使用了幾個月)、Kimi、書生 InternVL 和 DeepSeek,已經(jīng)顯著縮小了與美國的差距,尤其在視頻生成領(lǐng)域,中國已在某些時刻超越了美國。

我對 DeepSeek-R1 作為開放權(quán)重模型發(fā)布感到非常高興,同時它的技術(shù)報告也提供了大量細節(jié)。而與此形成對比的是,一些美國公司通過炒作人類滅絕等假設(shè)性的 AI 危機來推動監(jiān)管,試圖壓制開源發(fā)展。

如今,開源 / 開放權(quán)重模型已成為 AI 供應(yīng)鏈的核心組成部分,許多公司將會使用這些模型。如果美國繼續(xù)打壓開源,最終中國將在這一領(lǐng)域占據(jù)主導(dǎo)地位,許多企業(yè)將使用更多符合中國價值觀的模型,而非美國的。

開放權(quán)重模型正在加速基礎(chǔ)模型層的商品化。正如我之前提到的,大語言模型 token 價格迅速下降,開放權(quán)重模型加劇了這一趨勢,也讓開發(fā)者擁有更多選擇。OpenAI 的 o1 每百萬輸出 token 的費用為 60 美元,而 DeepSeek-R1 的費用僅為 2.19 美元,這種近 30 倍的價格差異引起了許多人的關(guān)注。

基礎(chǔ)模型的訓(xùn)練與 API 銷售業(yè)務(wù)非常艱難。許多公司仍在尋找收回巨額訓(xùn)練成本的途徑。紅杉資本的文章《AI 的 6000 億美元問題》很好地說明了這一挑戰(zhàn)(不過需要強調(diào)的是,我認為基礎(chǔ)模型公司做得非常好,也希望它們能夠成功)。相比之下,在基礎(chǔ)模型上構(gòu)建應(yīng)用程序則為商業(yè)提供了更多機會。既然其他公司已經(jīng)花費數(shù)十億美元訓(xùn)練這些模型,現(xiàn)在你只需要花很少的錢就可以使用它們,開發(fā)客戶服務(wù)機器人、電子郵件摘要工具、AI 醫(yī)生、法律文書助手等。

擴大規(guī)模并非 AI 進步的唯一方式。圍繞規(guī)模擴展模型已成為推動 AI 進步的重要話題。誠然,我曾是規(guī)模擴展的支持者之一。許多公司通過炒作這一話題籌集了巨額資金,宣稱通過更多資本,它們能夠擴大規(guī)模并可預(yù)見地推動進步。因此,規(guī)模擴展成為了焦點,而忽略了更多進步的途徑。由于美國對 AI 芯片的禁運,DeepSeek 團隊不得不在性能較低的 H800 GPU 上進行優(yōu)化,以替代 H100 GPU,最終使得模型訓(xùn)練的計算成本(不包括研究費用)低于 600 萬美元。

是否這會減少計算需求仍待觀察。降低每單位商品的價格有時會促使人們花費更多的總金額來購買該商品。我認為,在長期內(nèi),智能和計算的需求幾乎沒有上限,因此,即使變得便宜,我依然看好人類對智能的需求會越來越大。

我看到在 X 上關(guān)于 DeepSeek 進展的各種解讀,仿佛它是一面鏡子,反射出每個人不同的看法。我認為 DeepSeek-R1 涉及到的地緣政治問題仍有待解決,同時它也為 AI 應(yīng)用構(gòu)建者帶來了極大的機會。我的團隊已經(jīng)在構(gòu)思一些新想法,這些想法只有通過使用一個開放的先進推理模型才能實現(xiàn)。現(xiàn)在是一個構(gòu)建的好時機!

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:人工智能,吳恩達,DeepSeek

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知