IT之家 1 月 27 日消息,據(jù) CNBC 報(bào)道,微軟首席執(zhí)行官薩提亞?納德拉在瑞士達(dá)沃斯的世界經(jīng)濟(jì)論壇上表示:“DeepSeek 的新模型令人印象深刻,尤其是在如何高效開發(fā)開源模型并進(jìn)行推理計(jì)算方面,它的計(jì)算效率非常出色。我們應(yīng)當(dāng)非常、非常認(rèn)真地對(duì)待來自中國(guó)的這些技術(shù)進(jìn)展?!?/p>
近期,DeepSeek-R1 躋身大模型競(jìng)技榜前三,以開源、便宜 20 倍的“身價(jià)”與 ChatGPT-4o(2024.11.20)并列。綜合IT之家此前報(bào)道,本月亦有消息稱 Facebook 母公司 Meta 成立了四個(gè)專門研究小組來研究 DeepSeek 的工作原理,并基于此來改進(jìn)旗下大模型 Llama。
1 月 20 日,DeepSeek-R1 推理大模型正式發(fā)布。據(jù)官方介紹,DeepSeek-R1 在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,性能比肩 OpenAI o1 正式版。
不僅如此,今日 DeepSeek 應(yīng)用已登頂蘋果中國(guó)地區(qū)和美國(guó)地區(qū)應(yīng)用商店免費(fèi) App 下載排行榜,在美區(qū)下載榜上超越了 ChatGPT。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。