設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

消息稱 Meta 成立 4 個小組研究 DeepSeek,基于此來改進(jìn)自家 Llama

2025/1/27 14:39:56 來源:IT之家 作者:遠(yuǎn)洋 責(zé)編:遠(yuǎn)洋
感謝IT之家網(wǎng)友 Hi_World、HH_KK 的線索投遞!

IT之家 1 月 27 日消息,據(jù) Information 網(wǎng)站,F(xiàn)acebook 母公司 Meta 成立了四個專門研究小組來研究量化巨頭幻方量化旗下的國產(chǎn)大模型 DeepSeek 的工作原理,并基于此來改進(jìn)旗下大模型 Llama。

其中兩個小組正在試圖了解幻方量化如何降低訓(xùn)練和運行 DeepSeek 的成本;第三個研究小組則正在研究幻方量化可能使用了哪些數(shù)據(jù)來訓(xùn)練其模型;第四個小組正在考慮基于 DeepSeek 模型屬性重構(gòu) Meta 模型的新技術(shù)。

1 月 20 日,DeepSeek-R1 推理大模型正式發(fā)布。據(jù)官方介紹,DeepSeek-R1 在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,性能比肩 OpenAI o1 正式版。

IT之家注意到,今日 Deepseek 應(yīng)用已登頂蘋果中國地區(qū)和美國地區(qū)應(yīng)用商店免費 App 下載排行榜,在美區(qū)下載榜上超越了 ChatGPT。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:DeepSeek,Meta

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知