設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

DeepSeek V3 和 R1 模型完成海光 DCU 國產(chǎn)化適配并正式上線

2025/2/4 14:01:56 來源:IT之家 作者:歸瀧(實習(xí)) 責(zé)編:歸瀧
感謝IT之家網(wǎng)友 刺客 的線索投遞!

IT之家 2 月 4 日消息,中科曙光國家先進(jìn)計算產(chǎn)業(yè)創(chuàng)新中心有限公司昨日發(fā)文宣布,海光信息技術(shù)團(tuán)隊成功完成 DeepSeek V3 和 R1 模型與海光 DCU(深度計算單元)國產(chǎn)化適配,并正式上線。

用戶在“光合開發(fā)者社區(qū)”中的“光源”板塊訪問并下載相關(guān)模型,或登錄光源官網(wǎng)搜索“DeepSeek”,即可基于 DCU 平臺部署和使用相關(guān)模型。

據(jù)介紹,DeepSeek V3 和 R1 模型基于 Transformer 架構(gòu),采用了 Multi-Head Latent Attention(MLA)和 DeepSeek MoE 兩大核心技術(shù)。MLA 通過減少 KV 緩存顯著降低了內(nèi)存占用,提升了推理效率;DeepSeek MoE 則通過輔助損失(auxiliary loss)實現(xiàn)了專家負(fù)載的智能平衡,進(jìn)一步優(yōu)化了模型性能。

IT之家查詢獲悉,DCU 是海光信息推出的高性能 GPGPU 架構(gòu) AI 加速卡,致力于為行業(yè)客戶提供自主可控的全精度通用 AI 加速計算解決方案。目前,DCU 已在科教、金融、醫(yī)療、政務(wù)、智算中心等多個領(lǐng)域?qū)崿F(xiàn)規(guī)?;瘧?yīng)用。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知