設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

自家芯片助力:SambaNova 推出“最快”DeepSeek-R1 671B 模型推理云服務(wù)

2025/2/21 16:48:02 來(lái)源:IT之家 作者:溯波(實(shí)習(xí)) 責(zé)編:溯波

IT之家 2 月 21 日消息,AI 芯片與解決方案企業(yè) SambaNova 宣布在其基于自研 SN40L RDU 處理器的云平臺(tái)上推出號(hào)稱“市面最快”的 DeepSeek-R1 671B 模型推理云服務(wù),并表示其 token 輸出速度可達(dá)每 prompt 每秒 198 個(gè)。

SambaNova 的 SN40L RDU 芯片基于臺(tái)積電 5nm 制程,BF16 算力可達(dá) 638 TFLOPS。其采用了一種三層存儲(chǔ)結(jié)構(gòu):片上的 520MB SRAM 緩存、2.5D 封裝集成的 64GB HBM 內(nèi)存、片外的 1.5TB 超大容量 DDR DRAM 內(nèi)存,這使得單芯片能容納的參數(shù)遠(yuǎn)超一般競(jìng)品。

此外 SN40L RDU 在結(jié)構(gòu)上的靈活性使得其能動(dòng)態(tài)重新配置硬件資源和數(shù)據(jù)流,提升計(jì)算與訪存效率。

SambaNova 宣稱,其僅需一臺(tái)容納 16 個(gè) SN40L RDU 芯片的機(jī)架就能完成 DeepSeek-R1 671B 部署。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:SambaNova,DeepSeek,人工智能

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知