IT之家 2 月 1 日消息,近日,DeepSeek 發(fā)布 Janus Pro 模型,英特爾 Gaudi 2D AI 加速器現(xiàn)已針對該模型進(jìn)行優(yōu)化,為 AI 應(yīng)用的落地和規(guī)?;l(fā)展提供的支持。
IT之家獲悉,DeepSeek Janus 模型集成了多模態(tài)理解和生成功能。該模型首次采用統(tǒng)一的 Transformer 架構(gòu),突破了傳統(tǒng) AIGC 模型依賴多路徑視覺編碼的限制,實現(xiàn)了理解與生成任務(wù)的一體化支持。在此基礎(chǔ)上,Janus Pro 通過優(yōu)化訓(xùn)練策略和擴展模型規(guī)模,顯著提升了文生圖等功能的性能與穩(wěn)定性,并提供了 10 億參數(shù)和 70 億參數(shù)兩個版本。
英特爾 Gaudi 2D 憑借 2.45TB / 秒的高帶寬和 96GB HBM 大容量內(nèi)存,為 Janus Pro 模型提供了強大的計算支持,使其在生圖批處理任務(wù)中,隨著批量大小的增加,吞吐性能得到顯著提升,大幅縮短任務(wù)處理時間。
與此同時,結(jié)合英特爾 Optimum-Habana 框架的優(yōu)化,英特爾 Gaudi 2D 顯著提升了文生圖任務(wù)的吞吐性能和推理效率,僅需約 10 秒即可生成 16 張高質(zhì)量的圖片。而且,開發(fā)者僅需調(diào)整數(shù)行代碼,即可實現(xiàn)這一結(jié)果,極大降低了開發(fā)門檻和遷移成本。此外,DeepSeek 的蒸餾模型在至強和 Gaudi 平臺上也得到了支持。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。