設置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

“端側 ChatGPT 時刻到來”,面壁智能推出小鋼炮開源 MiniCPM3-4B AI 模型

2024/9/6 8:20:17 來源:IT之家 作者:故淵 責編:故淵

IT之家 9 月 6 日消息,面壁智能官方公眾號昨日(9 月 5 日)發(fā)布博文,宣布推出開源 MiniCPM3-4B AI 模型,聲稱“端側 ChatGPT 時刻到來”。

IT之家附上 MiniCPM 3.0 開源地址:

MiniCPM3-4B 是 MiniCPM 系列的第三代產(chǎn)品,整體性能超過了 Phi-3.5-mini-Instruct 和 GPT-3.5-Turbo-0125,媲美多款 70 億~90 億參數(shù)的 AI 模型。

相比 MiniCPM1.0 / MiniCPM2.0,MiniCPM3-4B 擁有更強大、更多用途的技能集,可用于更廣泛的用途。MiniCPM3-4B 支持函數(shù)調(diào)用和代碼解釋器。

下面是 3 個版本的模型結構(1->2->3)的區(qū)別:

  • 詞表大?。?/strong>123K->73K->73K

  • 模型層數(shù):40->52->62

  • 隱藏層節(jié)點:2304->1536->2560

  • 最大長度:4k->4K->32k

  • 系統(tǒng)提示詞:不支持-> 不支持-> 支持

  • 工具調(diào)用和代碼解釋器:不支持-> 不支持-> 支持

MiniCPM3-4B 有一個 32k 上下文窗口。MiniCPM3-4B 借助 LLMxMapReduce,不需要占用太高的內(nèi)存,可以處理理論上的無限上下文。

面壁智能還發(fā)布了 RAG 套件 MiniCPM-Embedding 模型和 MiniCPM-Reranker 模型,針對 RAG 場景還發(fā)布了微調(diào)版 MiniCPM3-RAG-LoRA 模型。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。

相關文章

關鍵詞:AI,模型

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應用 魔方 最會買 要知