IT之家 9 月 6 日消息,面壁智能官方公眾號昨日(9 月 5 日)發(fā)布博文,宣布推出開源 MiniCPM3-4B AI 模型,聲稱“端側 ChatGPT 時刻到來”。
IT之家附上 MiniCPM 3.0 開源地址:
MiniCPM3-4B 是 MiniCPM 系列的第三代產(chǎn)品,整體性能超過了 Phi-3.5-mini-Instruct 和 GPT-3.5-Turbo-0125,媲美多款 70 億~90 億參數(shù)的 AI 模型。
相比 MiniCPM1.0 / MiniCPM2.0,MiniCPM3-4B 擁有更強大、更多用途的技能集,可用于更廣泛的用途。MiniCPM3-4B 支持函數(shù)調(diào)用和代碼解釋器。
下面是 3 個版本的模型結構(1->2->3)的區(qū)別:
詞表大?。?/strong>123K->73K->73K
模型層數(shù):40->52->62
隱藏層節(jié)點:2304->1536->2560
最大長度:4k->4K->32k
系統(tǒng)提示詞:不支持-> 不支持-> 支持
工具調(diào)用和代碼解釋器:不支持-> 不支持-> 支持
MiniCPM3-4B 有一個 32k 上下文窗口。MiniCPM3-4B 借助 LLMxMapReduce,不需要占用太高的內(nèi)存,可以處理理論上的無限上下文。
面壁智能還發(fā)布了 RAG 套件 MiniCPM-Embedding 模型和 MiniCPM-Reranker 模型,針對 RAG 場景還發(fā)布了微調(diào)版 MiniCPM3-RAG-LoRA 模型。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。