IT之家 8 月 8 日消息,王小川旗下百川智能今日宣布發(fā)布大模型產(chǎn)品 Baichuan-53B,官方表示,“Baichuan-53B 大模型目前在寫作、文本創(chuàng)作能力方面,已經(jīng)達到行業(yè)最好的水平”。
不過IT之家發(fā)現(xiàn),Baichuan-53B 定位“閉源大模型”,目前并沒有在 GitHub、HuggingFace 處公布相關信息。
官方宣稱,“Baichuan-53B 主要面向 B 端用戶提供服務,發(fā)布后,該大模型也將啟動內(nèi)測,預計下個月將會開放 API 等相關組件”。
在此之前,百川智能已經(jīng)發(fā)布了 Baichuan-7B、Baichuan-13B 兩個通用大語言模型,感興趣的小伙伴們可以在 GitHub 中找到相關內(nèi)容。
據(jù)官方介紹,Baichuan-7B 是一個 70 億參數(shù)量的中英文預訓練大模型,在 C-Eval、AGIEval 和 Gaokao 三個最具影響力的中文評估基準進行了綜合評估,并且均獲得了優(yōu)異成績,它已經(jīng)成為同等參數(shù)規(guī)模下中文表現(xiàn)最優(yōu)秀的原生預訓練模型。
Baichuan-13B 是由百川智能繼 Baichuan-7B 之后開發(fā)的包含 130 億參數(shù)的開源可商用的大規(guī)模語言模型,在中英文 Benchmark 上均取得同尺寸模型中最好的效果。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。