IT之家 10 月 30 日消息,昆侖萬維今日宣布開源百億級大語言模型「天工」Skywork-13B 系列,并配套開源了 600GB、150B Tokens 開源中文數(shù)據(jù)集。
昆侖萬維「天工」Skywork-13B 系列目前包括 130 億參數(shù)的兩大模型:Skywork-13B-Base 模型、Skywork-13B-Math 模型,IT之家附開源地址如下:
Skywork-13B 下載地址(Model Scope):https://modelscope.cn/organization/skywork
Skywork-13B 下載地址(Github):https://github.com/SkyworkAI/Skywork
除模型開源外,Skywork-13B 系列大模型還將開源 600GB、150B Tokens 的中文語料數(shù)據(jù)集 Skypile/Chinese-Web-Text-150B,號稱是目前最大的開源中文數(shù)據(jù)集之一。
同時,昆侖萬維「天工」Skywork-13B 系列大模型即將全面開放商用 —— 開發(fā)者無需申請,即可商用。
據(jù)介紹,本次開源的 Skywork-13B 系列模型在 CEVAL、CMMLU、MMLU、GSM8K 等幾大評估基準(zhǔn)中超越 LLaMA2-13B 等開源大模型(截至 10 月 25 日數(shù)據(jù))。
在中文文本創(chuàng)作領(lǐng)域的評測中,Skywork-13B 系列大模型的成績?nèi)缦?,在科技、金融、政?wù)、企業(yè)服務(wù)、文創(chuàng)、游戲等領(lǐng)域表現(xiàn)不錯。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。