設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

百川智能發(fā)布超千億參數(shù)大模型 Baichuan 3,號稱中文評測超越 GPT-4

2024/1/29 12:54:39 來源:IT之家 作者:汪淼 責編:汪淼

IT之家 1 月 29 日消息,百川智能今日發(fā)布超千億參數(shù)的大語言模型 Baichuan 3,在 CMMLU、GAOKAO 和 AGI-Eval 等評測中,Baichuan 3 號稱在中文任務(wù)上超越了 GPT-4。

圖片

圖片

在測試邏輯推理能力的 MCMLE、MedExam、CMExam 等醫(yī)療評測上,Baichuan 3 的中文效果同樣號稱超過了 GPT-4,是“中文醫(yī)療任務(wù)表現(xiàn)最佳的大模型”。

圖片

據(jù)介紹,百川智能在 Baichuan 3 訓練過程中提出了“動態(tài)數(shù)據(jù)選擇”、“重要度保持”以及“異步 CheckPoint 存儲”等多種技術(shù)手段及方案,穩(wěn)定訓練時間達到一個月以上,故障恢復(fù)時間不超過 10 分鐘。

百川智能官方表示,Baichuan 3 還突破“迭代式強化學習”技術(shù),進一步提升了語義理解和生成能力,在詩詞創(chuàng)作的格式、韻律、表意等方面進行了提升,對于宋詞這種格式多變,結(jié)構(gòu)深細、韻律豐富的高難度文體,生成的內(nèi)容亦能工整對仗、韻腳和諧,讓每個人都能創(chuàng)作出詠物、寄思的五言律詩、七言絕句,寫下的言志、抒情的“沁園春”、“定風波”。

圖片

圖片

百川智能成立于 2023 年 4 月 10 日,由前搜狗公司 CEO 王小川創(chuàng)立。目前 Baichuan 3 大模型已在百川智能官網(wǎng)上線,感興趣的IT之家小伙伴可以前往體驗。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:百川智能,Baichuan,大模型

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知