IT之家 12 月 23 日消息,百川智能今日發(fā)布全鏈路領域增強金融大模型 Baichuan4-Finance,融合 100B + 中英文金融知識,采用多層次質量評估體系進行篩選,由人民大學財政金融學院金融專家團隊全程參與定義和評估。
在中國人民大學財政金融學院新近發(fā)布的評測體系 FLAME 以及國內開源金融評測基準 FinancelQ 上,Baichuan4-Finance 均登上榜首,金融專業(yè)能力和場景應用能力領先 GPT-4o。
Baichuan4-Finance API 現已在百川智能官網正式上線,IT之家附測試成績如下:
FLAME-Cer 評測結果顯示,Baichuan4-Finance 在銀行、保險、基金、證券等多個資格認證領域的準確率均突破了 95%,整體準確率 93.62%,大幅領先 GPT-4o 和 XuanYuan3-70B-Chat,超出 GPT-4o 近 20%。
Baichuan4-Finance 在 FLAME-Sce 評測中,一級核心金融業(yè)務場景的整體可用率達 84.15%,金融數據計算、金融知識理論等場景的可用率超過 90%。
在國內開源金融評測基準 FinanceIQ 中,Baichuan4-Finance 同樣超越了 GPT-4o 和 XuanYuan3-70B,整體準確率達到 79.23%,領先 GPT-4o 近 13%。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。