IT之家 10 月 30 日消息,百川智能今日宣布推出 Baichuan2-192K 大模型。據介紹,該模型上下文窗口長度達 192K,能夠處理約 35 萬個漢字,號稱是目前全球最長的上下文窗口。
百川智能表示,Baichuan2-192K 是目前支持長上下文窗口最優(yōu)秀大模型 Claude2(100K 上下文窗口,實測約 8 萬字)的 4.4 倍,是 GPT-4(支持 32K 上下文窗口,實測約 2.5 萬字)的 14 倍。
IT之家注:上下文窗口長度是大模型的核心技術之一,通過更大的上下文窗口,模型能夠結合更多上下文內容獲得更豐富的語義信息,更好地捕捉上下文的相關性、消除歧義,進而更加準確、流暢地生成內容,提升模型能力。
Baichuan2-192K 在 Dureader、NarrativeQA、LSHT、TriviaQA 等 10 項中英文長文本問答、摘要的評測集上表現良好,有 7 項取得 SOTA。
百川智能表示,Baichuan2-192K 將以 API 調用和私有化部署的方式提供給企業(yè)用戶,目前百川智能已啟動 Baichuan2-192K 的 API 內測,開放給法律、媒體、金融等行業(yè)的核心合作伙伴。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。