IT之家 2 月 18 日消息,法國 AI 初創(chuàng)企業(yè) Mistral AI 當?shù)貢r間昨日宣布推出其首個專業(yè)區(qū)域語言模型 Saba。該模型在源自中東與南亞的精選數(shù)據(jù)集上訓練,能以相對較小的規(guī)模為上述區(qū)域用戶提供更準確、相關(guān)的回應(yīng)。
Saba 模型參數(shù)規(guī)模為 32B,支持本地單 GPU 系統(tǒng)部署。Mistral AI 給出的數(shù)據(jù)顯示 Saba 在阿拉伯語的模型基準測試中明顯優(yōu)于同參數(shù)規(guī)模的 Mistral Small 3 24B,在同更大參數(shù)模型的比較里也毫不遜色。
同時,由于中東與南亞持續(xù)不斷的文化交流,Mistral Saba 除阿拉伯語語外也支持多種印度起源語言,尤其是以泰米爾語為代表的南印度達羅毗荼語系諸語種(IT之家注:該語系使用者總數(shù)達 2.5 億人)。
Mistral AI 認為,要讓 AI 無處不在就需要解決各種文化和語言問題。目前較大規(guī)模的通用模型在多種語言上都有良好表現(xiàn),但缺乏語言細微差別、文化背景和深入的區(qū)域知識,無法為具有強大區(qū)域背景的用例提供服務(wù),而這就是 Mistral Saba 等專精特定語言的較小模型的用武之地。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。