IT之家 11 月 3 日消息,據(jù)深言科技官方公眾號消息,由深言科技與清華大學(xué) NLP 實驗室共同研發(fā)的語鯨 LingoWhale-8B 模型目前已面向社會開源,對學(xué)術(shù)研究完全開放,允許免費商用。
IT之家經(jīng)過查詢得知,LingoWhale-8B 模型是擁有約 80 億參數(shù)的中英雙語大語言模型,在 C-Eval、MMLU、CMMLU 等多個權(quán)威的公開評測基準(zhǔn)上,在 10B 以下開源模型據(jù)稱“達(dá)到領(lǐng)先效果”。
不過官方同時聲稱,受模型參數(shù)量影響,大模型固有的幻覺問題、數(shù)學(xué)計算能力相對較弱、生成內(nèi)容有無法預(yù)見性等問題在 LingoWhale-8B 模型中仍然存在。
在性能方面,截至 10 月 24 日,在中文領(lǐng)域權(quán)威評測 C-Eval 中,LingoWhale-8B 模型的性能僅次于 GPT-4。在 C-Eval、CMMLU、GAOKAO 測評中,性能超過 GPT-3.5Turbo,在 10B 以下尺寸模型中性能處于領(lǐng)先位置。
官方給予了一些典型示例,以介紹 LingoWhale-8B 模型的特點。
官方據(jù)此表示,LingoWhale-8B 模型具有一定數(shù)學(xué)運算能力。
在以上示例中,LingoWhale-8B 模型能夠根據(jù)上文正確地列式并進(jìn)行運算,包括函數(shù)求導(dǎo)、函數(shù)值計算、切線方程計算等操作,并最終得到結(jié)果。
而在代碼聲稱方面,官方也同時提供了一些演示:
LingoWhale-8B 具有強(qiáng)大的代碼理解與生成能力,能夠更好地生成代碼并解決具體的問題。在本示例中,LingoWhale-8B 模型生成了詳細(xì)的 python 代碼以及注釋信息,幫助用戶更好地理解并使用生成的代碼。
在邏輯方面,官方也同樣進(jìn)行了舉例:
LingoWhale-8B 模型具有解決復(fù)雜邏輯推理任務(wù)的能力。在以上的例子中,LingoWhale-8B 將復(fù)雜的邏輯問題進(jìn)行拆解,按步驟進(jìn)行分析并解決問題。
上下文對話
樣例:
在以上示例中,LingoWhale-8B 模型表現(xiàn)出了較強(qiáng)的角色扮演、方案設(shè)計、長文本理解以及多輪對話能力,能夠根據(jù)用戶需求制定方案并組織結(jié)構(gòu)化的輸出,應(yīng)對更加復(fù)雜的任務(wù)場景。
知識百科
樣例 1:
官方表示,在上面兩個例子中,相較于 GPT-3.5,LingoWhale-8B 模型生成的結(jié)果更加準(zhǔn)確詳實。
經(jīng)過在大規(guī)模高質(zhì)量語料上的預(yù)訓(xùn)練,LingoWhale-8B 模型掌握了多個領(lǐng)域的知識,包括科學(xué)、歷史、文學(xué)、藝術(shù)等,能夠理解并回答各種知識相關(guān)問題,提供準(zhǔn)確詳細(xì)的答案。
IT之家的小伙伴們可以在官方 GitHub 頁面中獲取更多詳細(xì)信息:點此訪問
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。