深言科技聯(lián)合清華大學(xué)開源 LingoWhale-8B 模型：免費商用，號稱性能超 GPT-3.5 Turbo

2023/11/3 15:30:33 來源：IT之家作者：漾仔（實習(xí)） 責(zé)編：漾仔

評論：

IT之家 11 月 3 日消息，據(jù)深言科技官方公眾號消息，由深言科技與清華大學(xué) NLP 實驗室共同研發(fā)的語鯨 LingoWhale-8B 模型目前已面向社會開源，對學(xué)術(shù)研究完全開放，允許免費商用。

IT之家經(jīng)過查詢得知，LingoWhale-8B 模型是擁有約 80 億參數(shù)的中英雙語大語言模型，在 C-Eval、MMLU、CMMLU 等多個權(quán)威的公開評測基準(zhǔn)上，在 10B 以下開源模型據(jù)稱“達(dá)到領(lǐng)先效果”。

不過官方同時聲稱，受模型參數(shù)量影響，大模型固有的幻覺問題、數(shù)學(xué)計算能力相對較弱、生成內(nèi)容有無法預(yù)見性等問題在 LingoWhale-8B 模型中仍然存在。

在性能方面，截至 10 月 24 日，在中文領(lǐng)域權(quán)威評測 C-Eval 中，LingoWhale-8B 模型的性能僅次于 GPT-4。在 C-Eval、CMMLU、GAOKAO 測評中，性能超過 GPT-3.5Turbo，在 10B 以下尺寸模型中性能處于領(lǐng)先位置。

官方給予了一些典型示例，以介紹 LingoWhale-8B 模型的特點。

官方據(jù)此表示，LingoWhale-8B 模型具有一定數(shù)學(xué)運算能力。

在以上示例中，LingoWhale-8B 模型能夠根據(jù)上文正確地列式并進(jìn)行運算，包括函數(shù)求導(dǎo)、函數(shù)值計算、切線方程計算等操作，并最終得到結(jié)果。

而在代碼聲稱方面，官方也同時提供了一些演示：

LingoWhale-8B 具有強(qiáng)大的代碼理解與生成能力，能夠更好地生成代碼并解決具體的問題。在本示例中，LingoWhale-8B 模型生成了詳細(xì)的 python 代碼以及注釋信息，幫助用戶更好地理解并使用生成的代碼。

在邏輯方面，官方也同樣進(jìn)行了舉例：

LingoWhale-8B 模型具有解決復(fù)雜邏輯推理任務(wù)的能力。在以上的例子中，LingoWhale-8B 將復(fù)雜的邏輯問題進(jìn)行拆解，按步驟進(jìn)行分析并解決問題。

上下文對話

樣例：

在以上示例中，LingoWhale-8B 模型表現(xiàn)出了較強(qiáng)的角色扮演、方案設(shè)計、長文本理解以及多輪對話能力，能夠根據(jù)用戶需求制定方案并組織結(jié)構(gòu)化的輸出，應(yīng)對更加復(fù)雜的任務(wù)場景。

知識百科

樣例 1:

官方表示，在上面兩個例子中，相較于 GPT-3.5，LingoWhale-8B 模型生成的結(jié)果更加準(zhǔn)確詳實。

經(jīng)過在大規(guī)模高質(zhì)量語料上的預(yù)訓(xùn)練，LingoWhale-8B 模型掌握了多個領(lǐng)域的知識，包括科學(xué)、歷史、文學(xué)、藝術(shù)等，能夠理解并回答各種知識相關(guān)問題，提供準(zhǔn)確詳細(xì)的答案。

IT之家的小伙伴們可以在官方 GitHub 頁面中獲取更多詳細(xì)信息：點此訪問

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮