設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

中文多模態(tài)大模型 SuperCLUE-V 基準(zhǔn) 8 月榜單發(fā)布,騰訊混元居首

2024/8/5 8:19:22 來源:IT之家 作者:清源 責(zé)編:清源
感謝IT之家網(wǎng)友 菜????狗 的線索投遞!

IT之家 8 月 5 日消息,據(jù)騰訊科技今日?qǐng)?bào)道,中文多模態(tài)大模型 SuperCLUE-V 基準(zhǔn) 8 月榜單發(fā)布,騰訊混元大模型位居國(guó)內(nèi)大模型首位(71.95 分)。

騰訊科技方面宣稱,該模型準(zhǔn)確識(shí)別圖像元素并生成自然語言描述,全方位理解并洞察細(xì)節(jié)。此次測(cè)評(píng)覆蓋了 12 個(gè)國(guó)內(nèi)外高代表性的多模態(tài)理解大模型,騰訊混元模型在多模態(tài)基礎(chǔ)能力和應(yīng)用能力中獲得 71.95 的分?jǐn)?shù)。

IT之家查詢得知,8 月榜單中涵蓋國(guó)內(nèi)外最具代表性的 12 個(gè)多模態(tài)理解大模型。騰訊混元大模型在總榜上位居第二,僅次于 GPT-4o。GPT-4o 取得 74.36 分,領(lǐng)跑多模態(tài)基準(zhǔn),基礎(chǔ)多模態(tài)認(rèn)知能力和應(yīng)用能力均有 70 + 分的表現(xiàn),在技術(shù)和應(yīng)用方面均有一定領(lǐng)先優(yōu)勢(shì)。

▲ 圖源“ CLUE 中文語言理解測(cè)評(píng)基準(zhǔn)”公眾號(hào),下同

SuperCLUE 評(píng)價(jià)稱,在基礎(chǔ)能力方面,國(guó)內(nèi)大模型較海外模型仍有一定差距,尤其在細(xì)粒度視覺認(rèn)知任務(wù)上,國(guó)內(nèi)外最好模型有 5 分的差距,需要進(jìn)一步對(duì)多模態(tài)深度認(rèn)知能力做優(yōu)化提升。

本次測(cè)評(píng)選取了 4 個(gè)海外模型和 8 個(gè)國(guó)內(nèi)代表性多模態(tài)模型。其中為進(jìn)一步評(píng)估開源和閉源的不同進(jìn)展,本次參評(píng)模型包括 4 個(gè)開源模型、8 個(gè)閉源模型。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:騰訊混元,大模型

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知