設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

摩爾線程開源音頻理解大模型 MooER:基于國產(chǎn)全功能 GPU 訓(xùn)練和推理

2024/8/23 18:21:35 來源:IT之家 作者:沛霖(實(shí)習(xí)) 責(zé)編:沛霖

IT之家 8 月 23 日消息,摩爾線程開源了音頻理解大模型 —MooER(摩耳),是業(yè)界首個(gè)基于國產(chǎn)全功能 GPU 進(jìn)行訓(xùn)練和推理的大型開源語音模型。

基于摩爾線程夸娥(KUAE)智算平臺(tái),MooER 大模型用 38 小時(shí)完成了 5000 小時(shí)音頻數(shù)據(jù)和偽標(biāo)簽的訓(xùn)練。

MooER 不僅支持中文和英文的語音識(shí)別,還具備中譯英的語音翻譯能力。在 Covost2 中譯英測試集中,MooER-5K 取得了 25.2 的 BLEU 分?jǐn)?shù),接近工業(yè)級(jí)效果。

摩爾線程 AI 團(tuán)隊(duì)在該工作中開源了推理代碼和 5000 小時(shí)數(shù)據(jù)訓(xùn)練的模型,并計(jì)劃進(jìn)一步開源訓(xùn)練代碼和基于 8 萬小時(shí)數(shù)據(jù)訓(xùn)練的模型。

MooER 的模型結(jié)構(gòu)包括 Encoder、Adapter 和 Decoder(Large Language Model,LLM)三個(gè)部分,具體的模型參數(shù)規(guī)模如下:

IT之家附相關(guān)鏈接:

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:摩爾線程,大模型,MooER夸娥

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知