智譜清言上線情感語(yǔ)音模型 GLM-4-Voice:可理解情感,有情緒表達(dá)和共鳴

2024/10/25 16:06:56 來(lái)源:IT之家 作者:清源 責(zé)編:清源
感謝IT之家網(wǎng)友 有鯽雪狐 的線索投遞!

IT之家 10 月 25 日消息,智譜今天宣布上線 GLM-4-Voice 端到端情感語(yǔ)音模型。官方表示,其能夠理解情感,有情緒表達(dá)、情感共鳴,可自助調(diào)節(jié)語(yǔ)速,支持多語(yǔ)言和方言,并且延時(shí)更低、可隨時(shí)打斷,用戶(hù)即日起可在“智譜清言”App 上體驗(yàn)。

據(jù)介紹,GLM-4-Voice 具備如下特點(diǎn):

  • 情感表達(dá)和情感共鳴:聲音有不同的情感和細(xì)膩的變化,如高興、悲傷、生氣、害怕等。

  • 調(diào)節(jié)語(yǔ)速:在同一輪對(duì)話中,可以要求 TA 快點(diǎn)說(shuō) or 慢點(diǎn)說(shuō)。

  • 隨時(shí)打斷,靈活輸入指令:根據(jù)實(shí)時(shí)的用戶(hù)指令,調(diào)整語(yǔ)音輸出的內(nèi)容和風(fēng)格,支持更靈活的對(duì)話互動(dòng)。

  • 多語(yǔ)言、多方言支持:目前 GLM-4-Voice 支持中英文語(yǔ)音以及中國(guó)各地方言,尤其擅長(zhǎng)粵語(yǔ)、重慶話、北京話等。

  • 結(jié)合視頻通話,能看也能說(shuō):即將上線視頻通話功能。

此外,智譜 AutoGLM 具備 phone use 能力,只需接收簡(jiǎn)單的文字 / 語(yǔ)音指令,它就可以模擬人類(lèi)操作手機(jī)。其不受限于簡(jiǎn)單的任務(wù)場(chǎng)景或 API 調(diào)用,也不需要用戶(hù)手動(dòng)搭建復(fù)雜繁瑣的工作流,操作邏輯與人類(lèi)類(lèi)似。

GLM-4-Voice 同期對(duì)外開(kāi)源,官方稱(chēng)其為智譜首個(gè)開(kāi)源的端到端多模態(tài)模型。IT之家附地址:

代碼倉(cāng)庫(kù):

  • https://github.com/THUDM/GLM-4-Voice

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:智譜生成式AI

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知