設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

豆包推出實時語音大模型:號稱中文對話斷崖式領(lǐng)先、情商智商均在線

2025/1/20 16:29:51 來源:IT之家 作者:清源 責(zé)編:清源
感謝IT之家網(wǎng)友 風(fēng)見暉一 的線索投遞!

IT之家 1 月 20 日消息,IT之家從豆包官方獲悉,豆包實時語音大模型今日正式推出,并在豆包 App(版本號為 7.2.0 新春版)全量開放。

據(jù)介紹,豆包實時語音大模型實現(xiàn)了語音理解和生成一體化,實現(xiàn)了端到端語音對話。相比傳統(tǒng)級聯(lián)模式在語音表現(xiàn)力、控制力、情緒承接方面表現(xiàn)驚艷,并具備低時延、對話中可隨時打斷等特性,“中文對話斷崖式領(lǐng)先,情商智商雙雙在線”。

同時,豆包 App 更新實時語音通話功能,面向所有用戶開放。該功能基于最新豆包實時語音大模型。官方表示,豆包中文場景的對話能力更新后在語音真實感和“喜怒哀樂”的情緒表現(xiàn)上近乎達到“人機難辨”的 AI 交互效果,可以模仿不同聲線,并且在“邏輯思考”和“情緒感知”上有明顯提升。

據(jù)了解,豆包全新實時語音通話功能可以根據(jù)場景自動對節(jié)奏、兒化音、音量、氣音等細節(jié)精準(zhǔn)把控,還可跟用戶“說”悄悄話。其掌握了部分方言與英語對話、多角色模仿,甚至部分歌曲演唱能力。

豆包的全新語音能力基于端到端框架研發(fā),其使用原生方法深度融合語音與文本模態(tài)進行統(tǒng)一建模。最終可實現(xiàn)從多模態(tài)輸入直接到多模態(tài)輸出的效果,從而達到官方所述“賦予 AI 語音對話‘靈魂’”的效果。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:豆包,大模型

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知