設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

“國(guó)內(nèi)首個(gè)能力追齊 GPT-4o 語(yǔ)音能力的模型”,心辰 Lingo 語(yǔ)音 AI 模型開(kāi)放內(nèi)測(cè)預(yù)約

2024/8/24 9:56:44 來(lái)源:IT之家 作者:故淵 責(zé)編:故淵

IT之家 8 月 24 日消息,金科湯姆貓投資的西湖心辰于今年 8 月推出心辰 Lingo 語(yǔ)音大模型,是國(guó)內(nèi)首個(gè)端到端語(yǔ)音大模型,已于今天(8 月 24 日)開(kāi)啟內(nèi)測(cè)預(yù)約。

在 8 月 21 日發(fā)布的公告中,官方介紹稱相比較傳統(tǒng) TTS,端到端語(yǔ)音大模型則是一種更為全面的技術(shù),它不僅可以語(yǔ)音識(shí)別,還集成了自然語(yǔ)言處理、意圖識(shí)別、對(duì)話管理以及語(yǔ)音合成等多個(gè)環(huán)節(jié),實(shí)現(xiàn)了從語(yǔ)音輸入到語(yǔ)音反饋的完整交互過(guò)程,極大地豐富了人機(jī)交互的深度和廣度。

IT之家援引官方新聞稿,心辰 Lingo 語(yǔ)音模型是國(guó)內(nèi)首個(gè)能力追齊 GPT-4o 語(yǔ)音能力的模型,技術(shù)能力上具備以下三個(gè)顯著特點(diǎn):

  • 原生的語(yǔ)音理解:作為端到端模型,心辰 Lingo 不僅能夠識(shí)別語(yǔ)音中的文字信息,還能精確捕捉其他重要特征,如情感、語(yǔ)氣、音調(diào),甚至環(huán)境音,幫助模型更全面地理解語(yǔ)音內(nèi)容,從而提供更加自然和生動(dòng)的交互體驗(yàn)。

  • 多種語(yǔ)音風(fēng)格表達(dá):心辰 Lingo 可以根據(jù)上下文和用戶指令,自適應(yīng)調(diào)整語(yǔ)音的速度、高低、噪聲強(qiáng)度,并能夠生成對(duì)話、歌唱、相聲等多種風(fēng)格的語(yǔ)音響應(yīng),有效提升了模型在不同應(yīng)用場(chǎng)景下的靈活性和適應(yīng)性。

  • 語(yǔ)音模態(tài)超級(jí)壓縮:心辰 Lingo 采用具有數(shù)百倍壓縮率的語(yǔ)音編解碼器,能夠?qū)⒄Z(yǔ)音壓縮至極短的長(zhǎng)度,在顯著降低計(jì)算和存儲(chǔ)成本的同時(shí)幫助模型生成高質(zhì)量語(yǔ)音內(nèi)容。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:AI模型

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知