設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

“國(guó)內(nèi)首個(gè)能力追齊 GPT-4o 語音能力的模型”,心辰 Lingo 語音 AI 模型開放內(nèi)測(cè)預(yù)約

2024/8/24 9:56:44 來源:IT之家 作者:故淵 責(zé)編:故淵

IT之家 8 月 24 日消息,金科湯姆貓投資的西湖心辰于今年 8 月推出心辰 Lingo 語音大模型,是國(guó)內(nèi)首個(gè)端到端語音大模型,已于今天(8 月 24 日)開啟內(nèi)測(cè)預(yù)約。

在 8 月 21 日發(fā)布的公告中,官方介紹稱相比較傳統(tǒng) TTS,端到端語音大模型則是一種更為全面的技術(shù),它不僅可以語音識(shí)別,還集成了自然語言處理、意圖識(shí)別、對(duì)話管理以及語音合成等多個(gè)環(huán)節(jié),實(shí)現(xiàn)了從語音輸入到語音反饋的完整交互過程,極大地豐富了人機(jī)交互的深度和廣度。

IT之家援引官方新聞稿,心辰 Lingo 語音模型是國(guó)內(nèi)首個(gè)能力追齊 GPT-4o 語音能力的模型,技術(shù)能力上具備以下三個(gè)顯著特點(diǎn):

  • 原生的語音理解:作為端到端模型,心辰 Lingo 不僅能夠識(shí)別語音中的文字信息,還能精確捕捉其他重要特征,如情感、語氣、音調(diào),甚至環(huán)境音,幫助模型更全面地理解語音內(nèi)容,從而提供更加自然和生動(dòng)的交互體驗(yàn)。

  • 多種語音風(fēng)格表達(dá):心辰 Lingo 可以根據(jù)上下文和用戶指令,自適應(yīng)調(diào)整語音的速度、高低、噪聲強(qiáng)度,并能夠生成對(duì)話、歌唱、相聲等多種風(fēng)格的語音響應(yīng),有效提升了模型在不同應(yīng)用場(chǎng)景下的靈活性和適應(yīng)性。

  • 語音模態(tài)超級(jí)壓縮:心辰 Lingo 采用具有數(shù)百倍壓縮率的語音編解碼器,能夠?qū)⒄Z音壓縮至極短的長(zhǎng)度,在顯著降低計(jì)算和存儲(chǔ)成本的同時(shí)幫助模型生成高質(zhì)量語音內(nèi)容。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:AI,模型

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知