設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

電梯、地庫(kù)里通話不卡頓,騰訊主導(dǎo)新一代實(shí)時(shí)語(yǔ)音編碼行業(yè)標(biāo)準(zhǔn) AVS3P10 即將發(fā)布

2024/6/27 14:57:51 來(lái)源:IT之家 作者:汪淼 責(zé)編:汪淼

IT之家 6 月 27 日消息,騰訊今日宣布,該公司主導(dǎo)的新一代實(shí)時(shí)語(yǔ)音編碼行業(yè)標(biāo)準(zhǔn) AVS3P10 完成定稿,即將正式對(duì)外發(fā)布。

此次 AVS 音頻組 AVS3P10 標(biāo)準(zhǔn)采納了騰訊側(cè)方案,以騰訊會(huì)議首款自研神經(jīng)網(wǎng)絡(luò)語(yǔ)音編解碼器 Penguins AI 語(yǔ)音引擎為原型,可提升弱網(wǎng)環(huán)境下的通話質(zhì)量。

圖片

騰訊介紹稱,這是全球首個(gè)系統(tǒng)性引入人工智能并實(shí)現(xiàn)低碼率下高質(zhì)量語(yǔ)音編碼標(biāo)準(zhǔn),表現(xiàn)達(dá)到國(guó)際一流水準(zhǔn)。僅需 1/3 的編碼碼率,就能實(shí)現(xiàn)和現(xiàn)有主流標(biāo)準(zhǔn)同等清晰的音質(zhì)?!凹词咕W(wǎng)絡(luò)卡如 2G,也能順暢開(kāi)會(huì)”。

該標(biāo)準(zhǔn)由騰訊提議啟動(dòng)、推進(jìn)和維護(hù),經(jīng)過(guò) AVS 音頻組多家成員單位共同貢獻(xiàn)?!敖窈笤诰€上會(huì)議、語(yǔ)音通話等實(shí)時(shí)音頻場(chǎng)景,帶寬要求大幅降低。即使在電梯、地庫(kù)、隧道等網(wǎng)絡(luò)很差的環(huán)境,也能實(shí)現(xiàn)清晰流暢的語(yǔ)音通話?!?/p>

圖片

據(jù)介紹,在有限的帶寬條件下,想要將聲音高質(zhì)量傳遞到接收方,壓縮原始數(shù)據(jù)、去除冗余信息的語(yǔ)音編碼技術(shù)是其中關(guān)鍵。然而,基于 EVS、OPUS 等現(xiàn)有主流音頻編解碼標(biāo)準(zhǔn),當(dāng)碼率降低到 10kbps 以下時(shí),語(yǔ)音質(zhì)量下降明顯,影響用戶體驗(yàn)。

為應(yīng)對(duì)該挑戰(zhàn),騰訊會(huì)議天籟實(shí)驗(yàn)室聯(lián)合騰訊 AI Lab 自研了騰訊首款神經(jīng)網(wǎng)絡(luò)語(yǔ)音編解碼器 ——Penguins。

具體來(lái)說(shuō),Penguins 將 AI 與傳統(tǒng)技術(shù)融合,打破傳統(tǒng)香農(nóng)定律的性能極限,引入大數(shù)據(jù)并在可控算力增量下提供了新的性能上界,從而對(duì)下一代通信系統(tǒng),尤其是信源編碼器部分,提供了新的技術(shù)基礎(chǔ)和方法論。通過(guò) AI 語(yǔ)音信號(hào)建模,提取最核心的特征參數(shù)編碼,再借助深度學(xué)習(xí)網(wǎng)絡(luò),預(yù)測(cè)并重建語(yǔ)音中的細(xì)微結(jié)構(gòu),最終生成逼真的音頻波形。

多方測(cè)試表明,騰訊提交的 AVS3P10 標(biāo)準(zhǔn)實(shí)現(xiàn)了 6kbps 下的高質(zhì)量語(yǔ)音通信,即使在“2G”網(wǎng)絡(luò)下也能實(shí)現(xiàn)清晰通話,且主觀質(zhì)量非常接近原始參考信號(hào),媲美國(guó)際主流的 OPUS 標(biāo)準(zhǔn)在 20kbps 的質(zhì)量。同時(shí),主觀質(zhì)量對(duì)標(biāo)傳統(tǒng)編碼的中高碼率情況下,編碼效率提升 200-300%。

2021 年起,Penguins 音頻編碼器就在騰訊會(huì)議的駕駛模式、弱網(wǎng)模式及 QQ 語(yǔ)音通話等場(chǎng)景中投入規(guī)模應(yīng)用。

2023 年 3 月,騰訊團(tuán)隊(duì)在 AVS 音頻組提議并參與標(biāo)準(zhǔn)制定,即 AVS3P10 實(shí)時(shí)語(yǔ)音編碼標(biāo)準(zhǔn)。隨后,騰訊提交基于 Penguins 的候選技術(shù);經(jīng)過(guò) AVS 音頻組交叉驗(yàn)證后采納。2024 年 6 月,AVS3P10 實(shí)時(shí)語(yǔ)音編碼標(biāo)準(zhǔn)正式完成標(biāo)準(zhǔn)化工作,進(jìn)入公示階段。

IT之家注:從 2002 年 6 月我國(guó)成立 AVS 工作組開(kāi)始,十多年來(lái)上千人的團(tuán)隊(duì)努力,我國(guó)自主知識(shí)產(chǎn)權(quán)的 AVS 應(yīng)運(yùn)而生。AVS3 是全球首個(gè)已推出的面向 8K 及 5G 產(chǎn)業(yè)應(yīng)用的視頻編碼標(biāo)準(zhǔn)。

AVS 國(guó)際組長(zhǎng)鄭建鏵此前透露AVS 已經(jīng)啟動(dòng) AVS4 的標(biāo)準(zhǔn)制定,并呼吁 AVS 成員單位繼續(xù)支持 AVS 下一代標(biāo)準(zhǔn)開(kāi)發(fā)工作,各個(gè)廠商聯(lián)合起來(lái),一起實(shí)現(xiàn)技術(shù)標(biāo)準(zhǔn)共同出海,推動(dòng)全球化部署。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知