設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

微軟 Azure 智能語音合成全面升級到 48kHz 高保真模型

2022/11/17 20:23:00 來源:IT之家 作者:瀟公子 責(zé)編:瀟公子

IT之家 11 月 17 日消息,微軟 Azure 神經(jīng)網(wǎng)絡(luò)文本轉(zhuǎn)語音服務(wù) (又稱“Neural TTS”,“智能語音合成”) 能幫助用戶將文本轉(zhuǎn)換為逼真的人工智能聲音,它適用于多種應(yīng)用場景,包括智能語音助手、客服對話機(jī)器人、有聲內(nèi)容朗讀、游戲角色語音等。在過去的幾個(gè)月中,微軟 Azure 智能語音合成技術(shù)在語音自然度、聲音豐富度和多語言支持等方面取得了快速進(jìn)展。

今天微軟官方為大家?guī)砹俗钚碌纳窠?jīng)網(wǎng)絡(luò)語音合成聲碼器 HiFiNet2 。

圖片

聲碼器是 TTS 中的關(guān)鍵組件之一,它基于輸入的文本或聲學(xué)特征來合成音頻樣本。目前,通過 HiFiNet2 聲碼器技術(shù),微軟已經(jīng)將微軟 Azure 智能語音合成產(chǎn)品全面升級到 48kHz 聲音模型,進(jìn)一步為用戶帶來更高保真、高效率和可擴(kuò)展的 AI 語音音質(zhì)體驗(yàn)。這項(xiàng)更新包括 400 多個(gè)音色,覆蓋全球超過 140 個(gè)國家和地區(qū)的語言。

48kHz 語音模型

在文本轉(zhuǎn)語音技術(shù)中,音頻的保真度是用來衡量音質(zhì)的一項(xiàng)重要標(biāo)準(zhǔn)。高保真聲音不但可以給用戶傳達(dá)更豐富、更細(xì)膩的音質(zhì),同時(shí)還可以將音色的失真和變形降至最低。隨著采樣率的提升,聽眾可以聽到更精準(zhǔn)的細(xì)節(jié)和更真實(shí)的音色。在視頻配音、游戲和唱歌等需要更精細(xì)、更沉浸的聲音體驗(yàn)的復(fù)雜場景中,更高保真度的輸出(如 48kHz 采樣率)將給用戶帶去前所未有的全新感官體驗(yàn)。

現(xiàn)在,隨著 Azure 深度神經(jīng)網(wǎng)絡(luò)語音合成服務(wù)將全平臺 AI 聲音升級到 48kHz 采樣率,微軟率先在業(yè)界為 AI 聲音用戶帶來真正高保真度的聲音體驗(yàn)。

微軟 Azure 智能語音合成技術(shù)更多信息介紹,點(diǎn)此查看。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:微軟語音

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知