IT之家 7 月 21 日消息,網(wǎng)易日前聯(lián)合浙江省殘疾人福利基金會,發(fā)起了名為 “人生第一句” 的聲音復原公益計劃。聽障人士只需要上傳 5 分鐘語音片段,即可生成相關音頻模型,令他們能夠使用自己的聲音再次 “說話”。
網(wǎng)易表示,傳統(tǒng)的語音克隆產(chǎn)品需要輸入完整的講話數(shù)據(jù),對于無法正常發(fā)出語義的聽障人士并不適用。因此,網(wǎng)易 AI Lab 研發(fā)團隊利用旗下的 iSpeech 技術(shù),結(jié)合預訓練模型和少量純語音數(shù)據(jù)的快速微調(diào)算法模型,開發(fā)出了“音色復原技術(shù)”。
目前這項“音色復原技術(shù)”已經(jīng)在音書 App 中上線,聽障人士只需要打開 App,點擊“聲音復原”功能,上傳 5 分鐘沒有完整語義的發(fā)聲片段,稍等片刻后,App 即可生成“屬于自己的聲音”,之后聽障人士便可以通過文字轉(zhuǎn)語音,使用自己理想的聲音與外界“交流”。
網(wǎng)易聲稱,在此前所進行的相關調(diào)研中,有超過 67% 的受訪對象表示“愿意使用音色復原技術(shù)”,超過一半的受訪對象表示“愿意將音色復原技術(shù)推薦給身邊有需要的人”,也有部分受訪對象表示除了手機 App 以外,也希望音色復原技術(shù)應用于在公交、出租、飯店、超市、銀行等公共場所。
IT之家經(jīng)過查詢得知,除了網(wǎng)易外,此前小米也曾邀請用戶,給言語障礙者捐贈聲音,小米表示,要完成“聲音定制”,除了相關算法外,最不可或缺的就是一個豐富的音源庫,因此小米邀請部分聲音條件與言語障礙者匹配的用戶,貢獻出自己的聲音,共同助力音源庫的發(fā)展。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。