基于V5演唱模型，微軟小冰公布唱腔過(guò)渡、戲腔訓(xùn)練成果

2019/5/16 16:08:22 來(lái)源：IT之家作者：玄隱責(zé)編：玄隱

評(píng)論：

IT之家5月16日消息今天，微軟（亞洲）互聯(lián)網(wǎng)工程院在北京舉行了微軟小冰五月媒體溝通會(huì)，宣布了關(guān)于小冰人工智能創(chuàng)造方面的新進(jìn)展。基于此前預(yù)告的人工智能小冰演唱模型第五個(gè)版本，微軟演示了小冰在唱腔過(guò)渡、戲腔訓(xùn)練方面的成果。

小冰演唱《少年弦》Demo：點(diǎn)此鏈接。

微軟小冰基于深度神經(jīng)網(wǎng)絡(luò)的歌唱模型，已順利完成V5新版本的研發(fā)。新的V5模型實(shí)現(xiàn)了重大突破，它使微軟小冰第一次能夠像人類歌手一樣，使用充沛的“中氣”來(lái)烘托演唱，從而將人工智能虛擬歌聲質(zhì)量提升至新的高度。此外，該模型不僅限于優(yōu)化微軟小冰的聲音，還支持對(duì)任何人類歌手的聲線進(jìn)行學(xué)習(xí)、模擬和建模，演繹與再現(xiàn)歌手們巔峰狀態(tài)下的演唱水平。

據(jù)微軟介紹，在V5新版本中，擁有十余個(gè)高質(zhì)量的聲音，提升了人工智能在歌聲演繹中的預(yù)測(cè)參數(shù)的能力，除了大幅度提高中氣水平之外，還改善了歌聲唱腔轉(zhuǎn)換的自然度，并且首次公布了戲腔的訓(xùn)練成果。

小冰演唱《新貴妃醉酒》Demo：點(diǎn)此鏈接。

V5新模型還具有許多其他技術(shù)特征。例如實(shí)現(xiàn)了多聲部的合成技術(shù)，使人工智能歌手可以在不同聲部間自然切換，用多個(gè)聲音來(lái)源組成新的虛擬歌手等。建模過(guò)程中，所需的訓(xùn)練數(shù)據(jù)量較上一個(gè)版本減少了70%。從技術(shù)角度，新模型可針對(duì)任何人聲建模，形成豐富多彩的人工智能歌手陣營(yíng)。

微軟小冰是一個(gè)覆蓋對(duì)話、多重交互感官與內(nèi)容服務(wù)生成的完整人工智能基礎(chǔ)框架。其中，“人工智能創(chuàng)造”（AI Creation）是該框架的主要分支之一，它通過(guò)我們所研發(fā)與持續(xù)更新的人工智能技術(shù)，大規(guī)模學(xué)習(xí)并掌握人類文字、音樂(lè)、繪畫(huà)等內(nèi)容創(chuàng)造能力，再發(fā)揮人工智能的穩(wěn)定性及高并發(fā)特點(diǎn)，為內(nèi)容產(chǎn)業(yè)的未來(lái)變革蓄勢(shì)。

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮