IT之家5月16日消息 今天,微軟(亞洲)互聯(lián)網(wǎng)工程院在北京舉行了微軟小冰五月媒體溝通會(huì),宣布了關(guān)于小冰人工智能創(chuàng)造方面的新進(jìn)展。基于此前預(yù)告的人工智能小冰演唱模型第五個(gè)版本,微軟演示了小冰在唱腔過(guò)渡、戲腔訓(xùn)練方面的成果。
小冰演唱《少年弦》Demo:點(diǎn)此鏈接。
微軟小冰基于深度神經(jīng)網(wǎng)絡(luò)的歌唱模型,已順利完成V5新版本的研發(fā)。新的V5模型實(shí)現(xiàn)了重大突破,它使微軟小冰第一次能夠像人類歌手一樣,使用充沛的“中氣”來(lái)烘托演唱,從而將人工智能虛擬歌聲質(zhì)量提升至新的高度。此外,該模型不僅限于優(yōu)化微軟小冰的聲音,還支持對(duì)任何人類歌手的聲線進(jìn)行學(xué)習(xí)、模擬和建模,演繹與再現(xiàn)歌手們巔峰狀態(tài)下的演唱水平。
據(jù)微軟介紹,在V5新版本中,擁有十余個(gè)高質(zhì)量的聲音,提升了人工智能在歌聲演繹中的預(yù)測(cè)參數(shù)的能力,除了大幅度提高中氣水平之外,還改善了歌聲唱腔轉(zhuǎn)換的自然度,并且首次公布了戲腔的訓(xùn)練成果。
小冰演唱《新貴妃醉酒》Demo:點(diǎn)此鏈接。
V5新模型還具有許多其他技術(shù)特征。例如實(shí)現(xiàn)了多聲部的合成技術(shù),使人工智能歌手可以在不同聲部間自然切換,用多個(gè)聲音來(lái)源組成新的虛擬歌手等。建模過(guò)程中,所需的訓(xùn)練數(shù)據(jù)量較上一個(gè)版本減少了70%。從技術(shù)角度,新模型可針對(duì)任何人聲建模,形成豐富多彩的人工智能歌手陣營(yíng)。
微軟小冰是一個(gè)覆蓋對(duì)話、多重交互感官與內(nèi)容服務(wù)生成的完整人工智能基礎(chǔ)框架。其中,“人工智能創(chuàng)造”(AI Creation)是該框架的主要分支之一,它通過(guò)我們所研發(fā)與持續(xù)更新的人工智能技術(shù),大規(guī)模學(xué)習(xí)并掌握人類文字、音樂(lè)、繪畫(huà)等內(nèi)容創(chuàng)造能力,再發(fā)揮人工智能的穩(wěn)定性及高并發(fā)特點(diǎn),為內(nèi)容產(chǎn)業(yè)的未來(lái)變革蓄勢(shì)。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。