設置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

谷歌 Deepmind 推出 Lyria AI 音頻模型,可生成帶有樂器和人聲的音樂

2023/11/21 14:05:30 來源:IT之家 作者:漾仔(實習) 責編:漾仔
感謝IT之家網(wǎng)友 Coje_He 的線索投遞!

IT之家 11 月 21 日消息,Deepmind 日前推出了一款名為 Lyria 的音頻模型,可用于生成帶有樂器和人聲的音樂。此外 Deepmind 還通過與 YouTube 合作,整合 Lyria 模型開發(fā)了音樂創(chuàng)作工具 Dream Track,聲稱可令視頻創(chuàng)作者“更有效率地將想法變?yōu)樽髌贰薄?/p>

研究人員介紹了當前通過 AI 模型生成音樂的挑戰(zhàn),這是因為音樂本身包含極高的信息密度,其中每一秒鐘都可能擁有多個節(jié)拍、音符及和聲。而這也使得“生成音樂”相較于“生成語言(文字轉(zhuǎn)語音)”更為復雜,而對于 AI  模型來說,維持長音樂序列中的連續(xù)性也更為困難,這是因為模型需要在不同的樂句、詩節(jié)和長段落中,保持音樂的流暢性和一致性。

此外,由于音樂片段中經(jīng)常同時包含多個聲部和樂器,這也進一步增加了音樂生成的難度,相關音頻模型必須能夠協(xié)調(diào)多種聲音和旋律,從而使生成的音樂更自然。

而 Deepmind 所開發(fā)的 Lyria AI 模型,便是針對上述痛點進行的嘗試,這款模型的最大特點就是能夠生成包含樂器和人聲的高品質(zhì)音樂。

▲ 圖源 Deepmind

此外,Lyria 模型還擅長進行音樂變換和延續(xù)的任務,因此模型還能基于現(xiàn)有音樂片段生成出風格新穎或統(tǒng)一的后續(xù)片段。

研究人員同時強調(diào),Lyria 模型擁有細致的微調(diào)選項,可讓用戶精確生成音樂風格及表現(xiàn)方式,因此這款模型可以“滿足專業(yè)音樂創(chuàng)作的需求,同時也可以讓業(yè)余用戶輕松上手”。

▲ 圖源 Deepmind

IT之家注意到,目前 YouTube 已經(jīng)在短視頻功能“Shorts”中應用 Lyria 模型,相關成果已經(jīng)集成在 YouTube 的實驗音樂創(chuàng)作工具 Dream Track 中,用戶可以用這款工具生成多樣化的配樂,并可選用 Charlie Puth、Charli XCX、Sia 等藝術家的音樂風格來創(chuàng)造出“全新演繹”。

▲ 圖源 Deepmind

據(jù)悉,用戶可以在 Dream Track 中簡單地輸入主題,之后即可選擇一位藝術家,為短視頻生成 30 秒的配樂、歌詞、伴奏等內(nèi)容。

▲ 圖源 Deepmind

▲ 圖源 Deepmind

此外,Deepmind 還表示,研究人員正廣泛地探索 AI 在音樂創(chuàng)作領域的應用,未來用戶只需要哼唱,AI 就會把旋律配成帶有歌詞的完整歌曲,也可以將古早的 MIDI 音樂轉(zhuǎn)換為 Remix 版本,或為音軌添加各種樂器伴奏。

Deepmind 同時提到,Lyria 模型生成的所有內(nèi)容,都會加上 SynthID 水印標記。這是一種辨識歌曲是否是由 AI 生成的水印機制,號稱能夠在不影響聽覺體驗的前提下,為 AI 生成的音樂嵌入“聽眾無法察覺的水印標記”。

▲ 圖源 Deepmind

研究人員提到,帶有“聲音水印”的音頻,即便添加噪音,或是進行 MP3 壓縮,甚至對變更音調(diào)速度,也都能夠維持可檢測性,而 Lyria 模型也可以通過檢測歌曲中的 SynthID,來確認歌曲中由 Lyria 模型生成的部分,從而更容易辨別音樂主題內(nèi)容,方便生成后續(xù)音樂片段。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關文章

關鍵詞:谷歌,DeepmindAI

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應用 魔方 最會買 要知