設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

Meta 發(fā)布開源 AI 工具 AudioCraft,用戶可通過文本提示創(chuàng)作音樂、音頻

2023/8/3 7:17:07 來源:IT之家 作者:清源(實(shí)習(xí)) 責(zé)編:故淵
感謝IT之家網(wǎng)友 HH_KK 的線索投遞!

IT之家 8 月 3 日消息,美國(guó)東部時(shí)間 8 月 2 日,Meta 開源了一款生成式 AI 工具 AudioCraft,可幫助用戶通過文本提示創(chuàng)作音樂和音頻。

圖片 3

根據(jù) Meta 官方介紹,AudioCraft 包含了三個(gè)核心組件

  • MusicGen:使用 Meta 擁有 / 特別授權(quán)的音樂進(jìn)行訓(xùn)練,根據(jù)文本提示生成音樂。

  • AudioGen:使用公共音效進(jìn)行訓(xùn)練生成音頻或擴(kuò)展現(xiàn)有音頻,后續(xù)還可生成環(huán)境音效(如狗叫、汽車?guó)Q笛、木地板上的腳步聲)。

  • EnCodec(改進(jìn)版):基于神經(jīng)網(wǎng)絡(luò)的音頻壓縮解碼器,可生成更高質(zhì)量的音樂并減少人工痕跡,或?qū)σ纛l文件進(jìn)行無損壓縮。

Flow chart demonstrating how MusicGen and AudioGen work

該工具經(jīng)過開源之后,相關(guān)研究人員和從業(yè)人員可以使用自己的數(shù)據(jù)集訓(xùn)練模型。官方宣稱 AudioCraft 系列模型能夠長(zhǎng)期穩(wěn)定地生成高質(zhì)量音頻,而且易于使用,能夠?yàn)橐魳芳液吐曇粼O(shè)計(jì)師“提供靈感”,幫助他們快速集思廣益,并“以新的方式迭代他們的作品”。

另?yè)?jù)IT之家此前報(bào)道,今年 6 月份 Meta 開源了 AI 語言模型 MusicGen,該模型基于谷歌 2017 年推出的 Transformer 模型。如同模型名稱所示,MusicGen 主要用于音樂生成,它可以將文本和已有的旋律轉(zhuǎn)化為完整樂曲。

演示視頻:

AudioCraft 項(xiàng)目地址:點(diǎn)此前往

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:Meta,生成式AI,AudioCraft

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知