IT之家 6 月 2 日消息,ElevenLabs 此前已推出利用人工智能生成人類聲音和音樂(lè)的工具,現(xiàn)在他們更進(jìn)一步,推出了可以為播客、電影或游戲創(chuàng)作音效的工具。
ElevenLabs 的名為“Sound Effects”的新工具可以根據(jù)用戶提供的文本描述生成最長(zhǎng) 22 秒的音效,并與公司原有的語(yǔ)音和音樂(lè)平臺(tái)結(jié)合使用。用戶每次使用“Sound Effects”后,可以獲得至少四個(gè)可下載的音頻片段供選擇。
ElevenLabs 與素材平臺(tái) Shutterstock 合作,利用其龐大的音頻素材庫(kù)訓(xùn)練了生成式模型。據(jù)悉,Shutterstock 的內(nèi)容授權(quán)對(duì)象涵蓋了 OpenAI、Meta 和谷歌等諸多知名人工智能公司。
IT之家注意到,“Sound Effects”提供免費(fèi)和付費(fèi)兩種版本,付費(fèi)用戶生成的音效可用于商業(yè)用途,而免費(fèi)用戶則需在標(biāo)題中標(biāo)注來(lái)源“elevenlabs.io”。ElevenLabs 對(duì)用戶輸入文本描述的字?jǐn)?shù)有限制,免費(fèi)用戶每月有 10,000 個(gè)字符的額度。在“Sound Effects”中,如果用戶自行設(shè)置音頻剪輯時(shí)長(zhǎng),則每秒會(huì)消耗 40 個(gè)字符的額度;如果使用默認(rèn)的音頻長(zhǎng)度,每次生成音效會(huì)消耗 200 個(gè)字符。
目前市場(chǎng)上已經(jīng)存在音效素材庫(kù),供創(chuàng)作者、電影制作人和游戲開發(fā)者使用。但是,這些素材庫(kù)的價(jià)格可能比較昂貴,而且有時(shí)很難找到完全符合需求的音效。ElevenLabs 在博客中表示,“Sound Effects”旨在“快速、經(jīng)濟(jì)高效和大規(guī)?!钡厣韶S富逼真的音效。
除了 ElevenLabs,其他人工智能開發(fā)商也在積極研發(fā)音效生成器。Stability AI 去年發(fā)布了 Stable Audio,可生成音樂(lè)和音效片段;而 Meta 的 AudioCraft 模型則可以生成自然環(huán)境音效,例如風(fēng)聲或交通噪音。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。