設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

AI 繪畫火得,AI 唱歌火不得?

果殼硬科技 2022/11/19 19:31:05 責(zé)編:遠(yuǎn)生

同樣是 AIGC,有些人正在用 AI 源源不斷地生成梗圖,有些人則用 AI 生成音樂;同樣是 AIGC 生成音樂,有些在模仿人類,有些在復(fù)刻經(jīng)典。AIGC 是個(gè)工具,在不同人的手里產(chǎn)生不同的價(jià)值,這個(gè)數(shù)字可能高達(dá)數(shù)萬億美元。[1]

在 AIGC 面前,還有誰不跪下

臨近 2022 年尾聲,AIGC 成為今年最受關(guān)注的技術(shù)關(guān)鍵詞之一。只需要幾句描述,就能讓 AI 進(jìn)行聯(lián)想并作畫,通過最直接、最快速的視覺反饋,給人類對(duì)藝術(shù)的常規(guī)理解帶來沖擊。

屬于比較不怎么樣的 AI 繪畫

通過上一篇文章《AI 廠工什么時(shí)候開始賽博搬磚?》,你大概已經(jīng)知道了 AIGC 是什么以及投資現(xiàn)狀。如果展望一下未來,作為 Gartner 口中的“2022 年五大影響力技術(shù)之一”,到 2025 年,AIGC 所創(chuàng)造的數(shù)據(jù)可占到所有已生產(chǎn)數(shù)據(jù)的 10%。[2]

Gartner 發(fā)布的 2022 年技術(shù)成熟度曲線 [3]

雖然目前 AIGC 在視覺上的競(jìng)爭(zhēng)更加充分、發(fā)展更快,也更吸引眼球,但是音樂作為人類文化與情感的重要載體,AI 其實(shí)也在對(duì)該產(chǎn)業(yè)進(jìn)行改造 —— 只是更加潛移默化。

標(biāo)簽、算法、神經(jīng)語言識(shí)別等功能,幾乎成為音樂類 App 的標(biāo)配,它們可以自動(dòng)生成歌單并推送給用戶?,F(xiàn)在你打開 QQ 音樂,應(yīng)該有不少人把選擇權(quán)直接丟給了“每日 30 首”和“個(gè)性推薦”。

如果誰想體驗(yàn)一下音樂品味被嘲笑的感覺,那 AI 也可以提供貼心服務(wù)。2020 年底,網(wǎng)絡(luò)雜志《The Pudding》推出了一款人工智能應(yīng)用“How Bad Is Your Spotify?”[4] ,該應(yīng)用的數(shù)據(jù)庫(kù)里輸入了數(shù)以百萬計(jì)的 Pitchfork 評(píng)論、reddit 帖子和唱片店推薦,通過分析用戶的 Spotify 播放列表,在嘲笑其音樂品味過于“初級(jí)”,或癡迷某個(gè)歌手“到了令人不舒服的程度“,熱情的 Twitter 用戶甚至曾一度擠爆了 Pudding 網(wǎng)站。

AI 對(duì)音樂的改造沒有止步于興趣分析或者品位鑒賞。2014 年播出的美劇《天蝎計(jì)劃》(Scorpion,S2E8)中,講了一個(gè)在當(dāng)時(shí)頗為科幻的故事:一名博客音樂家寫出了可以不斷制造“神曲”的程序,卻因此招來殺身之禍 —— 兇手正是另一個(gè)運(yùn)用程序?qū)懜柚\利的創(chuàng)作者。

8 年過去,在大平臺(tái)們的努力下,《天蝎計(jì)劃》中的幻想很快成了現(xiàn)實(shí)。AI 終于打算真實(shí)地對(duì)音樂創(chuàng)作過程下手了!

他們都在玩 AIGC,他們都有美好的未來

2016 年 6 月,世界上第一首人工智能創(chuàng)作出的 90 秒鋼琴音樂作品誕生,它來自谷歌與加州藝術(shù)學(xué)院聯(lián)合推出的“Magenta”項(xiàng)目。

此后,AIGC 音樂越來越多,底層技術(shù)則分為兩條路子。

一條路子,是“自動(dòng)作曲”。2017 年,索尼 CSL(計(jì)算機(jī)科學(xué)實(shí)驗(yàn)室)人工智能程序 FlowMachines 推出的《老爸的車》(Daddy’s  Car),就是 AI 作曲的成績(jī),號(hào)稱 “第一首完全由人工智能創(chuàng)作的完整歌曲”;微軟的 AI 則通過分析學(xué)習(xí)幾十首圣誕頌歌,推出過一首名為《城市歡樂時(shí)光》(Joyful Time in The City)的 AI 歌曲。

比起 90 秒作品,完整的 AI 自動(dòng)作曲可謂前進(jìn)了一大步。但它們?nèi)孕鑿娜祟惡迫鐭熀5臍v史音樂作品中汲取靈感,是人類藝術(shù)靈感的延伸,像《老爸的車》這樣的作品,作曲和編曲由 AI 完成,和聲與填詞由人類作曲家?guī)椭愣ǎ弧冻鞘袣g樂時(shí)光》也需要人類輔助完成。其實(shí),這類音樂作品談不上“完全由人工智能創(chuàng)作”,更多是技術(shù)圈地自萌,聽眾實(shí)際接受度得打個(gè)問號(hào)。

另一條路子,則主打“AI 自動(dòng)合成音樂作品”。比如騰訊音樂阿波羅聲音實(shí)驗(yàn)室研發(fā)的聲音合成技術(shù)引擎“凌音”,高度還原和復(fù)刻歌手的聲音特點(diǎn),重現(xiàn)藝人經(jīng)典聲音,首位 AI 歌手發(fā)布于今年 7 月,基于楊超越的聲音合成,只需要歌手 10 分鐘左右的錄音就能很好地復(fù)刻出原聲,甚至可以在演唱中帶“感情”。此后的成熟作品有《沒有寄出的信》(復(fù)刻和重現(xiàn)鄧麗君的聲音),《愿你被這個(gè)世界溫柔以待》(復(fù)刻和重現(xiàn)梅艷芳的聲音)。

“自動(dòng)作曲”與“凌音引擎”的不同之處是,“自動(dòng)作曲”模仿音樂,“凌音引擎”是使用自主設(shè)計(jì)的深度神經(jīng)網(wǎng)絡(luò)模型,加上既有聲音風(fēng)格元的“合成音樂”,后者并不避諱使用了人類歷史上精華藝術(shù)作品,并復(fù)刻這些藝術(shù)風(fēng)格。

這也是 AIGC 類音樂的另一個(gè)發(fā)展方向 —— 與其讓機(jī)器搞原創(chuàng)音樂,不如讓機(jī)器輔助人創(chuàng)作音樂,并且比起單純的輸出歌曲,還可以做得更多,改變我們過往體驗(yàn)音樂的方式。

谷歌 AI 音樂項(xiàng)目 Magenta 的技術(shù)負(fù)責(zé)人道格拉斯?艾克(Douglas Eck)在接受《科學(xué)》雜志(Science)采訪時(shí)認(rèn)為,AI 已經(jīng)是國(guó)際象棋高手,但如今已成為人類棋藝精進(jìn)的幫手,音樂也一樣,如今不管機(jī)器學(xué)習(xí)速度有多快,人類都能以更快速度適應(yīng)和利用 AI 技術(shù)來輔助創(chuàng)作,玩出新意 [5]。

說得直白點(diǎn),AI 大可不必取代人類,做個(gè)趁手的工具也挺好。而最需要 AI 工具生成內(nèi)容的,可能不在現(xiàn)實(shí),而在虛擬世界。

也就是,如何把“中之人”徹底數(shù)字化。

把 AI 用到刀刃上

AIGC 的音樂進(jìn)化到今天,已經(jīng)不同于過往的自動(dòng)語音合成技術(shù),而是具有更高復(fù)刻度,引擎渲染后的 AI 聲音在音色、語氣上與真人更加接近,在演唱上也更有表現(xiàn)力和“感情”。目前“凌音”技術(shù)不僅能讓 AI 演唱(官方稱“合成“)已存在的曲目,用戶也可一鍵定制由 AI 作詞、譜曲、演唱的合成歌曲。

在這種環(huán)境下,人們面對(duì)的問題是:如何讓元宇宙數(shù)字人唱跳 Rap 打籃球?

這并不容易,因?yàn)橐曨l世界中不僅需要音樂,還要求具備音樂(樂器 / 人類)的聲音、口型、表情、動(dòng)作等元素,更豐富的場(chǎng)景下,還需要舞蹈、運(yùn)鏡、燈光……

如果你使用騰訊音樂天琴實(shí)驗(yàn)室的“Music XR Maker 系統(tǒng)”,完全可以實(shí)現(xiàn)這些需求,而且應(yīng)用場(chǎng)景多樣化,該系統(tǒng)的首位虛擬人小琴于今年 10 月推出,用 AI 驅(qū)動(dòng)的方式,基于音樂去生成舞蹈表演和歌唱元素,目的是提升運(yùn)營(yíng)效率和虛擬人的真實(shí)、趣味性。這也給會(huì)議、客服、新聞播報(bào)等場(chǎng)景提供了更好的解決方案。據(jù)了解,很快也將會(huì)有一位從“次世代”遠(yuǎn)道而來、經(jīng)過層層遴選的“超級(jí)歌手”在 TME 出道,或許她將顛覆我們對(duì)唱歌的想象,成為開辟“音樂虛擬偶像元年”的天降紫微星。

“不同于大投入定制化的頭部虛擬偶像,我們希望將 Music XR Maker 打造成一套高效率、低成本產(chǎn)出數(shù)字人的平臺(tái),同時(shí)讓數(shù)字人具備更強(qiáng)的實(shí)時(shí)內(nèi)容生產(chǎn)能力,讓任意音樂、舞蹈、舞臺(tái)等元素的互動(dòng)結(jié)合成為可能?!盦Q 音樂技術(shù)副總裁周文江談到。

元宇宙的 AIGC 音樂也得賺錢啊

2022 年,扎克伯格 100 億美元燒出來的元宇宙社交平臺(tái)地平線世界(Horizon Worlds)留存量感人,今年 10 月 16 日,Meta 內(nèi)部文件被曝光,其中顯示地平線世界的月度活躍用戶數(shù)量不足 20 萬,遠(yuǎn)未達(dá)到原本 50 萬的預(yù)期,且興趣時(shí)長(zhǎng)僅僅一個(gè)月。

說來好笑,作為一個(gè)虛擬世界,元宇宙最缺的卻是人,最難的是打造一片好的土壤來吸引人共同創(chuàng)作。

相比較來說,國(guó)內(nèi)另一個(gè)元宇宙案例則更為務(wù)實(shí),今年 7 月 16 日,騰訊音樂旗下的虛擬音樂嘉年華 TMELAND 聯(lián)合百事可樂打造了一場(chǎng)沉浸式虛擬 3D 演出。這場(chǎng)虛擬化音樂演出為元宇宙實(shí)驗(yàn)提供了內(nèi)容和主題,而這次商業(yè)合作,也給未來虛擬場(chǎng)景營(yíng)銷提供了“標(biāo)準(zhǔn)模板”。這可能是國(guó)內(nèi) AIGC 領(lǐng)域第一個(gè)大商業(yè)客戶買單的案例。諸多品牌主加持到元宇宙的內(nèi)容共建中,也將豐富生態(tài),形成有一個(gè)有生命力的營(yíng)銷場(chǎng)景。

縱觀音樂產(chǎn)業(yè),從早期的 1.0 唱片時(shí)代音樂內(nèi)容的輸出集中在少數(shù)有資源的專業(yè)人士手中;進(jìn)入到 2.0 流媒體時(shí)代,更多音樂從業(yè)者參與進(jìn)來,推薦和分發(fā)機(jī)制讓他們得到了展示機(jī)會(huì);隨著 3.0 的到來,AIGC 甚至讓音樂消費(fèi)者也擁有反向輸出和參與共創(chuàng)的能力。持續(xù)加強(qiáng)對(duì) AI 的投入,音樂平臺(tái)的未來或許是一塊比想象中更肥沃的土壤。

足夠多的高粘性用戶、人對(duì)音樂永不厭倦的欣賞、已經(jīng)培養(yǎng)成型的付費(fèi)習(xí)慣、逐步推進(jìn)的共創(chuàng)工具(不直接介入創(chuàng)作甚至還能夠避免版權(quán)紛爭(zhēng))、多元化的場(chǎng)景碰撞,誰說音樂平臺(tái)不是一塊比游戲化的元宇宙更佳的土壤呢?

“元宇宙從來都不是一蹴而就的事情,我們可以利用我們已經(jīng)成熟的技術(shù),去實(shí)現(xiàn)一個(gè)基礎(chǔ)的版本,然后不斷的去提升各項(xiàng)技術(shù),去完善元宇宙體驗(yàn)?!贬槍?duì)音樂 + AI 的更多可能性,天琴實(shí)驗(yàn)室計(jì)算機(jī)視覺負(fù)責(zé)人董治說到:“我們?cè)?AI 驅(qū)動(dòng)上的核心能力,它們都有一個(gè)共同點(diǎn),就是通過音樂,用 AI 的方式,去生成虛擬世界的各項(xiàng)基礎(chǔ)元素。“

關(guān)于 AI 藝術(shù)的一些后話

從 AI 寫稿,到 AI 作畫,再到 AI 音樂與視頻,AIGC 始終面臨一些爭(zhēng)議:如果生成的內(nèi)容不夠好,那它存在的意義是什么?如果它生成的內(nèi)容足夠好(且這可能是未來的必然),那它會(huì)激起新一輪職業(yè)替代恐慌嗎?人類的精神娛樂生活會(huì)被 AI 接手嗎?

這也許是一系列糾纏恒久的話題。技術(shù)樂觀主義者經(jīng)常會(huì)說,工具的好壞取決于使用者的目的。

實(shí)際上,互聯(lián)網(wǎng)一直在做的,就是讓更多人更方便地享受到科技提升帶來的樂趣,音樂領(lǐng)域也如是。如果我們?cè)趪?guó)內(nèi)把凌音引擎、Music XR Maker 等工具開放給所有有需要的音樂人、制作機(jī)構(gòu)或者內(nèi)容公司,再通過音樂元宇宙和 AIGC 幫助聽眾盡快進(jìn)入到虛實(shí)結(jié)合的音樂體驗(yàn)中,未來甚至成為全民在音樂領(lǐng)域共創(chuàng)的得力工具,讓每個(gè)人能按照自己的想象去制作音樂,享受音樂,那也許是個(gè)更值得期待的未來。

References:

  • [1] Generative AI: A Creative New World 2022.9.9 https://www.sequoiacap.com/article/generative-ai-a-creative-new-world/

  • [2] Predicts 2021: Artificial Intelligence and Its Impact on People and Society  https://www.gartner.com/en/documents/3995104

  • [3] What’s New in Artificial Intelligence from the 2022 Gartner Hype Cycle https://www.gartner.com/en/articles/what-s-new-in-artificial-intelligence-from-the-2022-gartner-hype-cycle

  • [4] How Bad Is Your Streaming Music? https://pudding.cool/2020/12/judge-my-spotify/

  • [5] Science:How Google is making music with artificial intelligence https://www.science.org/content/article/how-google-making-music-artificial-intelligence  doi: 10.1126/science.aan7216

本文來自微信公眾號(hào):果殼硬科技 (ID:guokr233),作者:干麻鴨, 編輯:一萌 

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:AI

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知