最近兩個月,二次元們找到了 AI 的“正確用法”—— 玩梗。
以造梗最多的 NovelAI 為例,無論你投喂什么圖片,AI 都能二次元化,輸出精美中不失離譜的圖片。
這只是大量 AI 作畫正面案例里的一個少數(shù)。最近兩個月,AI 作畫帶著大量梗圖火出圈,帶動了整個 AIGC 領域的投融資,AI 行業(yè)也順帶著被“奶”了一口。
但 AIGC 能做的,遠不止作畫。
AIGC 實現(xiàn)創(chuàng)作自由?
AIGC(AI-generated content),意為由 AI 生產(chǎn)的內(nèi)容。因此,只要創(chuàng)作的主體是 AI,無論內(nèi)容的形式是文本、圖像、音頻、視頻以及它們排列組合的多模態(tài)內(nèi)容,都屬于 AIGC。
在這個范疇上,游戲領域由 AI 生成的 NPC 和游戲策略,還有市面上一抓一大把的虛擬數(shù)字人,勉強可能算作 AIGC 之列。
2020 年 12 月,投資機構(gòu) a16z 官網(wǎng)發(fā)布文章,提出“內(nèi)容生成的四個階段”,依次為 PGC、UGC、AI 輔助生成和完全的 AIGC[1]。
該文章發(fā)布時,a16z 還非常保守地認為,“我們?nèi)蕴幱诘谝恢恋诙A段”。實際上,果殼硬科技歷史文章曾提到,騰訊早在 2015 年推出了 AI 寫作機器人 Dreamwriter,為里約奧運會進行賽事報道,這說明彼時內(nèi)容產(chǎn)業(yè)已經(jīng)觸碰到第三個階段 ——AI 輔助生成。
2022 年百度世界大會上,李彥宏就表示 AIGC 有三個發(fā)展階段:首先是“助手階段”,AIGC 用來輔助人類進行內(nèi)容生產(chǎn);第二是“協(xié)作階段”,AIGC 以虛擬人形態(tài)出現(xiàn),形成人機共生局面;第三是“原創(chuàng)階段”,AIGC 將獨立完成內(nèi)容創(chuàng)作。
若以此為標準,我們已經(jīng)實現(xiàn)了 AIGC 的第一個階段,AI 生成文字、圖像、視頻等方面已有多款產(chǎn)品。
AIGC 項目雖然多,但是依據(jù)定位不同可分為兩類:產(chǎn)品型和研發(fā)型。
產(chǎn)品型項目以創(chuàng)業(yè)公司為主,它們的產(chǎn)品一般更加更加商業(yè)化,盈利需求明顯。
它們要么向用戶收費 ——AI 作畫公司 PromptBase 直接收取 1.99 美元 / 張的作品費用;Discord 的 Midjourney 雖然允許用戶免費試用 AI 作畫,但是免費版有使用次數(shù)限制,若想將畫作商用,就要支付每個月 30 美元的費用。另外,若用戶因 Midjourney 每月獲利超過 2 萬美元,還需要與 Discord 進行分成,分成比例在 20% 左右。
要么向公司收費 —— 小冰公司公司 CEO 李笛曾向果殼硬科技表示,小冰通過提供人工智能框架,從其它公司處賺錢。每日經(jīng)濟新聞、紅杉中國等公司都使用了小冰的解決方案。
而研發(fā)型項目以科技巨頭的大規(guī)模深度學習模型為代表,它們一般為某些專用目的或是服務于巨頭的底層技術(shù),一般不會推出面向普通用戶的產(chǎn)品。
如 Open AI、騰訊、阿里等公司的預訓練語言模型。以阿里為例,其語言模型作為自然語言技術(shù)平臺的底層能力,支持產(chǎn)品的搜索、推薦、廣告、客服等功能。
研發(fā)型項目即便推出面向一般用戶的產(chǎn)品,也以小規(guī)模測試為主,目的是在使用中獲得更多學習數(shù)據(jù),自我學習。如百度基于文心大模型推出了 AI 作畫產(chǎn)品,但使用該功能需要申請,對于使用次數(shù)也有限制。
此外,出于展示研發(fā)實力、減少重復勞動、推動技術(shù)交流等考慮,大公司一般這些項目開源,供學界研究,但這也給了少數(shù) AIGC 項目一條“創(chuàng)業(yè)的捷徑”。
市面上部分 AIGC 項目并非都有自己的模型,而是采購或剽竊自其它項目。
行業(yè)媒體 EasyAI 就在 2021 年的文章中提到,人工智能寫作工具 Copysmith AI 及其同類產(chǎn)品 Copy AI 的模型并非自研,而是使用了 GPT-3 的語言模型。2020 年 10 月起,GPT-3 開始有償向外界開放自然語言處理能力,這些公司利用 GPT-3 商業(yè)化也無可厚非 [3]。
但少數(shù)公司還存在剽竊行為。今年 8 月,媒體曝出一家名為 WriteSonic 的 AIGC 創(chuàng)業(yè)公司剽竊了 Stable Diffusion,推出一款 AI 作圖的產(chǎn)品 Photosonic AI。Stable Diffusion 是一個在 GitHub 上完全公開免費的模型,但 WriteSonic 并未在產(chǎn)品中標注技術(shù)來源,該公司創(chuàng)始人也未做回應,等于是默認了 [4]。
成熟的能力、開放的模型,給人工智能行業(yè)帶來了新機遇,也帶來了大量魚龍混雜的 AIGC 項目,但是資本對此并不介意,甚至開始搶起項目。
有人旗幟鮮明,有人舉棋不定
今年 9 月 19 日,紅杉資本兩名合伙人黃松雅(音譯,Songya Huang)和帕特?格雷迪(Pat Grady)用 GPT-3 寫了一篇名為《生成式 AI,一個創(chuàng)造性的新世界》的文章 [5]。
文章提到,AIGC 正在變得更快、更便宜,而且在某些情況下比人類的創(chuàng)作質(zhì)量更高,并表示“AIGC 有潛力產(chǎn)生數(shù)萬億美元的經(jīng)濟價值”。
但一級市場的投資熱,在此之前已經(jīng)開始。
有投資人稱,AIGC 投資從今年七八月開始熱了起來,到 9 月已經(jīng)鋪天蓋地了 [6]。西南某新一線城市投資經(jīng)理也告訴果殼硬科技,今年下半年陸續(xù)看過幾個 AIGC 的案子,但因為項目一般,并未出手。
10 月 17 日,Stability AI 宣布獲得來自 Coatue 和光速創(chuàng)投領投的 1.01 億美元投資,投后估值達 10 億美元,被媒體“尊為”AIGC 領域首個獨角獸 [7]。兩日后,德州 AIGC 公司 Jasper 獲得獲得 Insight Partners 領投的 1.25 億美元 A 輪融資,投后估值達 15 億美元。
國內(nèi)方面,今年以來有多家涉及 AIGC 業(yè)務的公司獲得新融資,它們的融資時間幾乎全部發(fā)生在 7 月后,天使輪融資占比近半。
對于 AIGC 公司來說,融資事關(guān)公司擴張。
研發(fā)算法和搭建、訓練模型需要投入大量人力物力,比如 1750 億參數(shù)的 GPT-3,訓練成本為 1200 萬美元。另外,為了訓練 GPT-3,微軟還投資 5 億美元,專門為它搭建了一座超算中心,裝載了一萬張英偉達 GPU[8]。
即便套用現(xiàn)成的模型,也要租用大量算力維持服務,并且使用的人越多、占用的算力越大。這也是為什么大部分 AI 作畫產(chǎn)品,不會無限制向用戶提供免費服務 —— 每一幅作品都有算力成本。
對于投資機構(gòu)來說,AIGC 可能會創(chuàng)造巨大的商業(yè)價值。
我們可以參照計算機視覺技術(shù)的發(fā)展趨勢。晨山資本副總裁吳文超認為,計算機視覺技術(shù)發(fā)展時間超 40 年,但遲遲沒有好的商業(yè)化途徑。直到人臉識別、工業(yè)視覺檢測等殺手級應用出現(xiàn),計算機數(shù)據(jù)技術(shù)極大提升了生產(chǎn)力,也創(chuàng)造了大量社會價值和投資機會。而 AIGC 的技術(shù)成熟度較計算機視覺晚了 3~5 年,如今已經(jīng)到了大爆發(fā)的前期 [9]。
有 AI 行業(yè)投資人告訴果殼硬科技,AIGC 行業(yè)到了商業(yè)化的重要節(jié)點已經(jīng)是業(yè)內(nèi)共識,不能錯過這個機會。
AIGC 能不能投,也有 VC 舉棋不定。
北京某一線 VC 投資經(jīng)理對果殼硬科技表示,在 AIGC 產(chǎn)品上,她更看好大公司而非創(chuàng)業(yè)團隊,一方面大部分創(chuàng)業(yè)公司無法承擔運行 AI 大模型的成本,另一方面大公司有先發(fā)優(yōu)勢,不過前提是方向和模式正確。
此外,她還認為 AIGC 無法替代創(chuàng)意工作者,無論生成的內(nèi)容是什么,最終的創(chuàng)意來源都是人,而服務創(chuàng)作者就是 AIGC 產(chǎn)品最直觀的落地方式。
AIGC,別靠玩梗賺錢了
無論是否投資 AIGC,我們還是應該關(guān)注那些具有普遍意義的問題 ——
一個好的 AIGC 產(chǎn)品應該長什么樣?
最近兩個月,被拿來玩梗的 AIGC 一個個都出了圈,但梗圖脫離了 AI 的生產(chǎn)力定位,無法帶來商業(yè)價值。
在前述北京 VC 投資經(jīng)理看來,投資 AIGC 就是“選商業(yè)模式”。AIGC 無法替代創(chuàng)意工作者,無論生成的內(nèi)容是什么,最終的創(chuàng)意來源都是人,而服務創(chuàng)作者就是 AIGC 產(chǎn)品最直觀的落地方式。她對果殼硬科技表示,“能更好地替代創(chuàng)意工作者操作過程的 AIGC,才是一個好的產(chǎn)品?!?/p>
不過,目前的 AIGC 產(chǎn)品距離“生產(chǎn)力工具”仍有距離。
AIGC 能做到什么程度?
整體上看,目前 AIGC 產(chǎn)品輔助生產(chǎn)的作用有限。
果殼硬科技歷史文章也提到了 AI 寫作高度程式化、產(chǎn)品退居幕后的問題。至于音視頻領域,AI 也存在套旋律和效果生硬、畫面獵奇等硬傷 [10]。
在最有望替代基礎畫師的作畫領域,AI 的理解能力和易用性程度還不夠強 —— 出現(xiàn)了手腳不協(xié)調(diào)、口眼歪斜等不合常理的問題,包括“不會用筷子”和“不分鮭魚和刺身”這樣的著名翻車案例。
比如百度推出的 AI 作畫產(chǎn)品“文心一格”,就給我創(chuàng)作了這么一張“雙手持筷”的作品,而它的關(guān)鍵詞是“一個用筷子吃盒飯的少女”。
總之,AIGC 的能力還是不盡如人意。
我們離 AIGC 還有多遠?
我們更加期待 AIGC 可以在一些高度商業(yè)化的領域發(fā)揮作用,比如電影工業(yè)。
制作難、成本高是制約 CG 電影發(fā)展的原因之一。比如《阿凡達》制作成本 2.61 億美元,其中特效成本高達 2 億美元?!蹲冃谓饎?5》制作成本 2.17 億美元;《變形金剛 5》制作成本 2.17 億美元,特效支出占 1.3 億美元。
而中國信通院發(fā)布的《人工智能生成內(nèi)容(AIGC)白皮書(2022 年)》提到,AIGC 能夠合成虛擬場景,結(jié)合摳像技術(shù),將無法實拍或成本過高的場景生成出來 [11]。2017 年播出的《熱血長安》,劇中的大量場景便是通過人工智能技術(shù)虛擬生成。
雖然仍有觀眾對 AI 生成的視頻場景評價褒貶不一,但至少我們已經(jīng)看到了 AIGC 應用的影子。
References:
[1] Meet Me in the Metaverse 2020.12.7 https://a16z.com/2020/12/07/social-strikes-back-metaverse/
[2] WAIC 2021 | 阿里副總裁司羅:大規(guī)模語言模型如何賦能行業(yè)、創(chuàng)造價值 2021.7.18 https://mp.weixin.qq.com/ s/-SVH32XRzW5Y_FWAIr79MA
[3] AI 會永遠改變內(nèi)容營銷嗎?2021.4.23 https://easyai.tech/ blog / will-ai-change-content-marketing-forever/
[4] 模型開源還強大?神秘公司成了吊打巨頭和學閥的 AI “第三極” 2022.8.31 https://mp.weixin.qq.com/ s / QLAwtrVeCx5vLOELr6cXUQ
[5] Generative AI: A Creative New World 2022.9.9 https://www.sequoiacap.com/article/generative-ai-a-creative-new-world/
[6] AIGC 火了,VC 正在催 FA 推案子 2022.10.21 https://mp.weixin.qq.com/ s / RSSHIRlLDFI7zc6dGB47yQ
[7] 獲 1 億美元投資,AI 畫圖驚現(xiàn)獨角獸,人類畫師的末日真來了?2022.10.18 https://mp.weixin.qq.com/ s / cqiC11gAXbw4Xt3ZPWEr1g
[8] OpenAI Presents GPT-3, a 175 Billion Parameters Language Model 2020.7.7 https://developer.nvidia.com/blog/openai-presents-gpt-3-a-175-billion-parameters-language-model/
[9] AIGC:自動化內(nèi)容生成,AI 的下一個引爆點?|晨思 2022.8.24 https://mp.weixin.qq.com/ s / nJOR20fYgGVB147ZbO1JLQ
[10] 視頻創(chuàng)作者飯碗不保!Meta 和谷歌推出的 AI 黑科技來搶活兒了 2022.10.18 https://36kr.com/ p/1963050276766720
[11] 人工智能生成內(nèi)容(AIGC) 白皮書(2022 年) 2022.9 http://www.caict.ac.cn/ kxyj / qwfb / bps / 202209 / P020220902534520798735.pdf
本文來自微信公眾號:果殼硬科技 (ID:guokr233),作者:楊景詒,編輯:李拓
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。