誰能曾想,宋朝的老虎們,有一天能在國外被玩兒火了。
事情是這樣的,前不久谷歌不是出了個 AI 創(chuàng)作神器 Imagen 嘛。只要你給一句話,它就能生成符合語意的圖片。
然后腦洞大開的國外網(wǎng)友們,不按套路地給 Imagen 出了道題:
給宋代的東方老虎佩戴 VR。
Imagen 也沒在怕的,“啪的一下”就給出了一幅力作 ——《虎戴 VR》。
還別說,這幅《虎戴 VR》還真是有點那味了。不僅是畫風(fēng)上,VR 頭戴跟老虎以及整幅畫作能夠保持一致。就連手柄、雙虎嬉戲的感覺也都一步到位地畫了出來。
然后還有兩只老虎戴 VR,手牽著手一起“恰恰恰”的:
甚至 Imagen 還別出心裁地設(shè)計了個“連線”版 VR(可能在面對面看片吧):
但畢竟在 AI 作畫這事上,除了谷歌 Imagen 之外還有很多神器。于是,一場《虎戴 VR》作畫大戰(zhàn)就此拉開序幕。
(猜猜誰家的畫更有“心有猛虎,細嗅薔薇”的味道)
DALL-E 也來請戰(zhàn)
首先來應(yīng)戰(zhàn)的,定然是 OpenAI 家的 DALL?E。
網(wǎng)友 Jacob 出于好奇,便用它做了幾幅來做比較。
首先是滿滿“定妝照”風(fēng)格的《虎戴 VR》(很颯?。?/p>
不難看出,DALL?E 的畫作和 Imagen 在風(fēng)格上還是有很大的區(qū)別。
Imagen 的畫作更趨于簡約線條風(fēng),而 DALL?E 則更多了些許油畫的元素。
不過在意境方面,DALL?E 也是能夠產(chǎn)出“雙虎嬉戲”,甚至是擬人的畫作:
二者相比之下,網(wǎng)友們給出了他們的評價:
大多數(shù)網(wǎng)友們對谷歌家的 Imagen 更買單。
而除了它倆之外,像 AI 繪畫神器 MidJourney 也參與到了此次“大戰(zhàn)”。不過它的作品,就顯得略有些詭異了……
DALL·E VS Imagen
那么,同樣作為 AI 創(chuàng)作神器,最近大火的 Imagen 和 DALL?E 為何畫風(fēng)會截然不同呢?
Open AI 的 DALL?E 和谷歌的 Imagen,都可以直接通過文本描述生成類似超現(xiàn)實主義的圖像,讓機器也能擁有設(shè)計師般的創(chuàng)造力。
不過,二者的“創(chuàng)作”原理大不相同。
DALL?E 2 采用 CLIP 將文本特征映射到圖像特征,然后指導(dǎo)一個 GAN 或擴散模型生成圖像。
所謂 CLIP,是一個在各種圖像和文本上訓(xùn)練的神經(jīng)網(wǎng)絡(luò),對生成的多張圖片進行排序,挑選出更好的生成結(jié)果進行展示。
而谷歌的 Imagen 則使用純語言模型只負責(zé)編碼文本特征,把文本到圖像轉(zhuǎn)換的工作丟給了圖像生成模型。
語言模型部分使用的是谷歌自己的 T5-XXL 編碼器,將訓(xùn)練好的文本凍結(jié)。
圖像生成部分則是一系列擴散模型,先生成低分辨率圖像,再逐級超采樣。
谷歌的 T5-XXL 有 46 億個參數(shù),而擴大文本編碼器的規(guī)模,可以有效改善文本到圖像的對應(yīng)關(guān)系,和圖像的保真度。
此外,Imagen 還使用了另一種稱為 noise conditioning augmentation 的擴散技術(shù),幫助模型學(xué)習(xí)已添加的噪聲量,從而提高圖像的還原性。
對比來看,Imagen 似乎比 DALL?E 更具有“寫實”的特點:
目前,在 Imagen 官網(wǎng)上已涌現(xiàn)出各種新奇的圖像。
有人給浣熊戴上了宇航員頭盔。
泰迪熊在這里開始游蝶泳。
還有老鷹型的巧克力冰淇淋(嗯,還挺應(yīng)景)。
截至目前,Imagen 和 DALL?E 都還在調(diào)試階段,尚未向公眾開放。
One More Thing
這次《虎戴 VR》AI 作畫大戰(zhàn)中,也不乏有失敗的作品。
例如有網(wǎng)友就給出了用 DALL?E mini 來生成的示例。
不難看出,在這版中的《虎戴 VR》中,并沒有任何 VR 的出現(xiàn),而且老虎的面部基本上都是模糊不清。
據(jù)網(wǎng)友描述,他在生成的過程中,只是把“北宋”改成了“南宋”:
畫作最難的“形象性”,在這次有所下降。
那么你覺得《虎戴 VR》,哪家 AI 神器更強一些呢?
參考鏈接:
https://twitter.com/hardmaru/status/1532757753797586944?s=21&t=MhwVN5VXH22zFK7DWQJnCg
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。