設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

宋朝名畫“虎戴 VR”,在外網(wǎng)火了

量子位 2022/6/5 13:55:37 責(zé)編:汪淼

誰能曾想,宋朝的老虎們,有一天能在國外被玩兒火了。

事情是這樣的,前不久谷歌不是出了個 AI 創(chuàng)作神器 Imagen 嘛。只要你給一句話,它就能生成符合語意的圖片。

然后腦洞大開的國外網(wǎng)友們,不按套路地給 Imagen 出了道題:

給宋代的東方老虎佩戴 VR。

Imagen 也沒在怕的,“啪的一下”就給出了一幅力作 ——《虎戴 VR》。

還別說,這幅《虎戴 VR》還真是有點那味了。不僅是畫風(fēng)上,VR 頭戴跟老虎以及整幅畫作能夠保持一致。就連手柄、雙虎嬉戲的感覺也都一步到位地畫了出來。

然后還有兩只老虎戴 VR,手牽著手一起“恰恰恰”的:

甚至 Imagen 還別出心裁地設(shè)計了個“連線”版 VR(可能在面對面看片吧):

但畢竟在 AI 作畫這事上,除了谷歌 Imagen 之外還有很多神器。于是,一場《虎戴 VR》作畫大戰(zhàn)就此拉開序幕。

(猜猜誰家的畫更有“心有猛虎,細嗅薔薇”的味道)

DALL-E 也來請戰(zhàn)

首先來應(yīng)戰(zhàn)的,定然是 OpenAI 家的 DALL?E

網(wǎng)友 Jacob 出于好奇,便用它做了幾幅來做比較。

首先是滿滿“定妝照”風(fēng)格的《虎戴 VR》(很颯?。?/p>

不難看出,DALL?E 的畫作和 Imagen 在風(fēng)格上還是有很大的區(qū)別。

Imagen 的畫作更趨于簡約線條風(fēng),而 DALL?E 則更多了些許油畫的元素。

不過在意境方面,DALL?E 也是能夠產(chǎn)出“雙虎嬉戲”,甚至是擬人的畫作:

二者相比之下,網(wǎng)友們給出了他們的評價:

大多數(shù)網(wǎng)友們對谷歌家的 Imagen 更買單。

而除了它倆之外,像 AI 繪畫神器 MidJourney 也參與到了此次“大戰(zhàn)”。不過它的作品,就顯得略有些詭異了……

DALL·E VS Imagen

那么,同樣作為 AI 創(chuàng)作神器,最近大火的 Imagen 和 DALL?E 為何畫風(fēng)會截然不同呢?

Open AI 的 DALL?E 和谷歌的 Imagen,都可以直接通過文本描述生成類似超現(xiàn)實主義的圖像,讓機器也能擁有設(shè)計師般的創(chuàng)造力。

不過,二者的“創(chuàng)作”原理大不相同。

DALL?E 2 采用 CLIP 將文本特征映射到圖像特征,然后指導(dǎo)一個 GAN 或擴散模型生成圖像。

所謂 CLIP,是一個在各種圖像和文本上訓(xùn)練的神經(jīng)網(wǎng)絡(luò),對生成的多張圖片進行排序,挑選出更好的生成結(jié)果進行展示。

而谷歌的 Imagen 則使用純語言模型只負責(zé)編碼文本特征,把文本到圖像轉(zhuǎn)換的工作丟給了圖像生成模型。

語言模型部分使用的是谷歌自己的 T5-XXL 編碼器,將訓(xùn)練好的文本凍結(jié)。

圖像生成部分則是一系列擴散模型,先生成低分辨率圖像,再逐級超采樣。

谷歌的 T5-XXL 有 46 億個參數(shù),而擴大文本編碼器的規(guī)模,可以有效改善文本到圖像的對應(yīng)關(guān)系,和圖像的保真度。

此外,Imagen 還使用了另一種稱為 noise conditioning augmentation 的擴散技術(shù),幫助模型學(xué)習(xí)已添加的噪聲量,從而提高圖像的還原性。

對比來看,Imagen 似乎比 DALL?E 更具有“寫實”的特點

目前,在 Imagen 官網(wǎng)上已涌現(xiàn)出各種新奇的圖像。

有人給浣熊戴上了宇航員頭盔。

泰迪熊在這里開始游蝶泳。

還有老鷹型的巧克力冰淇淋(嗯,還挺應(yīng)景)。

截至目前,Imagen 和 DALL?E 都還在調(diào)試階段,尚未向公眾開放。

One More Thing

這次《虎戴 VR》AI 作畫大戰(zhàn)中,也不乏有失敗的作品。

例如有網(wǎng)友就給出了用 DALL?E mini 來生成的示例。

不難看出,在這版中的《虎戴 VR》中,并沒有任何 VR 的出現(xiàn),而且老虎的面部基本上都是模糊不清。

據(jù)網(wǎng)友描述,他在生成的過程中,只是把“北宋”改成了“南宋”:

畫作最難的“形象性”,在這次有所下降。

那么你覺得《虎戴 VR》,哪家 AI 神器更強一些呢?

參考鏈接:

https://twitter.com/hardmaru/status/1532757753797586944?s=21&t=MhwVN5VXH22zFK7DWQJnCg

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:VR,AI圖像生成

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知