【新智元導(dǎo)讀】Midjourney 大神的超深度測評來了!V6 比起 V5.2 究竟有哪些改進(jìn)?來感受一下吧。
最近,國外的一位名叫 Andrei Kovalev 的大神網(wǎng)友,做出了一份 Midjourney V6 的超深度評測。
指南很專業(yè),V6 和 V5.2 有什么不同,很直觀地就能看出來。
下面,就讓我們來跟隨大神的腳步,深入感受一下 Midjourney V6 的性能有多強(qiáng)吧。
V6 模型,究竟比 V5.2 強(qiáng)在哪
在以往,當(dāng)我們看一張 AI 生圖時,可能馬上就會感覺到這是 AI 畫的。
但在 Midjourney V6 中,你很少會有這樣的感覺。
在這一部分中,Kovalev 介紹了 V6 的優(yōu)勢、劣勢,以及和 V5.2 相比的主要變化。
Tim Walker 的高級時裝正面肖像,清澈的白色空靈機(jī)器人,半透明的皮膚淹沒在電線的海洋中。紅色和青色色調(diào),發(fā)光的高光,深色陰影
Kovalev 發(fā)現(xiàn),V6 有以下升級(因?yàn)楫?dāng)前還處于 Alpha 測試,以后還會發(fā)生變化)。
在遵循提示時更準(zhǔn)確了,并且使用更長的提示時,效果會更好。
新模型的一致性大大增強(qiáng)了。
V6 改進(jìn)了圖像提示功能。
現(xiàn)在 V6 有了兩個新的升頻器,具有微妙和創(chuàng)意模式(都將分辨率提高了兩倍)。
有一個「unopinionated」的 --style raw 模式(類似于 V5.2)。
此外,還可以在圖像中添加文本了。
所以,V6 究竟變成了什么樣子?
超現(xiàn)實(shí)主義
以往每次的 Midjourney 升級,都會提升照片的真實(shí)感,V6 也不例外。
最能定義 V6 的關(guān)鍵詞,恐怕就是超現(xiàn)實(shí)主義。
川內(nèi)凜子的少女太空飛行員攝影肖像
總而言之,V6 的逼真度爆表,上升到了一個新臺階,尤其是在攝影風(fēng)格上,已經(jīng)到了讓人迷惑的程度。
Kourtney Roy 的老海員攝影肖像
而 Midjourney V6 中逼真圖像功能之所以如此驚人,恰恰是因?yàn)榇嬖谌毕荩虹R頭像差、故意過度突出的區(qū)域、意外的失焦元素以及各種膠片效果。
Mitsuo Katsui 拍攝的初音未來照片 --stylize 175
當(dāng)然,V6 不止是人像畫得好。
第比利斯的延時攝影 --stylize 175
而且,在某些情況下需要更微妙的外觀和感覺,這時 V6 的超現(xiàn)實(shí)主義就顯得有些尖銳,顯得有些矯枉過正。
Ara Guler 對 1970 年代伊斯坦布爾賭場賭徒的肖像
細(xì)節(jié)很瘋狂
每次在 Midjourney 的下一個模型發(fā)布之前,許多人都會屏住呼吸,想看看他們會如何處理細(xì)節(jié)。
V6 中的細(xì)節(jié),很瘋狂。而新的 upscalers 功能,則讓細(xì)節(jié)更進(jìn)一步。
Ivan Bilibin 的畫作,描繪騎著白狼的冬季領(lǐng)主
不過,雖然圖像的復(fù)雜性隨著每個新模型的出現(xiàn)而穩(wěn)步上升,但在此過程中,卻丟失了一些東西,比如紋理。
比如,V4 的精細(xì)程度在 V5 + 中提高了十倍,因此幾乎不可能實(shí)現(xiàn)膠片顆?;蛘鎸?shí)筆觸這類效果。
雖然離真正的顆粒感似乎仍然遙不可及,但 V6 顯然朝著以前失去的原始性,邁出了明確的一步。
它的紋理令人驚嘆,比起 V5 來大放異彩(在 V5 中,需要選擇「non-refined」的視覺風(fēng)格)。
Marianna Rothen 的夢幻女孩
另一個能很好地描述 V6 的概念,是非常規(guī)組合(unconventional composition),這導(dǎo)致了 V5.2 中結(jié)構(gòu)化和平衡方法的重大轉(zhuǎn)變。
以前的模型追求幾何完美、黃金比例和中心主體,而 V6 追求不對稱,經(jīng)常將主體從畫面中間移開。
Tyrus Wong 的跨維度神秘野獸
這可能會提供更具動態(tài)性和吸引力的視覺效果,但也需要相應(yīng)地調(diào)整提示。即使是很小的調(diào)整,也可以恢復(fù)中心構(gòu)圖和對稱性。
可變性增強(qiáng)
可以看到,在 V6 中,同一提示結(jié)果的可變性增強(qiáng)了。
與早期模型相比,單個提示的四個變體,通常顯示出更明顯的差異。
Jessie Willcox Smith 的《銀術(shù)士》
許多情況下,這會產(chǎn)生一種更具創(chuàng)意、更有趣,有時甚至更忠實(shí)于現(xiàn)實(shí)生活中原型的多樣性的藝術(shù)風(fēng)格表現(xiàn)。
藝術(shù)風(fēng)格
在提示中,我們可以引用「Style modifiers」的名稱,召喚圖像的特定視覺風(fēng)格、技術(shù)、流派、主題或上下文。
像素藝術(shù)
現(xiàn)在,每個新模型都更善于了解源材料,并且在輸出中重新創(chuàng)建它,這已經(jīng)是一個傳統(tǒng)。
然而,Midjourney 從未停止這種戲劇性的變化。
by Jody Bergsma
無論這些風(fēng)格本身多么偉大,真正將它們從對原作的單純解釋轉(zhuǎn)變?yōu)楠?dú)特的東西的,是我們添加的提示。
圖片中添加文本
雙手拿著報紙,標(biāo)題為「Midjourney 的文本 - 真實(shí)還是騙局?」
更多詳解,還請參考原文網(wǎng)站。
參考資料
https://midlibrary.io/midguide/midjourney-v6-in-depth-review-part-1-overview
本文來自微信公眾號:新智元 (ID:AI_era)
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。