【新智元導(dǎo)讀】Midjourney 大神的超深度測(cè)評(píng)來了!V6 比起 V5.2 究竟有哪些改進(jìn)?來感受一下吧。
最近,國外的一位名叫 Andrei Kovalev 的大神網(wǎng)友,做出了一份 Midjourney V6 的超深度評(píng)測(cè)。
指南很專業(yè),V6 和 V5.2 有什么不同,很直觀地就能看出來。
下面,就讓我們來跟隨大神的腳步,深入感受一下 Midjourney V6 的性能有多強(qiáng)吧。
V6 模型,究竟比 V5.2 強(qiáng)在哪
在以往,當(dāng)我們看一張 AI 生圖時(shí),可能馬上就會(huì)感覺到這是 AI 畫的。
但在 Midjourney V6 中,你很少會(huì)有這樣的感覺。
在這一部分中,Kovalev 介紹了 V6 的優(yōu)勢(shì)、劣勢(shì),以及和 V5.2 相比的主要變化。
Tim Walker 的高級(jí)時(shí)裝正面肖像,清澈的白色空靈機(jī)器人,半透明的皮膚淹沒在電線的海洋中。紅色和青色色調(diào),發(fā)光的高光,深色陰影
Kovalev 發(fā)現(xiàn),V6 有以下升級(jí)(因?yàn)楫?dāng)前還處于 Alpha 測(cè)試,以后還會(huì)發(fā)生變化)。
在遵循提示時(shí)更準(zhǔn)確了,并且使用更長的提示時(shí),效果會(huì)更好。
新模型的一致性大大增強(qiáng)了。
V6 改進(jìn)了圖像提示功能。
現(xiàn)在 V6 有了兩個(gè)新的升頻器,具有微妙和創(chuàng)意模式(都將分辨率提高了兩倍)。
有一個(gè)「unopinionated」的 --style raw 模式(類似于 V5.2)。
此外,還可以在圖像中添加文本了。
所以,V6 究竟變成了什么樣子?
超現(xiàn)實(shí)主義
以往每次的 Midjourney 升級(jí),都會(huì)提升照片的真實(shí)感,V6 也不例外。
最能定義 V6 的關(guān)鍵詞,恐怕就是超現(xiàn)實(shí)主義。
川內(nèi)凜子的少女太空飛行員攝影肖像
總而言之,V6 的逼真度爆表,上升到了一個(gè)新臺(tái)階,尤其是在攝影風(fēng)格上,已經(jīng)到了讓人迷惑的程度。
Kourtney Roy 的老海員攝影肖像
而 Midjourney V6 中逼真圖像功能之所以如此驚人,恰恰是因?yàn)榇嬖谌毕荩虹R頭像差、故意過度突出的區(qū)域、意外的失焦元素以及各種膠片效果。
Mitsuo Katsui 拍攝的初音未來照片 --stylize 175
當(dāng)然,V6 不止是人像畫得好。
第比利斯的延時(shí)攝影 --stylize 175
而且,在某些情況下需要更微妙的外觀和感覺,這時(shí) V6 的超現(xiàn)實(shí)主義就顯得有些尖銳,顯得有些矯枉過正。
Ara Guler 對(duì) 1970 年代伊斯坦布爾賭場(chǎng)賭徒的肖像
細(xì)節(jié)很瘋狂
每次在 Midjourney 的下一個(gè)模型發(fā)布之前,許多人都會(huì)屏住呼吸,想看看他們會(huì)如何處理細(xì)節(jié)。
V6 中的細(xì)節(jié),很瘋狂。而新的 upscalers 功能,則讓細(xì)節(jié)更進(jìn)一步。
Ivan Bilibin 的畫作,描繪騎著白狼的冬季領(lǐng)主
不過,雖然圖像的復(fù)雜性隨著每個(gè)新模型的出現(xiàn)而穩(wěn)步上升,但在此過程中,卻丟失了一些東西,比如紋理。
比如,V4 的精細(xì)程度在 V5 + 中提高了十倍,因此幾乎不可能實(shí)現(xiàn)膠片顆?;蛘鎸?shí)筆觸這類效果。
雖然離真正的顆粒感似乎仍然遙不可及,但 V6 顯然朝著以前失去的原始性,邁出了明確的一步。
它的紋理令人驚嘆,比起 V5 來大放異彩(在 V5 中,需要選擇「non-refined」的視覺風(fēng)格)。
Marianna Rothen 的夢(mèng)幻女孩
另一個(gè)能很好地描述 V6 的概念,是非常規(guī)組合(unconventional composition),這導(dǎo)致了 V5.2 中結(jié)構(gòu)化和平衡方法的重大轉(zhuǎn)變。
以前的模型追求幾何完美、黃金比例和中心主體,而 V6 追求不對(duì)稱,經(jīng)常將主體從畫面中間移開。
Tyrus Wong 的跨維度神秘野獸
這可能會(huì)提供更具動(dòng)態(tài)性和吸引力的視覺效果,但也需要相應(yīng)地調(diào)整提示。即使是很小的調(diào)整,也可以恢復(fù)中心構(gòu)圖和對(duì)稱性。
可變性增強(qiáng)
可以看到,在 V6 中,同一提示結(jié)果的可變性增強(qiáng)了。
與早期模型相比,單個(gè)提示的四個(gè)變體,通常顯示出更明顯的差異。
Jessie Willcox Smith 的《銀術(shù)士》
許多情況下,這會(huì)產(chǎn)生一種更具創(chuàng)意、更有趣,有時(shí)甚至更忠實(shí)于現(xiàn)實(shí)生活中原型的多樣性的藝術(shù)風(fēng)格表現(xiàn)。
藝術(shù)風(fēng)格
在提示中,我們可以引用「Style modifiers」的名稱,召喚圖像的特定視覺風(fēng)格、技術(shù)、流派、主題或上下文。
像素藝術(shù)
現(xiàn)在,每個(gè)新模型都更善于了解源材料,并且在輸出中重新創(chuàng)建它,這已經(jīng)是一個(gè)傳統(tǒng)。
然而,Midjourney 從未停止這種戲劇性的變化。
by Jody Bergsma
無論這些風(fēng)格本身多么偉大,真正將它們從對(duì)原作的單純解釋轉(zhuǎn)變?yōu)楠?dú)特的東西的,是我們添加的提示。
圖片中添加文本
雙手拿著報(bào)紙,標(biāo)題為「Midjourney 的文本 - 真實(shí)還是騙局?」
更多詳解,還請(qǐng)參考原文網(wǎng)站。
參考資料
https://midlibrary.io/midguide/midjourney-v6-in-depth-review-part-1-overview
本文來自微信公眾號(hào):新智元 (ID:AI_era)
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。