設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

Midjourney V6 超進(jìn)化,大神網(wǎng)友深度評(píng)測(cè)來了!畫質(zhì)逼真到可怕,人像圖片令人驚呆

新智元 2024/1/20 19:16:26 責(zé)編:清源

【新智元導(dǎo)讀】Midjourney 大神的超深度測(cè)評(píng)來了!V6 比起 V5.2 究竟有哪些改進(jìn)?來感受一下吧。

最近,國外的一位名叫 Andrei Kovalev 的大神網(wǎng)友,做出了一份 Midjourney V6 的超深度評(píng)測(cè)。

指南很專業(yè),V6 和 V5.2 有什么不同,很直觀地就能看出來。

下面,就讓我們來跟隨大神的腳步,深入感受一下 Midjourney V6 的性能有多強(qiáng)吧。

V6 模型,究竟比 V5.2 強(qiáng)在哪

在以往,當(dāng)我們看一張 AI 生圖時(shí),可能馬上就會(huì)感覺到這是 AI 畫的。

但在 Midjourney V6 中,你很少會(huì)有這樣的感覺。

在這一部分中,Kovalev 介紹了 V6 的優(yōu)勢(shì)、劣勢(shì),以及和 V5.2 相比的主要變化。

Tim Walker 的高級(jí)時(shí)裝正面肖像,清澈的白色空靈機(jī)器人,半透明的皮膚淹沒在電線的海洋中。紅色和青色色調(diào),發(fā)光的高光,深色陰影

▲ V6

▲ V5.2

Kovalev 發(fā)現(xiàn),V6 有以下升級(jí)(因?yàn)楫?dāng)前還處于 Alpha 測(cè)試,以后還會(huì)發(fā)生變化)。

在遵循提示時(shí)更準(zhǔn)確了,并且使用更長的提示時(shí),效果會(huì)更好。

新模型的一致性大大增強(qiáng)了。

V6 改進(jìn)了圖像提示功能。

現(xiàn)在 V6 有了兩個(gè)新的升頻器,具有微妙和創(chuàng)意模式(都將分辨率提高了兩倍)。

有一個(gè)「unopinionated」的 --style raw 模式(類似于 V5.2)。

此外,還可以在圖像中添加文本了。

所以,V6 究竟變成了什么樣子?

超現(xiàn)實(shí)主義

以往每次的 Midjourney 升級(jí),都會(huì)提升照片的真實(shí)感,V6 也不例外。

最能定義 V6 的關(guān)鍵詞,恐怕就是超現(xiàn)實(shí)主義。

川內(nèi)凜子的少女太空飛行員攝影肖像

▲ V6

▲ V5.2

總而言之,V6 的逼真度爆表,上升到了一個(gè)新臺(tái)階,尤其是在攝影風(fēng)格上,已經(jīng)到了讓人迷惑的程度。

Kourtney Roy 的老海員攝影肖像

▲ V6

而 Midjourney V6 中逼真圖像功能之所以如此驚人,恰恰是因?yàn)榇嬖谌毕荩虹R頭像差、故意過度突出的區(qū)域、意外的失焦元素以及各種膠片效果。

Mitsuo Katsui 拍攝的初音未來照片 --stylize 175

當(dāng)然,V6 不止是人像畫得好。

第比利斯的延時(shí)攝影 --stylize 175

而且,在某些情況下需要更微妙的外觀和感覺,這時(shí) V6 的超現(xiàn)實(shí)主義就顯得有些尖銳,顯得有些矯枉過正。

Ara Guler 對(duì) 1970 年代伊斯坦布爾賭場(chǎng)賭徒的肖像

▲ V6

▲ V5.2

細(xì)節(jié)很瘋狂

每次在 Midjourney 的下一個(gè)模型發(fā)布之前,許多人都會(huì)屏住呼吸,想看看他們會(huì)如何處理細(xì)節(jié)。

V6 中的細(xì)節(jié),很瘋狂。而新的 upscalers 功能,則讓細(xì)節(jié)更進(jìn)一步。

Ivan Bilibin 的畫作,描繪騎著白狼的冬季領(lǐng)主

▲ V6

▲ V5.2

不過,雖然圖像的復(fù)雜性隨著每個(gè)新模型的出現(xiàn)而穩(wěn)步上升,但在此過程中,卻丟失了一些東西,比如紋理。

比如,V4 的精細(xì)程度在 V5 + 中提高了十倍,因此幾乎不可能實(shí)現(xiàn)膠片顆?;蛘鎸?shí)筆觸這類效果。

雖然離真正的顆粒感似乎仍然遙不可及,但 V6 顯然朝著以前失去的原始性,邁出了明確的一步。

它的紋理令人驚嘆,比起 V5 來大放異彩(在 V5 中,需要選擇「non-refined」的視覺風(fēng)格)。

Marianna Rothen 的夢(mèng)幻女孩

▲ V6

▲ V5.2

另一個(gè)能很好地描述 V6 的概念,是非常規(guī)組合(unconventional composition),這導(dǎo)致了 V5.2 中結(jié)構(gòu)化和平衡方法的重大轉(zhuǎn)變。

以前的模型追求幾何完美、黃金比例和中心主體,而 V6 追求不對(duì)稱,經(jīng)常將主體從畫面中間移開。

Tyrus Wong 的跨維度神秘野獸

▲ V6

▲ V5

這可能會(huì)提供更具動(dòng)態(tài)性和吸引力的視覺效果,但也需要相應(yīng)地調(diào)整提示。即使是很小的調(diào)整,也可以恢復(fù)中心構(gòu)圖和對(duì)稱性。

可變性增強(qiáng)

可以看到,在 V6 中,同一提示結(jié)果的可變性增強(qiáng)了。

與早期模型相比,單個(gè)提示的四個(gè)變體,通常顯示出更明顯的差異。

Jessie Willcox Smith 的《銀術(shù)士》

▲ V6

▲ V5.2

許多情況下,這會(huì)產(chǎn)生一種更具創(chuàng)意、更有趣,有時(shí)甚至更忠實(shí)于現(xiàn)實(shí)生活中原型的多樣性的藝術(shù)風(fēng)格表現(xiàn)。

藝術(shù)風(fēng)格

在提示中,我們可以引用「Style modifiers」的名稱,召喚圖像的特定視覺風(fēng)格、技術(shù)、流派、主題或上下文。

像素藝術(shù)

▲ V6

▲ V5.2

現(xiàn)在,每個(gè)新模型都更善于了解源材料,并且在輸出中重新創(chuàng)建它,這已經(jīng)是一個(gè)傳統(tǒng)。

然而,Midjourney 從未停止這種戲劇性的變化。

by Jody Bergsma

▲ V6

▲ V5.2

無論這些風(fēng)格本身多么偉大,真正將它們從對(duì)原作的單純解釋轉(zhuǎn)變?yōu)楠?dú)特的東西的,是我們添加的提示。

圖片中添加文本

雙手拿著報(bào)紙,標(biāo)題為「Midjourney 的文本 - 真實(shí)還是騙局?」

▲ V6

▲ V5.2

更多詳解,還請(qǐng)參考原文網(wǎng)站。

參考資料

  • https://midlibrary.io/midguide/midjourney-v6-in-depth-review-part-1-overview

本文來自微信公眾號(hào):新智元 (ID:AI_era)

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:midjourney,生成式AI

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知