設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

FLUX“官方版 ControlNet”來(lái)了:景深輪廓更精準(zhǔn)控制,共四款官方工具一齊上線

量子位 2024/11/22 12:46:57 責(zé)編:問舟

“最強(qiáng)繪圖模型”FLUX 深夜更新,一口氣連發(fā)四款工具!

用官方的話說(shuō),這次的更新給 FLUX“帶來(lái)了更多的控制方式和可操作性”。別看官方說(shuō)得簡(jiǎn)單,實(shí)際效果可是要震撼得多。

只用一個(gè)相同的輪廓,F(xiàn)LUX 就能變幻出各式各樣不同風(fēng)格的畫作:

或者傳一張圖,不用提示詞就能讓人物做出各種不同的動(dòng)作,同時(shí)保持角色一致:

此外,還可以對(duì)現(xiàn)有的圖像進(jìn)行擴(kuò)展,不斷延伸畫面:

具體來(lái)說(shuō),此次 FLUX 一共發(fā)布了這四款創(chuàng)意工具:

  • 編輯工具 fill,可以修改畫面細(xì)節(jié)或擴(kuò)展畫面;

  • 輪廓控制工具 Canny,類似 ControlNet;

  • 景深控制工具 Depth,類似 ControlNet;

  • 變換工具 Redux,可改變?nèi)宋飫?dòng)作、畫面視角 / 風(fēng)格。

這些工具分為 dev 和 pro 兩個(gè)版本,dev 版的代碼和模型權(quán)重均已開放下載,pro 版也通過 API 提供。而且支持創(chuàng)作者常用的 ComfyUI,能夠簡(jiǎn)單整合進(jìn)繪畫工作流。

有網(wǎng)友評(píng)論說(shuō),這是一件大事,因?yàn)?BFL(FLUX 開發(fā)團(tuán)隊(duì))終于有了自己的 ControlNet。

還有人表示,這些工具解鎖了(AI 繪圖的)可操縱性,是創(chuàng)意繪圖的 game changer。

四款工具一齊上線

首先來(lái)看 fill,它可以對(duì)畫面中包括文字在內(nèi)的任意細(xì)節(jié)進(jìn)行編輯或修復(fù),比如圖像中人物的衣著,或者加入新的元素。

此外還支持 outpainting,可以將圖像擴(kuò)展到原始畫面之外。

測(cè)評(píng)結(jié)果上,F(xiàn)LUX 的官方工具,和第三方 FLUX 工具 Alimama Creative 體現(xiàn)出了優(yōu)勢(shì)。

同時(shí)也戰(zhàn)勝了之前來(lái)踢館的 Ideogram,對(duì)比 SD 1.5 的類似功能則更是優(yōu)勢(shì)明顯。

以文字修改任務(wù)為例,測(cè)試中對(duì)下圖“Beers”部分進(jìn)行了圈選,并要求修改為“Spaghetti”。

可以看出,官方 Fill 工具效果最為自然,Ideogram 也還不錯(cuò),但仔細(xì)對(duì)比會(huì)發(fā)現(xiàn) FLUX 的文字粗細(xì)更加接近畫面中的其他文字。

第三方插件則并未匹配原始字體,至于 SD 1.5 那更是慘不忍睹。

再來(lái)看看非文字的效果,這項(xiàng)任務(wù)需要在圖像指定的位置(左側(cè))加上模糊(blurry)的小貓照片。

下圖中的順序和前面一樣,可以看到除了左上角的 FLUX fill 工具之外,都沒有滿足“模糊”這個(gè)要求。

單看的話畫面,第三方插件和 Ideogram 也都還可以,不過第三方插件“畫蛇添足”地給原圖的第一個(gè)木塊加上了兩個(gè)點(diǎn)。而 SD 1.5,似乎在保持著一種穩(wěn)定的抽象。

第二個(gè)工具 Canny,相當(dāng)于一個(gè)輪廓 ControlNet,通過邊緣檢測(cè)來(lái)精準(zhǔn)地控制圖像轉(zhuǎn)換過程中的結(jié)構(gòu)。

這次對(duì)比的對(duì)象包括第三方工具 InstantX,以及 SD 1.5 和 SDXL,結(jié)果 FLUX.1 Canny 的成績(jī)優(yōu)勢(shì)明顯。

當(dāng)然這輪測(cè)試是直接把提取好的輪廓給模型,難度相對(duì)于讓模型自己提取有一點(diǎn)降低。

利用這樣的一個(gè)輪廓,每個(gè)模型或工具需要生成 6 張不同的圖片(每個(gè) prompt 兩張)。

下圖中,第一行為 Flux.1 Canny(Pro)的作品,第二行為 InstantX,第三第四行分別是 SD 1.5 和 SDXL。

從左到右六張圖片的 prompt 依次是:

1&2:a robot made of gold(一個(gè)金子做的機(jī)器人)

3&4:a robot made of brown and white clay(一個(gè)用棕色和白色黏土做的機(jī)器人)

5&6:a white robot in front of a gray background(一個(gè)白色的機(jī)器人在灰色的背景前方)

對(duì)于“金子”的部分,F(xiàn)LUX.1 Canny 第一次畫出來(lái)的效果是質(zhì)感最好的,而且 FLUX.1 Canny 質(zhì)量穩(wěn)定性保持得是比較好的。

單就這個(gè)任務(wù)而言,SD 1.5 的作品再次成為了最顯眼包的一組。

接下來(lái)是 Depth,它和 Canny 一樣都是類似 ControlNet 的存在,顧名思義控制的內(nèi)容是景深。

這次沒有再把 SD 拉過來(lái),參與對(duì)比的是兩款第三方插件,還有 MidJourney。

在一項(xiàng)測(cè)試任務(wù)中,提取之后的景深關(guān)系是這樣的:

下圖中,第一行對(duì)應(yīng) FLUX.1 Depth(Pro),第二、三行對(duì)應(yīng) Jasper 和 Shakker 兩款第三方工具,最后一行對(duì)應(yīng) MidJourney。

從左到右,提示詞依次是:

1&2:mountain cabin, anime style(山間小屋,動(dòng)漫風(fēng)格)

3&4:1950’s aesthetics(上世紀(jì) 50 年代的美學(xué))

這里就不一一點(diǎn)評(píng)細(xì)節(jié)了,但 FLUX.1 Depth 的作品是最忠實(shí)于控制條件中景深關(guān)系的一組,而且也不像 MidJourney 那樣出現(xiàn)了畫面割裂的情況。

最后是 Redux,給定輸入圖像,可以讓 FLUX 在其基礎(chǔ)之上進(jìn)行“重新設(shè)計(jì)”,變換出各種不同的圖片。圖像的背景、角度、畫風(fēng)都可以調(diào)整,同時(shí)在變換過程中保持角色一致。

如果實(shí)在沒靈感,也可以只把圖丟給模型,不用輸入提示詞,讓模型自行發(fā)揮幫你轉(zhuǎn)換。

相比于 SD 1.5 和 SDXL,領(lǐng)先優(yōu)勢(shì)十分明顯。

比如這張圖中有只小貓正抱著一條魚奔跑,測(cè)試過程當(dāng)中沒有輸入提示詞。

每個(gè)模型各自生成了三張圖,由上到下分別是 FLUX.1 Redux(Pro)、SD 1.5 和 SDXL。

在 FLUX 作品中魚和貓的長(zhǎng)相都和原圖保持了一致,在細(xì)節(jié)動(dòng)作時(shí)做出了變化,而 SD 1.5 生成的圖像里貓和魚都已經(jīng)完全變了樣子。

到了 SDXL 這里,好家伙,不要說(shuō)風(fēng)格了,貓和魚直接陷入了“量子糾纏”,在三張圖中都沒有同時(shí)出現(xiàn)。

總之對(duì)比一圈之后發(fā)現(xiàn),F(xiàn)LUX 這次上線的四款官方工具,不管是相對(duì)第三方工具還是相對(duì)于其他模型,都十分扛打。

四款工具都是支持 pro 和 dev 兩個(gè)版本(其中 Canny 和 Depth 還分完整版和 LoRA 版),dev 版本代碼和模型權(quán)重都是開放下載,pro 版則要通過 BFL API 來(lái)使用。

另外,這四個(gè)工具還會(huì)通過五家 FLUX 合作的模型平臺(tái)提供,這五家分別是 fal(L 的小寫).ai、Replicate、 Together.ai、Freepik 和 krea.ai

公告地址(含代碼 / 權(quán)重 / 測(cè)試集下載):

  • https://blackforestlabs.ai/flux-1-tools/

參考鏈接:

  • [1]https://www.marktechpost.com/2024/11/21/black-forest-labs-release-flux-1-tools-a-suite-of-ai-models-designed-to-add-control-and-steerability-to-the-base-text-to-image-model-flux-1/

  • [2]https://x.com/fofrAI/status/1859621532550480342

  • [3]https://x.com/fofrAI/status/1859618518863323591

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:ControlNetflux

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知