原文標(biāo)題:《AI 免費(fèi)設(shè)計(jì) LOGO 效果驚艷,雷軍 200 萬(wàn)花早了》
很快啊,Stable Diffusion 又被發(fā)掘新用途了 ——
設(shè)計(jì) LOGO 最關(guān)鍵的“形意結(jié)合”,被它拿捏得明明白白??匆?jiàn) Cat 秒畫貓貓頭:
瑜伽店 YOGA 幾個(gè)字母用人體形態(tài)一轉(zhuǎn)換,風(fēng)格完全不出錯(cuò):
只設(shè)計(jì)其中一個(gè)字也沒(méi)問(wèn)題,例如將 Dog 的 D 畫成一個(gè)狗子:
屬實(shí)簡(jiǎn)潔又傳神了有木有!
哪怕是面對(duì)中文字體,AI 也能很好地理解其中的意思,快速畫出甲方想要傳達(dá)的 LOGO 形象:
要是開店用上這個(gè),哪里還需要花幾十上百塊專門設(shè)計(jì)一個(gè) LOGO 出來(lái)?(doge)
雖然之前也有不少設(shè)計(jì) LOGO 的 AI 了,不過(guò)從這次生成的效果來(lái)看,還真有點(diǎn)不太一樣。
保留一部分原有字體的味道
事實(shí)上,在這次研究之前,已經(jīng)有不少研究在考慮如何用 AI 設(shè)計(jì) LOGO。
從效果來(lái)看,主要可以分成三類:
一是以字體為形狀限制,將圖片風(fēng)格遷移上去(如圖 AB);二是以圖片風(fēng)格為基底,將字體遷移到圖片中去(圖 D);三是將不同圖片的形狀和字體關(guān)聯(lián)起來(lái),生成或彩色或黑白的“圖像拼接”風(fēng)格 LOGO 設(shè)計(jì)(圖 CE)。
然而,與下面人類手工設(shè)計(jì)的 LOGO 比起來(lái),上面 AI 設(shè)計(jì)的效果不能說(shuō)不好看,但似乎還差那么點(diǎn)意思:
作者們經(jīng)過(guò)一通探查,發(fā)現(xiàn)人類手工設(shè)計(jì)的 LOGO 并不“喧賓奪主”。
人類設(shè)計(jì)師會(huì)在保留原本字體特色、讓人們能一眼認(rèn)出單詞的基礎(chǔ)上,再加入一點(diǎn)創(chuàng)新之處,例如將 Jazz 中的 J 改成樂(lè)器,但其他人一眼仍然能認(rèn)出“JAZZ”字體的形狀。
整體來(lái)說(shuō),就是在保留一部分字體“味道”的同時(shí),加入一定的設(shè)計(jì)感。
例如這是 Stable Diffusion 生成的“FROG”設(shè)計(jì),F(xiàn)RO 仍然是原本字體的形狀,只有 G 變成一只跳出去的小青蛙:
如果用 Stable Diffusion 2 進(jìn)一步進(jìn)行后期處理的話,還能進(jìn)一步實(shí)現(xiàn)上色功能,顯得更加生動(dòng):
生成 LOGO 的風(fēng)格也能隨著原本設(shè)計(jì)字體的變化,而產(chǎn)生不一樣的變化。
例如這是 8 種字體下生成的不同瑜伽 LOGO,每種風(fēng)格都不一樣:
相比之下,其他 AI 模型在生成字體的時(shí)候,倒是更喜歡保留自己的風(fēng)格(手動(dòng)狗頭):
那么,這種神奇的字體設(shè)計(jì) AI 是怎么做出來(lái)的?
用貝塞爾曲線調(diào)整字母形狀
為了一定程度上保留原本字體的風(fēng)格、以及只改變單詞中的某幾個(gè)字母,作者們想出一種“微調(diào)”字母形狀的方法 ——
那就是讓 AI 學(xué)會(huì)用貝塞爾曲線,對(duì)不同字體的字母進(jìn)行小幅度變形。
(用過(guò) PS 中“鋼筆”的小伙伴們應(yīng)該對(duì)貝塞爾曲線不陌生,用它能控制鼠標(biāo)畫出一些神奇的曲線)
具體控制點(diǎn)數(shù)量,則根據(jù)字母復(fù)雜度和字體風(fēng)格進(jìn)行迭代變換,直到設(shè)計(jì)出來(lái)的字母符合要求,其中橙色是初始點(diǎn),藍(lán)色是后續(xù)增加的控制點(diǎn):
控制點(diǎn)數(shù)量對(duì)生成效果影響有多大?
例如這是不同數(shù)量的控制點(diǎn)生成字母的效果,如果數(shù)量太少,會(huì)看不清設(shè)計(jì)的圖像形狀;但數(shù)量過(guò)多又容易扭曲字體原本的形狀:
基于這種核心設(shè)計(jì)思路,作者們結(jié)合 Stable Diffusion 和 CLIP,設(shè)計(jì)出了一整個(gè)字體設(shè)計(jì) AI 模型:
其中,ACAP(as conformal as possible)損失函數(shù)基于德勞內(nèi)三角形剖分算法,對(duì)字母形狀進(jìn)一步進(jìn)行了約束。
例如這是 PANTS(褲子)在變形前和變形之后的形態(tài),可以看見(jiàn) ACAP 在保留褲子形態(tài)的同時(shí),也保留了字體的效果:
與此同時(shí),為了進(jìn)一步保留字體形態(tài),作者們采用了一個(gè)低通濾波器,保證調(diào)整后的字母不與原始字母偏離太多。例如這是 Bear(熊)中的 B 調(diào)整后的形態(tài):
應(yīng)用這套模型,生成每個(gè)字母的速度也還不錯(cuò)。
在一塊 RTX 2080 GPU 上,生成單個(gè)字母的 LOGO 設(shè)計(jì)大約需要 5 分鐘。
作者介紹
雖然作者們放到項(xiàng)目主頁(yè)上的論文是匿名的:
不過(guò)在 arXiv 上,作者們的名字倒是已經(jīng)公開了,他們分別來(lái)自以色列特拉維夫大學(xué)、Reichman University(萊希曼大學(xué)),以及倫敦大學(xué)金史密斯學(xué)院:
共同一作 Shir Iluz,特拉維夫大學(xué)電子與電氣工程理學(xué)碩士,目前的研究方向是生成 AI,感興趣的方向是深度學(xué)習(xí)與計(jì)算機(jī)視覺(jué)。
共同一作 Yael Vinker,特拉維夫大學(xué)計(jì)算機(jī)視覺(jué)博士生,曾經(jīng)在以色列希伯來(lái)大學(xué)獲得計(jì)算機(jī)科學(xué)本科與碩士學(xué)位,目前研究方向同樣是深度學(xué)習(xí)與計(jì)算機(jī)視覺(jué)。
這么看來(lái),雷軍當(dāng)年設(shè)計(jì)小米 LOGO 的 200 萬(wàn)元花早了啊
論文地址:
https://arxiv.org/abs/2303.01818
項(xiàng)目地址:
https://wordasimage.github.io/Word-As-Image-Page/
本文來(lái)自微信公眾號(hào):量子位 (ID:QbitAI),作者:蕭簫
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。