設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

AI 繪圖存在致命缺陷,替代人類畫家還言之過早?

SF中文 2023/5/12 11:45:02 責(zé)編:夢澤

本文來自微信公眾號:SF 中文 (ID:kexuejiaodian),作者:SF

隨著 ChatGPT 的火爆,人工智能好像突然走進(jìn)了我們的現(xiàn)實(shí)生活,迅速在各個領(lǐng)域展現(xiàn)出極大的統(tǒng)治力。有了人工智能,從寫作到設(shè)計,從駕駛汽車到調(diào)節(jié)室內(nèi)溫度,很多工作,人類似乎都不必“親力親為”了。很多人都覺得,人工智能的時代即將到來。但在繪畫這件小事兒上,人工智能卻總是栽跟頭,特別是在繪制人手的時候。

文 | 亞歷克斯?休斯(Alex Hughes)

編輯 | 趙佳明

你可能會以為,畫人手并不需要多么高深的技巧。但無論研究人員怎樣提升 AI 圖像生成工具的性能,AI 畫出的人手總有問題。

比如這張由編輯的小伙伴友情提供的圖片,是由 AI 繪圖平臺 Midjourney 生成的。乍看之下,挺逼真的,好像真的是在一場狂歡派對上抓拍的似的??勺屑?xì)一看就露餡兒了!在這張圖片中,很多人物的手都很奇怪,就比如圖右邊那位女士。

無獨(dú)有偶,AI 圖像生成工具“畫出”的人手簡直異曲同工:在這些圖片中,有的人有 3 只手,有的人胳膊比長臂猿還長,手掌上還長了 7 根手指……

為什么 AI 會犯這種低級錯誤?

對此,英國倫敦大學(xué)學(xué)院的計算機(jī)科學(xué)家彼得?本特利(Peter Bentley)的解釋是,這些 AI 繪圖工具都是基于二維模型,而對于真實(shí)世界的三維樣貌,它們完全沒有認(rèn)知。

人手看似簡單,畫起來沒什么高深的技法。但人類靈巧的雙手可以說是最復(fù)雜的“機(jī)器”,專業(yè)的畫家要想畫好人手的每個細(xì)節(jié)尚且不易。對于不了解人手真實(shí)三維結(jié)構(gòu)的 AI 來說,這簡直是不可能的。(圖片來源:Pixabay)

如果你試著讓 AI 生成一張簡單的手部圖像,那可能沒什么問題。但如果你想要的是一張帶有人手的復(fù)雜圖像,而且特意給出了詳細(xì)的繪圖要求,那人工智能可能就會一頭霧水了。最后生成的圖像可能就猶如抽象派畫作一般,令人難以琢磨。

AI 也處理不好細(xì)節(jié)

但是,隨著 ChatGPT 燃爆網(wǎng)絡(luò),AI 繪圖也引來了一篇美譽(yù)之聲:很多人認(rèn)為,AI 繪圖又快又好。但現(xiàn)實(shí)是,這些圖片中藏著“致命”紕漏。

“這些由 AI 生成的圖片真的經(jīng)不住仔細(xì)觀察,人們總能發(fā)現(xiàn)一些違反常理的地方?!北咎乩忉尩?,“這是因為,在訓(xùn)練過程中,研究人員更著重用大量的真實(shí)圖片訓(xùn)練 AI,卻沒有告訴它們,這些圖片之間的真實(shí)邏輯關(guān)系。那對于 AI 圖片生成模型來說,它能做的就只能是把它認(rèn)為最好的圖片組合呈現(xiàn)出來了?!?/p>

這是一張由 Midjourney 生成的圖片,看上去很精美是不是,但如果你仔細(xì)看看,就能發(fā)現(xiàn)畫中隱藏的“硬傷”。你發(fā)現(xiàn)了嗎?可以留言告訴我們。

AI 繪圖的未來

其實(shí),人工智能圖像生成模型正在逐漸完善,但距離生成真正讓人滿意的圖像還有很長的路要走。那么,到底該如何提升人工智能圖像生成模型的性能? 人工智能繪圖技術(shù)的未來又將如何?

本特利給了我們一些信心,他說:“通過三維模型訓(xùn)練,研發(fā)人員正逐漸讓圖像生成模型理解圖像的真實(shí)構(gòu)造和邏輯關(guān)系。在未來,即便我們給出很復(fù)雜的圖像描述指令,最終生成的圖像仍會清晰準(zhǔn)確?!?/p>

不過,獲取足夠的三維圖像數(shù)據(jù)需要大量時 間。眾所周知,互聯(lián)網(wǎng)上的大部分圖像都是二 維的平面圖像?,F(xiàn)在,研發(fā)人員為人工智能繪圖平臺提供的也大多是這些缺乏細(xì)節(jié)信息的圖像?!?/p>

好在,開發(fā) ChatGPT 的美國 Open AI 公司已經(jīng)開始嘗試使用 Point-E 技術(shù)來解決這一問題。利用 Point-E 技術(shù),輸入文本提示就能生成三維模型。目前,這一技術(shù)已經(jīng)對公眾開放,但還不能高興得太早,從目前的測試結(jié)果來看,Point-E 技術(shù)還需進(jìn)一步完善。

一旦 Point-E 技術(shù)更加完善,不用說生成三維圖像,就算一個嶄新的數(shù)字化世界可能會就此建立。盡管 AI 繪圖還有很多離譜的紕漏,但我們相信,人工智能繪圖技術(shù)會持續(xù)進(jìn)步,未來生成逼真的三維圖像甚至完全數(shù)字化的世界也許不再是夢。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:人工智能,AI繪圖

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知