以假亂真的 AI 生成式圖片,AI 自己分辨不出來了。
這張馬斯克和機器人女友的照片,5 個鑒別器里有 2 個都覺得是真的:
還有這張人類和 3 米巨人的合照,居然 5 個鑒別器一致判斷為真:
啊這,AI 鑒別器似乎不太靠譜的亞子。
這就是《紐約時報》最近做的一項測試,他們找來了市面上五個常見的 AI 鑒別器,分別喂給它們 100 多張照片做測試。
結(jié)果發(fā)現(xiàn),AI 鑒別器不僅會把 AI 照片錯認成真的,也會把真實照片劃定為 AI 生成的。
而且不同鑒別器之間的水平差距也不小。
具體表現(xiàn)如何?一起來看
加點顆粒(Grain)就能騙過鑒別器
在這項測試中一共使用了 5 個 AI 鑒別器,分別是:
Umm-maybe
Illuminarty
A.I or Not
Hive
Sensity
測試的內(nèi)容包括 AI 和人類創(chuàng)作的圖片,分別喂給每個鑒別器,看它們會怎樣判斷。
使用的 AI 創(chuàng)作工具包括 Midjourney、Stable Diffusion、Dall-e 等。
《紐約時報》主要展示了這樣幾個例子。包含 5 張 AI 創(chuàng)作的圖片,以及 2 張真人拍的照片。
從統(tǒng)計結(jié)果來看,五個鑒別器中只有 Hive 全部判斷正確。
Umm-maybe 的表現(xiàn)最差,只判斷對了兩張圖。
舉例來看,這張照片是 AI 生成的,聽說還在 2 月的一場攝影比賽中拿下大獎,這道題就難倒了大部分鑒別器。
但這張純 AI 生成的照片,就沒有逃過大部分鑒別器的法眼。
對于人類創(chuàng)作的照片,AI 鑒別器的正確率比較高,兩張照片都只有 Umm-maybe 鑒別器判斷錯誤。
此外他們還專門測試了藝術(shù)畫,發(fā)現(xiàn)大部分 AI 鑒別器能判斷出這是真人畫的。
對比另一幅 AI 創(chuàng)作的,同樣也是四個鑒別器判斷正確。
(Umm-maybe 啊…… 是真的不太行)
值得一提的是,如果對 AI 圖像進行一些加工處理,AI 鑒別器會失效。
比如這張 Nike 男的照片,一開始有 4 個鑒別器判斷它是 AI 生成的。
但如果給圖片加一些顆粒,AI 鑒別器就會將這張圖片的 AI 含量從 99%,判斷為僅有 3.3%。
最后,我們也測試了一些能上手實測的鑒別器(Umm-maybe、Illuminarty、A.I or Not)。
結(jié)果顯示,對于“馬斯克在蘇聯(lián)”這張圖,Umm-maybe 覺得它有 85% 的概率是人類創(chuàng)作的。
Illuminarty 覺得它是 AI 創(chuàng)作的概率僅有 5.4%。
只有 A.I or Not 確定了它是 AI 生成的。
AI 鑒別的判斷標準是啥?
那么 AI 到底是怎么鑒別真?zhèn)蔚模?/p>
普遍來說,它們和人類的判斷標準不太一樣,人類一般以圖像內(nèi)容的合理性為依據(jù),而 AI 更多是從圖像的參數(shù)入手,比如像素的排列方式、清晰度、對比度等。
所以這就解釋了開頭那張巨人照片,為啥所有鑒別器都覺得很真。
在 AI 畫畫大火一年多以后,如今市面上已經(jīng)出現(xiàn)了非常多鑒別器。
有的就是直接放在 Hugging Face 上供大家免費使用,有的則是已經(jīng)成立公司,只提供 API 接口形式。
比如 Hive 就是一家提供商業(yè)解決方案的公司,從如上的測試結(jié)果可以看到,Hive 的表現(xiàn)效果也是最好的,幾乎都能判斷正確。
而在這之前他們的主要業(yè)務是為平臺網(wǎng)站提供數(shù)據(jù)審核服務,圖像視頻文字都支持,服務的平臺有 Reddit、Quora 等。
參考鏈接:
https://www.nytimes.com/interactive/2023/06/28/technology/ai-detection-midjourney-stable-diffusion-dalle.html
本文來自微信公眾號:量子位 (ID:QbitAI),作者:明敏
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。