設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

逼真 AI“情侶合照”竟被代碼識出破綻?沃頓教授預(yù)言 AI 將在 18 個(gè)月后完成進(jìn)化

新智元 2024/8/12 14:25:56 責(zé)編:清源

AI 生圖工具 Flux,儼然已經(jīng)掀起了全網(wǎng)的風(fēng)暴。這張情侶寫真逼真、細(xì)膩,打光、紋理、毛發(fā),都是挑不出破綻的程度。視頻、聲音、口型,AI 的進(jìn)化越來越完美了!

最近 Flux 的爆火,簡直把所有人的三觀都撼動了。

不懂就問:現(xiàn)在網(wǎng)上的東西,還有什么是真的?

Flux 震驚全網(wǎng)

如今,開源文生圖模型 Flux,儼然已經(jīng)在全網(wǎng)掀起了一股風(fēng)暴。

下面這些合影,竟然全是 AI 生成的?簡直把這位博主震驚到懷疑人生。

正面特寫大光圈,臉部打光、肌肉紋理、毛發(fā),看不出絲毫破綻。

注意,即使是背景板人物們,也很自然,挑不出太大毛病。

鏡頭遠(yuǎn)一點(diǎn),光線暗一點(diǎn)呢?也很自然。

兩個(gè)人物在光線明暗處的對比,簡直搞出了世界名畫的光影質(zhì)感。

就問細(xì)不細(xì)膩,真不真實(shí)吧?

人再多一點(diǎn),F(xiàn)lux 也沒在怕的。

無論是三個(gè)人、四個(gè)人、五個(gè)人,乃至更多人,畫面依然挑不出錯(cuò)。

挑刺的網(wǎng)友們,還在努力尋找著細(xì)小的 bug。

最容易一眼看破是 AI 的,無疑就是徽標(biāo)上的文字了。

感受到了 AI 想蒙混過關(guān)的努力

還有一些細(xì)節(jié),比如 AI 不懂人類的帽子和項(xiàng)鏈?zhǔn)歉陕锸沟?,所以畫出來還是會有漏洞。

順便,一年半前 Midjourney V5 驚艷全網(wǎng)的情侶合照長這樣:

一大波二創(chuàng)來襲

現(xiàn)在,全網(wǎng)已經(jīng)掀起了 Flux 生圖的風(fēng)暴,人們一致感嘆:Flux 把 AI 生圖帶到了新的一級臺階。

每當(dāng)我們覺得 AI 生圖不可能變得更好時(shí),它都會再次證明:我們錯(cuò)了。

用這位博主的話來說就是,AI 正在失控,潘多拉魔盒正在被打開!

尤其是 Flux 如此高超的生圖能力和開源可玩性,也給各種二創(chuàng)、視頻、語音的創(chuàng)作提供了極大的空間。

這些被瘋轉(zhuǎn)的 TEDx 演講者,就不必說了。

這位網(wǎng)友用 Flux、可靈 AI 和 synclabs,做出一段 YouTube 網(wǎng)紅博主的視頻。

雖然仍有 AI 的痕跡,但圖像和視頻上的進(jìn)步已屬驚人。

作者表示,自己的目的并不只是創(chuàng)建網(wǎng)紅,而是制作自動化廣告、YouTube、TikTok 視頻、教學(xué)視頻、營銷、講解課程等等。

甚至當(dāng) AI 達(dá)到足夠快時(shí),它就能達(dá)到實(shí)時(shí)生成,F(xiàn)aceTime AI 朋友或者 AI 治療師都有望成真。

是的,要說 AI 有什么最恐怖,那就是它的速度了。

渲染一段 AI 短片,時(shí)間只需要幾秒、幾分鐘。毫無疑問,AI 正在走向世界,所有人對此都很樂觀。

這位網(wǎng)友直言:把 Flux.1、Midjourney 引入 AI 視頻后,雖然不完美,但已經(jīng)是迄今為止自己見過最好的 AI 作品了。

這位博主結(jié)合了 Flux 和 LoRA,發(fā)現(xiàn) LoRA 對現(xiàn)實(shí)主義圖像和繪畫 / 藝術(shù)圖像,也都有很好的處理效果。

Flux.1 和 LoRA,對動漫生成效果也很好,單個(gè) 4090 就可跑。

這位網(wǎng)友表示,自己用了不到 1 個(gè)小時(shí),就做出了兩個(gè)香水廣告。他直言:我們已經(jīng)接近 AI 視頻的奇點(diǎn)。

AI 超進(jìn)化,只用 18 個(gè)月

沃頓商學(xué)院 AI 方向的副教授看到了最近的 AI 生成視頻后,做出預(yù)言 ——AI 將在 18 個(gè)月之后完成進(jìn)化。

之所以有這種觀點(diǎn),是因?yàn)?AI 模型的進(jìn)化速度實(shí)在超乎想象。

比如下面這幾張「水獺在飛機(jī)上使用 wifi」的圖片,在一兩周的時(shí)間內(nèi)就有肉眼可見的進(jìn)步。

再看看一年多之后,現(xiàn)在的 AI 進(jìn)化成什么樣子了 ——

不僅水獺的形象更加逼真可愛,操作手機(jī)時(shí)的手部動作也沒有破綻。

再來對比一下同款產(chǎn)品的進(jìn)化速度:MidJourney v3 和 v4 之間就有非常明顯的進(jìn)步。

一秒換臉馬斯克,口型同步不露餡

不僅如此,最近 GitHub 一項(xiàng)爆火研究稱,只需一張照片,就能換臉直播。

下面的視頻中,只見馬斯克「本尊」戴上眼鏡,開啟了實(shí)時(shí)無延遲直播。

是連馬斯克的媽都要騙過的程度。

還有 LeCun 大佬,也被網(wǎng)友拿來換臉直播。

目前,項(xiàng)目已經(jīng)在 GitHub 上收獲了 14k 星,刷榜 Trending。

項(xiàng)目地址:https://github.com/hacksider/Deep-Live-Cam

與此同時(shí),各種對口型技術(shù),比如 ReSyncer,也讓 AI 視頻人物的嘴型無比自然。

至此,AI 把一整個(gè)工作流都跑通了!從此在網(wǎng)上看到再逼真的影像,我們心里恐怕都要打個(gè)問號了。

提高飽和度,AI 生圖露怯

所以,究竟有沒有什么方法,能用火眼金睛識別出 AI 的痕跡?

蹭著最近這波 AI 生圖熱度,前谷歌搜索創(chuàng)始人之一 Deedy 提出 ——

識別 AI 圖片最好的方法,就是提高圖像飽和度,并仔細(xì)查看麥克風(fēng)接口、牙齒的部位。

就比如,最近爆火的 TED 演講者的圖片,將飽和度設(shè)為 200%,可以看到讓人驚悚的牙齒。

值得一提的是,識別工具的代碼均是由 Claude 編寫的,而且還是公開可用。

傳送門:https://claude.site/artifacts/6890e3d7-e65e-41ff-a7d4-3ccb38040b46

不過,再拿另一張 AI 生成的 TED 演講者圖片進(jìn)行測試,卻毫無破綻。

這張圖片中,牙齒并不奇怪,而且在正題顏色區(qū)域色彩更加一致。

Deedy 稱,如果對真實(shí)圖像進(jìn)行 JPG 壓縮,可能會破壞這種一致性。

網(wǎng)友:只能拔網(wǎng)線了

當(dāng)我們身處一個(gè)被 AI 包圍的「楚門的世界」,人類最后的退路在哪里?

也許,是時(shí)候拔掉網(wǎng)線了。

參考資料:

  • https://x.com/AngryTomtweets/status/1822203767728591350

  • https://x.com/deedydas/status/1822665923775611374

  • https://github.com/hacksider/Deep-Live-Cam?continueFlag=4be7aad2ca0a560d6f9019228a8b2d3e

  • https://x.com/emollick/status/1822774265390985401

  • https://www.reddit.com/r/singularity/comments/1eo4sne/single_image_to_live_stream_deep_fake_deeplivecam/

本文來自微信公眾號:微信公眾號(ID:null),作者:新智元,原標(biāo)題:《情侶合照逼真到恐怖,竟被代碼識出破綻?沃頓教授預(yù)言 AI 18 個(gè)月封神!》

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:人工智能

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知