Gemini 2.0 說說話就能一鍵 P 圖的功能爆火,把玩不了的大伙兒都饞哭了!
比如一輛小車車:
輸入指令“把這輛車改裝成敞篷車”,它就能立馬將文字指令和圖片結(jié)合起來,完成一鍵 P 圖。
讓我們來找茬兒,發(fā)現(xiàn)除了車變成了敞篷的,其它元素木有變化,很好地保持了一致性。
不僅于此,Gemini 2.0 還有點(diǎn)“多模態(tài)版 o1”那味兒。
繼續(xù)輸入指令:想象一下,這輛車內(nèi)裝滿了海灘用品。接著,將車身顏色改為一種令人聯(lián)想到夏日的顏色,并在改變過程中進(jìn)行說明。
然后 Gemini 2.0 就開始圖文并茂地一步步推理生成了,先把車變成了明亮的黃色,接著又再車?yán)镅b滿了遮陽傘等海灘用品。
這就是 Gemini 2.0 系列的原生圖像輸出能力。
評論區(qū)底下,一水兒都是求具體上線時間的:
被谷歌挖走的 OpenAI 大將 Logan Kilpatrick 回應(yīng),大伙兒別急,明年年初將更廣泛地推出。
各種 P 圖都是一句話的事兒
除了上面展示的簡單 P 圖,你甚至可以同時 P 圖片中的多個元素,還能把一個物件變成另一個。
比如,把蓬松的夾克變成一個小枕頭,并且拿掉毯子:
這還沒完,結(jié)合不同的圖來 P 也行。
貓和抱枕結(jié)合,就得到了一個很有質(zhì)感的貓貓抱枕:
把貓貓和滑板結(jié)合就得到了貓貓代言滑板。
遵從文字指令,Gemini 2.0 成功將貓貓變成了插畫貼紙形態(tài)。
除此之外,Gemini 2.0 P 圖時還能更有想象力。
比如一個箱子,把箱子打開就變成了醬嬸兒:
開頭展示的小車車,也能變成“飛車”:
另外,還有一種玩法。
在圖像中圈出需要 P 的區(qū)域,只需“Open this”,Gemini 2.0 可以直接結(jié)合文字指令理解圖像,知道“this”的指代:
不得不說,那些有內(nèi)測資格的玩家,可算了把大伙兒饞壞了。
本文來自微信公眾號:量子位(ID:QbitAI),作者:西風(fēng),原標(biāo)題《Gemini 2.0 成 P 圖神器,各種 P 圖只需一句話的事兒,可把網(wǎng)友饞哭了》
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。