谷歌 Gemini 2.0 成“P 圖神器”，各種 P 圖只需一句話

量子位 2024/12/16 22:49:09 責(zé)編：汪淼

評論：

Gemini 2.0 說說話就能一鍵 P 圖的功能爆火，把玩不了的大伙兒都饞哭了！

比如一輛小車車：

輸入指令“把這輛車改裝成敞篷車”，它就能立馬將文字指令和圖片結(jié)合起來，完成一鍵 P 圖。

谷歌 Gemini 2.0 成“P 圖神器”，各種 P 圖只需一句話

讓我們來找茬兒，發(fā)現(xiàn)除了車變成了敞篷的，其它元素木有變化，很好地保持了一致性。

不僅于此，Gemini 2.0 還有點(diǎn)“多模態(tài)版 o1”那味兒。

繼續(xù)輸入指令：想象一下，這輛車內(nèi)裝滿了海灘用品。接著，將車身顏色改為一種令人聯(lián)想到夏日的顏色，并在改變過程中進(jìn)行說明。

然后 Gemini 2.0 就開始圖文并茂地一步步推理生成了，先把車變成了明亮的黃色，接著又再車?yán)镅b滿了遮陽傘等海灘用品。

谷歌 Gemini 2.0 成“P 圖神器”，各種 P 圖只需一句話

這就是 Gemini 2.0 系列的原生圖像輸出能力。

評論區(qū)底下，一水兒都是求具體上線時間的：

谷歌 Gemini 2.0 成“P 圖神器”，各種 P 圖只需一句話

被谷歌挖走的 OpenAI 大將 Logan Kilpatrick 回應(yīng)，大伙兒別急，明年年初將更廣泛地推出。

谷歌 Gemini 2.0 成“P 圖神器”，各種 P 圖只需一句話

各種 P 圖都是一句話的事兒

除了上面展示的簡單 P 圖，你甚至可以同時 P 圖片中的多個元素，還能把一個物件變成另一個。

比如，把蓬松的夾克變成一個小枕頭，并且拿掉毯子：

谷歌 Gemini 2.0 成“P 圖神器”，各種 P 圖只需一句話

這還沒完，結(jié)合不同的圖來 P 也行。

貓和抱枕結(jié)合，就得到了一個很有質(zhì)感的貓貓抱枕：

谷歌 Gemini 2.0 成“P 圖神器”，各種 P 圖只需一句話

把貓貓和滑板結(jié)合就得到了貓貓代言滑板。

遵從文字指令，Gemini 2.0 成功將貓貓變成了插畫貼紙形態(tài)。

谷歌 Gemini 2.0 成“P 圖神器”，各種 P 圖只需一句話

除此之外，Gemini 2.0 P 圖時還能更有想象力。

比如一個箱子，把箱子打開就變成了醬嬸兒：

谷歌 Gemini 2.0 成“P 圖神器”，各種 P 圖只需一句話

開頭展示的小車車，也能變成“飛車”：

谷歌 Gemini 2.0 成“P 圖神器”，各種 P 圖只需一句話

另外，還有一種玩法。

在圖像中圈出需要 P 的區(qū)域，只需“Open this”，Gemini 2.0 可以直接結(jié)合文字指令理解圖像，知道“this”的指代：

谷歌 Gemini 2.0 成“P 圖神器”，各種 P 圖只需一句話

不得不說，那些有內(nèi)測資格的玩家，可算了把大伙兒饞壞了。

谷歌 Gemini 2.0 成“P 圖神器”，各種 P 圖只需一句話

本文來自微信公眾號：量子位（ID：QbitAI），作者：西風(fēng)，原標(biāo)題《Gemini 2.0 成 P 圖神器，各種 P 圖只需一句話的事兒，可把網(wǎng)友饞哭了》

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。