萬物皆可《毀滅戰(zhàn)士》，專家利用 GPT-4V 模型運(yùn)行該游戲

2024/3/13 10:19:25 來源：IT之家作者：故淵責(zé)編：故淵

評論：

IT之家 3 月 13 日消息，英國約克大學(xué)研究員 Adrian de Wynter 近日發(fā)表研究論文《Will GPT-4 Run DOOM?》，探討了如何讓 GPT-4V 模型來玩《毀滅戰(zhàn)士》游戲。

de Wynter 為此設(shè)計了一個系統(tǒng)，使用 GPT-4V（GPT4 的多模態(tài)衍生版本，可以接收圖像作為輸入）捕捉游戲引擎的畫面截圖，并返回游戲狀態(tài)的結(jié)構(gòu)化描述。

他設(shè)計了一個 Agent 模型，根據(jù)視覺輸入信息，并對比此前歷史記錄作出決策，并將其反應(yīng)轉(zhuǎn)化為《毀滅戰(zhàn)士》游戲可以理解的按鍵命令。

簡單地說，系統(tǒng)會截取游戲截圖，并利用這些截圖找出游戲中發(fā)生的事情。然后，它利用系統(tǒng)的另一部分，即代理模型，來決定游戲的下一步行動。Agent 模型將其決策轉(zhuǎn)化為游戲可以理解的命令，比如按哪個鍵。

萬物皆可《毀滅戰(zhàn)士》，專家利用 GPT-4V 模型運(yùn)行該游戲

根據(jù)測試結(jié)果，目前 GPT-4V 運(yùn)行《毀滅戰(zhàn)士》游戲存在幾個問題：

盡管存在這些局限性，但 de Wynter 認(rèn)為，GPT4 能夠在沒有事先訓(xùn)練的情況下玩 DOOM，這一點非常了不起。

IT之家附上論文參考

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

萬物皆可《毀滅戰(zhàn)士》，專家利用 GPT-4V 模型運(yùn)行該游戲