IT之家 3 月 13 日消息,英國約克大學(xué)研究員 Adrian de Wynter 近日發(fā)表研究論文《Will GPT-4 Run DOOM?》,探討了如何讓 GPT-4V 模型來玩《毀滅戰(zhàn)士》游戲。
de Wynter 為此設(shè)計了一個系統(tǒng),使用 GPT-4V(GPT4 的多模態(tài)衍生版本,可以接收圖像作為輸入)捕捉游戲引擎的畫面截圖,并返回游戲狀態(tài)的結(jié)構(gòu)化描述。
他設(shè)計了一個 Agent 模型,根據(jù)視覺輸入信息,并對比此前歷史記錄作出決策,并將其反應(yīng)轉(zhuǎn)化為《毀滅戰(zhàn)士》游戲可以理解的按鍵命令。
簡單地說,系統(tǒng)會截取游戲截圖,并利用這些截圖找出游戲中發(fā)生的事情。然后,它利用系統(tǒng)的另一部分,即代理模型,來決定游戲的下一步行動。Agent 模型將其決策轉(zhuǎn)化為游戲可以理解的命令,比如按哪個鍵。
根據(jù)測試結(jié)果,目前 GPT-4V 運(yùn)行《毀滅戰(zhàn)士》游戲存在幾個問題:
GPT4 缺乏對象永久性,這意味著游戲中的敵人沒有出現(xiàn)在屏幕畫面中,它會忘記他們。
GPT4 在推理和清晰解釋自己的行為方面也很吃力,經(jīng)常提供錯誤信息。
盡管存在這些局限性,但 de Wynter 認(rèn)為,GPT4 能夠在沒有事先訓(xùn)練的情況下玩 DOOM,這一點非常了不起。
IT之家附上論文參考
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。