IT之家 4 月 10 日消息,據(jù)外媒 ASCII 今日報道,美國得克薩斯大學(xué)奧斯汀分校的 Yuke Zhu 助理教授及其團(tuán)隊于 4 月 10 日發(fā)布了一款能夠像人類一樣進(jìn)行寶可夢對戰(zhàn)的 AI 智能體“Metamon”。
IT之家附項目地址:點此前往
我們暫時從機(jī)器人技術(shù)中抽身,構(gòu)建了一個能夠像人類一樣進(jìn)行競技寶可夢對戰(zhàn)的 AI 智能體。部分可觀測。隨機(jī)性。長期規(guī)劃。現(xiàn)在通過離線強(qiáng)化學(xué)習(xí) + Transformer 模型掌握了。我們的智能體在超過 47.5 萬場人類對戰(zhàn)中訓(xùn)練,進(jìn)入了 Pokémon Showdown 排行榜的前 10%。
在 Metamon 的開發(fā)過程中,利用了超過 47.5 萬次人類之間的寶可夢對戰(zhàn)數(shù)據(jù)。此外,還使用了大語言模型智能體等非人類對手,總共訓(xùn)練了 20 個智能體。
此外,作為實戰(zhàn)性能檢查,該智能體還參加了模擬各世代寶可夢的網(wǎng)站“Pokémon Showdown”的排名戰(zhàn),與人類玩家對戰(zhàn)。IT之家從結(jié)果中獲悉,部分 Metamon 智能體取得了進(jìn)入活躍用戶前 10% 的好成績。
該小組計劃未來構(gòu)建一個研究專用的 Showdown 服務(wù)器,以便在不干擾人類玩家的情況下跟蹤進(jìn)展。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。