設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

ChatGPT 給勞拉注入自我意識,開始自己在《古墓麗影》中闖關(guān)

新智元 2023/8/13 15:08:54 責(zé)編:遠洋

【新智元導(dǎo)讀】一位外國 up 主,用 ChatGPT 給 AI 智能體注入了自我意識。產(chǎn)生「生命」的勞拉覺醒了,開始自己在「古墓麗影」中闖關(guān)。

如果游戲角色被注入生命,電子游戲會發(fā)展成什么樣?

曾經(jīng),這是不少人的暢想,而如今,隨著 AI 智能體的發(fā)展,這種想象已經(jīng)開始走入現(xiàn)實。

最近,一位 YouTube 作者 Foxmaster 制作了一個經(jīng)典游戲「古墓麗影」的原版視頻。

而其中的女主角勞拉,居然是一個能控制自己角色的 AI 智能體!

可以說,利用機器視覺、定位、物體識別、動畫、文本和語音等各種 AI 工具,F(xiàn)oxmaster 為游戲角色注入了數(shù)字生命。

就在前幾天,爆火 AI 社區(qū)的斯坦福智能體小鎮(zhèn)正式開源。25 個各具個性的 AI 智能體,在「西部世界」一般的沙盒虛擬城鎮(zhèn)中生活、上班、交友。

所以,或許這就是電子游戲的未來?

「古墓麗影」女主有了意識

構(gòu)建可以玩游戲的虛擬 AI,這個概念已經(jīng)很常見。不過,F(xiàn)ormaster 想做的,是讓這個角色如同真人一樣。

因此,他選擇了「古墓麗影」這款游戲,游戲主角勞拉是一個人物性格鮮明、定義明確的角色。

而 Formaste 希望,這種個性會對游戲的最終結(jié)局產(chǎn)生影響。

如何讓這個 AI 智能體 Lara Croft 在游戲中真正產(chǎn)生自我意識?

Formaster 經(jīng)過以下幾個步驟的探索,終于成功了。

學(xué)習(xí)游戲規(guī)則

首先第一步,叫她學(xué)會游戲規(guī)則。「古墓麗影」已經(jīng)給出了教程,解釋了所有的游戲控制過程。

作者讓 Lara 按照給出的方式去練習(xí),像人類玩家一樣完成各個階段的教程。

教程在 Lara 離開泳池時結(jié)束,所以可以在那時重啟程序,做出改進。

開始時,改進 Lara 非常困難。

她有時會出現(xiàn)混亂,在地圖中隨意走動,甚至有時候會卡在菜單欄中,一遍遍盯著她的指南針。

為了解決這個問題,作者在一臺虛擬機上,重新調(diào)整了主時鐘,將游戲進程加速了 40 倍。這個辦法起作用力,AI 智能體終于在相對不錯的時間內(nèi),完成了教程。

然而,還存在一個問題:Lara 經(jīng)??ㄔ谝粋€位置,而且每個關(guān)卡都是由靜態(tài)元素組成,因此只有一條優(yōu)化路徑。

這會導(dǎo)致她只知道不走哪些路徑,而不是想出更全面的方法來解題。但作者希望的是,Lara 學(xué)會自己去發(fā)掘探險過程。

考慮到 Lara 唯一掌握的知識,僅僅是每道關(guān)卡顯示的屏幕上的內(nèi)容,作者觀察了從未玩過游戲的人類玩家的行為。

有的人會看完整個教程,有的人先會探索周圍的環(huán)境,而這些選擇的差異,就是由不同人的「個性」決定的。

而 Lara 需要學(xué)習(xí)的,恰恰就是這種態(tài)度。

識別角色

為了給 AI 建立與 Lara 的聯(lián)系,就需要讓 AI 明白,她是一堆像素。人類玩家進入游戲后,一下子有了這樣的意識。

對此,作者從各個角度,錄制了 24 個小時,Lara 朝著不同方向活動的視頻,以便 AI 智能體能夠識別任何給定角色。

就像自動駕駛汽車一樣,能夠以每秒 30 幀速度拍攝 24 小時視頻,得到 2592000 張參考圖像,以識別道路標(biāo)志。

首先,作者跟蹤頭部主要像素,然后是身體主要像素,來選擇相關(guān)區(qū)域。

為了確保 Lara 出現(xiàn)在每張圖像中,作者要求程序去識別那些不包含任何突出顯示的圖片。

當(dāng) Lara 占據(jù)整個屏幕時,或當(dāng)一個二維物體擋在她面前,作者使用 AI 視覺捕獲來幫助識別 Lara,結(jié)果非常準確,足以識別屏幕上的角色。

環(huán)境互動

能夠識別 Lara 后,需要讓 AI 與環(huán)境互動。

整個游戲環(huán)境都是由同樣的區(qū)塊組成,作者將其導(dǎo)入到立方體上,然后從各個角度捕獲環(huán)境,再運行識別過程,這樣 AI 智能體就能識別出環(huán)境,就像人類玩家解釋圖像的過程。

紅色突出顯示的區(qū)域是,未能識別的紋理。但是,AI 仍舊缺乏想去某個地方的意識,還需要知道自己距離周圍環(huán)境的距離。

有趣的是,這些未能識別的區(qū)域,通常是遠離 Lara 的位置,或被其他 2D 物體遮擋的位置。

當(dāng)我們觀察人類玩家的行為,看到這張圖像后,我們能夠立即明白,箭頭所指向區(qū)域是一個入口。

我們可能不知道下一個房間的大小,但我們知道這是存在的。

但是,這也可能是一種視覺錯覺。當(dāng)我們?nèi)ヒ苿?,入口區(qū)域的紋理與其他地方不同,這是 3D 空間的特征。

因此,AI 智能體還得學(xué)會移動,并進行比較。從計算角度來看,可以使用多個圖像來確定哪些紋理尺寸的變化最小。

這里可以使用主多邊形的面積來算,它們的變化主要基于彼此之間距離成比例的概率。

想象

現(xiàn)在,AI 已經(jīng)知道自己身在何處了,她必須做出決定,自己下一步要去哪里。

通過識別紋理,可以讓她到達特定的位置,然而在關(guān)卡中導(dǎo)航,需要更簡單的東西。

最快的方法,就是簡化對比度,識別區(qū)域中光線的突然變化。但是,人類玩家不一定會去這些地方。

當(dāng)有多個開口時,AI 必須表現(xiàn)出足夠興趣,但不能導(dǎo)致她死亡。

比如,如果一個洞太深,就無法在不抓住周圍壁架的情況下跳下去。假如下面有水存在,倒是有可能值得這種冒險。

人類玩家知道什么時候可以跳,但 Lara 的行動方針都是來源于教程,它必須準確估計自己和目標(biāo)之間有多少個方塊,是否應(yīng)該聚集自己的動量,以及在放手之前是否應(yīng)該暫停一下。

總之,她必須像人類玩家一樣,做出準確評估。

如果她提前知道一個洞的大小,就會跑得非???,這就并不符合我們的期望。

為了讓她多收集環(huán)境信息,作者鼓勵 AI,如果有疑惑,就應(yīng)該旋轉(zhuǎn)相機,收集更多的信息。

但真實情況下,即便如此,AI 也可能卡在房間里。

為了鼓勵她走出房間,作者補充了一些收集規(guī)則。

比如,每次遇到在該區(qū)域成為優(yōu)先級前從未見過的紋理時,她都必須以增加屏幕上這種紋理大小的方式來移動。

這樣,她就只能在關(guān)卡中前進。因為每個關(guān)卡中都有獨特的紋理,解鎖的唯一方式,就是進入下一個關(guān)卡。

總之,Lara 會不斷分析自己在屏幕上看到的內(nèi)容 —— 不同表面的紋理,她會移動自己的身體,定義新的興趣點(即目錄中尚未存在的紋理)。

在這個過程中,她會不斷驗證,去尋找丟失的紋理。

運動

然而,即使經(jīng)過了上述改進,這個 AI 還是太像個機器人了,行動模式是顯而易見的。

為了改進它,作者再次觀察了人類玩家。

是什么決定了人類玩家在游戲中如何行動?就是我們的記憶,我們會記住動作是如何組合的。

因此,這個過程也需要植入到 AI 中,因為 Lara 必須意識到她自己的運動能力。

為此,作者把 AI 每一秒的動作都保存起來,來訓(xùn)練它,然后添加一條規(guī)則,允許它同時執(zhí)行這些保存的動作。

這樣,AI 的動作就變得平滑多了。

另外,因為每個動作的冷卻時間是已知的,就可以防止 AI 在執(zhí)行不必要的動作時,仍然處于活動狀態(tài)。

在下圖中,火焰重新激活的速度如此之快,需要完成很大的跳躍才能穿過。

幸運的是,這些通道在視覺上被簡化了,很容易識別塊的邊緣。

AI 知道,Lara 總是會在方塊的第一部分激活時完成正確的跳躍,就像人類玩家理解的一樣。

ChatGPT 注入人格

接下來,就需要將 Lara 的個性灌輸給 AI 智能體。個性取決于經(jīng)驗和記憶,這些因素的結(jié)合決定了 Lara 角色。

根據(jù)游戲設(shè)定,她是一個著名的考古學(xué)家,從不畏懼冒險,愿意接受分配的山區(qū)任務(wù),甚至不要獎賞,完全出于熱愛。

另外,Lara 還特別有錢,剛剛搬進一座豪宅,屋內(nèi)裝飾非常優(yōu)雅,屋子里還有一個訓(xùn)練室。她還特別擅長教學(xué),游泳,攀爬,耐力非常強。

當(dāng)冒險途中遇到危險,她能夠保持鎮(zhèn)靜,而且非常勇敢,會毫不猶豫幫助同伴。

面對狼群包圍,她用槍準確地射殺,還能用匕首殺死兇險的狼。她唯一拒絕的是,主動強行開鎖。

以上的一切,都是從游戲設(shè)定中,了解到的 Lara 個性。

接下來,就是以真實的方式去評論她所看到的一切,對此,作者在數(shù)據(jù)庫中已經(jīng)編譯 Lara 的性格特征。

為了使評論對實際情況有意義,程序需要將游戲圖像與現(xiàn)實生活中可識別的東西相關(guān)聯(lián)。

對于紋理細節(jié)通常較少的圖像,可以通過谷歌逆向圖像搜索進行匹配。

因此,當(dāng) AI 智能體檢測到足夠大的紋理,它就會啟動搜素。

為了識別單詞,作者將整個頁面復(fù)制到 ChatGPT。然后要求 ChatGPT 根據(jù)出現(xiàn)的次數(shù)對其進行分類,再將識別出的單詞添加到列表中。

最后要求 ChatGPT 根據(jù)這些單詞創(chuàng)建一個句子,并且要考慮到 Lara 個性。

這樣做,就是要 ChatGPT 去真實地評論,Lara 在現(xiàn)實生活中看到的東西。

比如,如果紋理被識別為海獅,ChatGPT 能夠?qū)⒑*{與 Lara 個性特征聯(lián)系起來做出評論。

總得來說,Lara 智能體的人格是通過 ChatGPT 使用「勇敢」、「友好」或「聰明」等各種屬性設(shè)定。

Lara 在游戲中,感知和評論的所有物體都會通過這個人格過濾器,并由 Lara 根據(jù)既定的性格反應(yīng)出來。

就比如,如上的海豹,Lara 會提及海獅化石,或者出色的游泳能力,并不會對其在馬戲團發(fā)表言論。

網(wǎng)友:AI 智能體讓電子游戲變成了藝術(shù)品

有網(wǎng)友表示,這是讓角色自我發(fā)展最酷、最自然的感覺方式之一。當(dāng)角色能夠活靈活現(xiàn),你才可以真正體驗到電子游戲是一件藝術(shù)品。

「她說話和分析周圍環(huán)境的方式非??蓯邸W?AI 機器人有能力評論周圍環(huán)境,無論它的實際水平如何,都會讓人覺得她是個活生生的人?!?/p>

「這太迷人了。她那超然的好奇心和一絲異想天開的想法,與我想象中的 Lara 的內(nèi)心獨白驚人地相似。」

有人說,讓我感到驚奇的是,她的對話與她的行為相吻合。

這讓人覺得,寫對話的人工智能和控制角色的人工智能是同一個人。

前不久在斯坦福 AI 智能體小鎮(zhèn)開源時,網(wǎng)友們就十分激動,覺得 AGI 已來,各種 RPG 和模擬類游戲都會很快用上這種技術(shù)。

而現(xiàn)在,F(xiàn)oxmaster 將 ChatGPT、計算機視覺和物體識別的結(jié)合,讓電子游戲變得更有趣了。

或許在未來,電子游戲角色可以被賦予更深、更靈活的個性,對環(huán)境做出更快的反應(yīng),以及許多我們無法想象的變化。

參考資料:

https://the-decoder.com/ai-makes-lara-croft-self-aware-in-og-tomb-raider/

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:ChatGPT,人工智能

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知