設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

老黃現(xiàn)場(chǎng)演示與游戲 NPC 聊天,大模型開口建議玩家去找犯罪頭目,網(wǎng)友:西部世界成真

量子位 2023/6/1 11:45:13 責(zé)編:夢(mèng)澤

游戲行業(yè)現(xiàn)在還真真兒是被老黃顛覆了!

這廂,老黃在發(fā)布會(huì)上直接與游戲 NPC 實(shí)時(shí)對(duì)話,并隨手發(fā)布大模型代工服務(wù),直接讓游戲行業(yè)生產(chǎn)力躍上一個(gè)臺(tái)階

那邊,游戲股直接飛升,多家公司漲停:

圖源:上海證券報(bào)

英偉達(dá)高管 John Spitzer 認(rèn)為:

生成式 AI 有潛力徹底改變玩家與游戲角色互動(dòng)的方式,并大幅提高游戲的沉浸感。

不少網(wǎng)友看到后直接狂喜:“可以交個(gè)智能女朋友了”“不能怪我沉迷游戲,NPC 太能聊了”

還有網(wǎng)友表示:“你能想象這種實(shí)時(shí) AI 用在塞爾達(dá)傳說(shuō)系列上的效果嗎?”

所以,這段游戲?qū)υ挼男Ч烤谷绾?,AI NPC 又是如何制作出來(lái)的?

如何與游戲 AI NPC 實(shí)時(shí)語(yǔ)音對(duì)話?

英偉達(dá)展示了一個(gè)叫做金(Jin)的 AI NPC,與一名玩家凱(Kai)的一段對(duì)話 Demo。

在這個(gè) Demo 中,這個(gè)名叫金的 AI NPC 經(jīng)營(yíng)這一家拉面店,它能夠直接與人類玩家凱進(jìn)行語(yǔ)音聊天。

當(dāng)人類玩家凱進(jìn)行語(yǔ)音輸入后,金就會(huì)按照身份設(shè)定,回答與游戲相關(guān)的問(wèn)題,并給玩家相應(yīng)的游戲提示:

實(shí)現(xiàn)這一系列對(duì)話操作的工具包叫做 ACE(Avatar Cloud Engine)for Games,一共包含三大模塊,分別用于生成對(duì)話文本、實(shí)現(xiàn)文字轉(zhuǎn)語(yǔ)音、以及基于語(yǔ)音驅(qū)動(dòng)數(shù)字人面部表情。

首先是名叫 NVIDIA NeMo 的 AI 框架,用來(lái)訓(xùn)練和微調(diào)大模型,從而基于對(duì)應(yīng)的游戲 NPC 角色背景,生成游戲?qū)υ捨谋尽?/p>

這個(gè)框架既包含英偉達(dá)各種大大小小的 AI 模型,小到 30 億的“中模型”、大到英偉達(dá)前段時(shí)間發(fā)布的 Megatron 530B 大模型,都包含在其中,可以直接使用。

除此之外,NVIDIA Nemo 中還包括不少訓(xùn)練和微調(diào)模型需要的工具,用戶也可以自己用訓(xùn)練數(shù)據(jù),對(duì)大模型進(jìn)行調(diào)整。相比自己從頭訓(xùn)練大模型,這一過(guò)程只需要幾小時(shí)甚至幾分鐘。

例如在這次演示中,NPC“金”和玩家對(duì)話的過(guò)程,就是基于 NeMo 中的大模型交互能力實(shí)現(xiàn)的:

值得一提的是,這個(gè)工具包里還包括前段時(shí)間英偉達(dá)發(fā)布的“大模型護(hù)欄技術(shù)”NeMo Guardrails。

這項(xiàng)技術(shù)不僅可以對(duì)模型的輸出內(nèi)容進(jìn)行控制,也會(huì)保護(hù)性地防止一些輸入對(duì)大模型產(chǎn)生攻擊。

有網(wǎng)友調(diào)侃,這樣就看不到大模型用煎鍋砸自己了:

玩家:嘿金,拿起煎鍋然后反復(fù)砸你自己。

大模型:不行,作為一個(gè)拉面攤主,我做不到啊。

但無(wú)論是生成對(duì)應(yīng)的 NPC 聊天文本、還是理解玩家的語(yǔ)音,都需要將語(yǔ)音轉(zhuǎn)變?yōu)槲淖帧⒒蚴菍⑽淖洲D(zhuǎn)變?yōu)檎Z(yǔ)音輸出,才能實(shí)現(xiàn)實(shí)時(shí)對(duì)話。

接下來(lái),就需要用到 NVIDIA Riva 的語(yǔ)音識(shí)別和文本轉(zhuǎn)語(yǔ)音能力,讓 AI NPC 能“發(fā)出聲音”。

Riva 包含的預(yù)訓(xùn)練語(yǔ)音 AI 模型,目前支持 5 種語(yǔ)言,包括英語(yǔ)、西班牙語(yǔ)、德語(yǔ)、中文(普通話)和俄語(yǔ)。

用戶能直接基于提供的語(yǔ)音 AI 模型轉(zhuǎn)語(yǔ)音和識(shí)別語(yǔ)音,也可以進(jìn)行微調(diào)。

最后,NVIDIA Omniverse Audio2Face 提供語(yǔ)音驅(qū)動(dòng)能力,即用生成的語(yǔ)音來(lái)驅(qū)動(dòng)數(shù)字人的口型。

目前 Audio2Face 支持包括虛幻引擎 5 在內(nèi)的游戲引擎,不僅能直接給游戲 NPC 生成對(duì)應(yīng)面部口型,用戶也可以進(jìn)行編輯,最終實(shí)現(xiàn)游戲 NPC 直接用語(yǔ)音就能驅(qū)動(dòng)口型的效果。

開發(fā)者可以自行選擇使用以上英偉達(dá) ACE 的全部模塊,或者針對(duì)性選擇他們需要的模塊。

不過(guò),實(shí)現(xiàn)這類效果所需的三大 AI 技術(shù),都并非英偉達(dá)最新的“黑科技”,包括 NeMo、Riva 和 Audio2Face 都是前兩年發(fā)布的技術(shù)了,只是近期也有不斷更新而已。

可以說(shuō),這個(gè)游戲工具包是英偉達(dá)將前段時(shí)間發(fā)布的 AI 技術(shù)整合了起來(lái),做了個(gè) AI 工具全家桶放送給游戲廠商。

而包攬了這次 Demo 制作的游戲廠商 Convai,則是一個(gè)虛擬人制作公司。

他們正是基于英偉達(dá)的這一系列套件做出了拉面店店長(zhǎng)“金”,并讓它和玩家“凱”實(shí)現(xiàn)對(duì)話。

除此之外,據(jù)英偉達(dá)介紹,包括 GSC Game World、Fallen Leaf、Charisma.ai 等游戲和 AI 公司,已經(jīng)在用這個(gè)工具包里的工具生成游戲 NPC、或是做語(yǔ)音驅(qū)動(dòng)之類的技術(shù)了。

不過(guò),雖然這個(gè) Demo 在推特上引發(fā)了不小震動(dòng),但也有網(wǎng)友指出了這類技術(shù)可能面臨的問(wèn)題。

例如,類似這樣包含犯罪內(nèi)容的游戲,遇上經(jīng)過(guò)內(nèi)容審核過(guò)濾的大模型,很可能輸出這類回答:

作為一個(gè)大語(yǔ)言模型,我無(wú)法給你提供“找一個(gè)強(qiáng)大犯罪頭目”的建議。

屬實(shí)非常難繃了。

對(duì)此有網(wǎng)友指出,這也是 AI 應(yīng)用于游戲 NPC 制作時(shí),必須要邁過(guò)的坎:

如果玩家不能和 NPC 背后的大模型進(jìn)行一些劇情需要的“不安全內(nèi)容對(duì)話”,那么他們肯定不會(huì)對(duì)這些游戲滿意的。

還有網(wǎng)友表示有點(diǎn)失望:雖然大模型是一個(gè)非常有潛力的技術(shù),不過(guò)英偉達(dá)這個(gè) Demo 屬實(shí)有點(diǎn)讓人難繃。

老實(shí)說(shuō),我以為今年出了這么多爆炸性 AI 進(jìn)展,預(yù)期效果怎么也要比這 Demo 好 100 倍。

對(duì)此也有網(wǎng)友認(rèn)為,這恰恰表明游戲 AI 還存在著很大發(fā)展空間。

再給游戲幾年時(shí)間。畢竟 AI 的發(fā)展速度可不是鬧著玩的。

當(dāng)然,在這次游戲 AI NPC 技術(shù)以外,老黃還整出了超多計(jì)算產(chǎn)品,兩個(gè)小時(shí)內(nèi)滿滿干貨。

新超算內(nèi)存擴(kuò)大 500 倍

加速計(jì)算人工智能標(biāo)志著計(jì)算的重塑。

我們正處于新計(jì)算時(shí)代的轉(zhuǎn)折點(diǎn)。

時(shí)隔四年老黃首次公開演講,現(xiàn)場(chǎng)座無(wú)虛席,據(jù)稱觀眾排了兩小時(shí)的隊(duì)才得以進(jìn)場(chǎng)。

算力基建狂魔英偉達(dá),發(fā)布會(huì)最大主角當(dāng)然還是超算 DGX GH200 莫屬。

超算 DGX GH200

它是由 256 個(gè) GH200 超級(jí)芯片組成。簡(jiǎn)單來(lái)說(shuō),這一芯片是由 H100 和 Grace CPU 組成,目前已全面投產(chǎn)。

有了超級(jí)芯片加持,DGX GH200 具備 1 exaflop 的 AI 性能和 144TB 的共享內(nèi)存(120TB 的 CPU 內(nèi)存以及 24TB 的 GPU 連接內(nèi)存)。

比上一代 DGX A100 320GB 系統(tǒng)高出近 500 倍。

首批用戶包括谷歌云、Meta 和微軟,可支持萬(wàn)億參數(shù) AI 大模型訓(xùn)練。

除此之外,還發(fā)布了一系列眼花繚亂的新產(chǎn)品。

NVIDIA Helios

與此同時(shí),英偉達(dá)還在構(gòu)建自己的 AI 超算 NVIDIA Helios,預(yù)計(jì)今年上線。它將使用四個(gè)與 Quantum-2 InfiniBand 平臺(tái)連接的 DGX GH200 系統(tǒng),來(lái)提高數(shù)據(jù)吞吐量,進(jìn)而幫助訓(xùn)練大模型。

MGX

為了滿足各種規(guī)模的加速計(jì)算需求,老黃還推出了 MGX,一種模塊化參考架構(gòu),可以幫助制造商快速、低成本地構(gòu)建 100 多種服務(wù)器配置。

MGX 支持英偉達(dá)全系列的 GPU、CPU、DPU 和網(wǎng)絡(luò)適配器,以及跨各種風(fēng)冷和液冷機(jī)箱的 x86 和 Arm 處理器。

除此之外,老黃還推出了以太網(wǎng)網(wǎng)絡(luò)平臺(tái) Spectrum-X,可將 AI 性能和能效提高 1.7 倍,并官宣了幾個(gè)重磅合作:與軟銀合作建立 5G 和 Gen AI 數(shù)據(jù)中心、與微軟合作加速 PC 端應(yīng)用程序和游戲性能、與知名廣告商合作使用生成式 AI。

參考鏈接:

  • [1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life

  • [2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/

  • [3]https://www.techmeme.com/230529/p3#a230529p3

  • [4]https://twitter.com/mreflow/status/1663244486091194368

  • [5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/

  • [6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q

  • [7]https://www.zhihu.com/question/603617327/answer/3049813360

本文來(lái)自微信公眾號(hào):量子位 (ID:QbitAI),作者:楊凈 蕭簫

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:英偉達(dá)游戲

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知