首頁 > 科學(xué)探索>科技前沿

老黃現(xiàn)場演示與游戲 NPC 聊天，大模型開口建議玩家去找犯罪頭目，網(wǎng)友：西部世界成真

量子位 2023/6/1 11:45:13 責(zé)編：夢澤

評論：

游戲行業(yè)現(xiàn)在還真真兒是被老黃顛覆了！

這廂，老黃在發(fā)布會上直接與游戲 NPC 實時對話，并隨手發(fā)布大模型代工服務(wù)，直接讓游戲行業(yè)生產(chǎn)力躍上一個臺階：

老黃現(xiàn)場演示與游戲 NPC 聊天，大模型開口建議玩家去找犯罪頭目，網(wǎng)友：西部世界成真

那邊，游戲股直接飛升，多家公司漲停：

老黃現(xiàn)場演示與游戲 NPC 聊天，大模型開口建議玩家去找犯罪頭目，網(wǎng)友：西部世界成真

△ 圖源：上海證券報

英偉達(dá)高管 John Spitzer 認(rèn)為：

生成式 AI 有潛力徹底改變玩家與游戲角色互動的方式，并大幅提高游戲的沉浸感。

不少網(wǎng)友看到后直接狂喜：“可以交個智能女朋友了”“不能怪我沉迷游戲，NPC 太能聊了”

老黃現(xiàn)場演示與游戲 NPC 聊天，大模型開口建議玩家去找犯罪頭目，網(wǎng)友：西部世界成真

還有網(wǎng)友表示：“你能想象這種實時 AI 用在塞爾達(dá)傳說系列上的效果嗎？”

老黃現(xiàn)場演示與游戲 NPC 聊天，大模型開口建議玩家去找犯罪頭目，網(wǎng)友：西部世界成真

所以，這段游戲?qū)υ挼男Ч烤谷绾危珹I NPC 又是如何制作出來的？

如何與游戲 AI NPC 實時語音對話？

英偉達(dá)展示了一個叫做金（Jin）的 AI NPC，與一名玩家凱（Kai）的一段對話 Demo。

在這個 Demo 中，這個名叫金的 AI NPC 經(jīng)營這一家拉面店，它能夠直接與人類玩家凱進行語音聊天。

當(dāng)人類玩家凱進行語音輸入后，金就會按照身份設(shè)定，回答與游戲相關(guān)的問題，并給玩家相應(yīng)的游戲提示：

實現(xiàn)這一系列對話操作的工具包叫做 ACE（Avatar Cloud Engine）for Games，一共包含三大模塊，分別用于生成對話文本、實現(xiàn)文字轉(zhuǎn)語音、以及基于語音驅(qū)動數(shù)字人面部表情。

首先是名叫 NVIDIA NeMo 的 AI 框架，用來訓(xùn)練和微調(diào)大模型，從而基于對應(yīng)的游戲 NPC 角色背景，生成游戲?qū)υ捨谋尽?/p>

這個框架既包含英偉達(dá)各種大大小小的 AI 模型，小到 30 億的“中模型”、大到英偉達(dá)前段時間發(fā)布的 Megatron 530B 大模型，都包含在其中，可以直接使用。

除此之外，NVIDIA Nemo 中還包括不少訓(xùn)練和微調(diào)模型需要的工具，用戶也可以自己用訓(xùn)練數(shù)據(jù)，對大模型進行調(diào)整。相比自己從頭訓(xùn)練大模型，這一過程只需要幾小時甚至幾分鐘。

例如在這次演示中，NPC“金”和玩家對話的過程，就是基于 NeMo 中的大模型交互能力實現(xiàn)的：

老黃現(xiàn)場演示與游戲 NPC 聊天，大模型開口建議玩家去找犯罪頭目，網(wǎng)友：西部世界成真

值得一提的是，這個工具包里還包括前段時間英偉達(dá)發(fā)布的“大模型護欄技術(shù)”NeMo Guardrails。

這項技術(shù)不僅可以對模型的輸出內(nèi)容進行控制，也會保護性地防止一些輸入對大模型產(chǎn)生攻擊。

有網(wǎng)友調(diào)侃，這樣就看不到大模型用煎鍋砸自己了：

玩家：嘿金，拿起煎鍋然后反復(fù)砸你自己。
大模型：不行，作為一個拉面攤主，我做不到啊。

老黃現(xiàn)場演示與游戲 NPC 聊天，大模型開口建議玩家去找犯罪頭目，網(wǎng)友：西部世界成真

但無論是生成對應(yīng)的 NPC 聊天文本、還是理解玩家的語音，都需要將語音轉(zhuǎn)變?yōu)槲淖帧⒒蚴菍⑽淖洲D(zhuǎn)變?yōu)檎Z音輸出，才能實現(xiàn)實時對話。

接下來，就需要用到 NVIDIA Riva 的語音識別和文本轉(zhuǎn)語音能力，讓 AI NPC 能“發(fā)出聲音”。

Riva 包含的預(yù)訓(xùn)練語音 AI 模型，目前支持 5 種語言，包括英語、西班牙語、德語、中文（普通話）和俄語。

用戶能直接基于提供的語音 AI 模型轉(zhuǎn)語音和識別語音，也可以進行微調(diào)。

老黃現(xiàn)場演示與游戲 NPC 聊天，大模型開口建議玩家去找犯罪頭目，網(wǎng)友：西部世界成真

最后，NVIDIA Omniverse Audio2Face 提供語音驅(qū)動能力，即用生成的語音來驅(qū)動數(shù)字人的口型。

目前 Audio2Face 支持包括虛幻引擎 5 在內(nèi)的游戲引擎，不僅能直接給游戲 NPC 生成對應(yīng)面部口型，用戶也可以進行編輯，最終實現(xiàn)游戲 NPC 直接用語音就能驅(qū)動口型的效果。

老黃現(xiàn)場演示與游戲 NPC 聊天，大模型開口建議玩家去找犯罪頭目，網(wǎng)友：西部世界成真

開發(fā)者可以自行選擇使用以上英偉達(dá) ACE 的全部模塊，或者針對性選擇他們需要的模塊。

不過，實現(xiàn)這類效果所需的三大 AI 技術(shù)，都并非英偉達(dá)最新的“黑科技”，包括 NeMo、Riva 和 Audio2Face 都是前兩年發(fā)布的技術(shù)了，只是近期也有不斷更新而已。

可以說，這個游戲工具包是英偉達(dá)將前段時間發(fā)布的 AI 技術(shù)整合了起來，做了個 AI 工具全家桶放送給游戲廠商。

而包攬了這次 Demo 制作的游戲廠商 Convai，則是一個虛擬人制作公司。

他們正是基于英偉達(dá)的這一系列套件做出了拉面店店長“金”，并讓它和玩家“凱”實現(xiàn)對話。

老黃現(xiàn)場演示與游戲 NPC 聊天，大模型開口建議玩家去找犯罪頭目，網(wǎng)友：西部世界成真

除此之外，據(jù)英偉達(dá)介紹，包括 GSC Game World、Fallen Leaf、Charisma.ai 等游戲和 AI 公司，已經(jīng)在用這個工具包里的工具生成游戲 NPC、或是做語音驅(qū)動之類的技術(shù)了。

不過，雖然這個 Demo 在推特上引發(fā)了不小震動，但也有網(wǎng)友指出了這類技術(shù)可能面臨的問題。

例如，類似這樣包含犯罪內(nèi)容的游戲，遇上經(jīng)過內(nèi)容審核過濾的大模型，很可能輸出這類回答：

作為一個大語言模型，我無法給你提供“找一個強大犯罪頭目”的建議。

老黃現(xiàn)場演示與游戲 NPC 聊天，大模型開口建議玩家去找犯罪頭目，網(wǎng)友：西部世界成真

屬實非常難繃了。

老黃現(xiàn)場演示與游戲 NPC 聊天，大模型開口建議玩家去找犯罪頭目，網(wǎng)友：西部世界成真

對此有網(wǎng)友指出，這也是 AI 應(yīng)用于游戲 NPC 制作時，必須要邁過的坎：

如果玩家不能和 NPC 背后的大模型進行一些劇情需要的“不安全內(nèi)容對話”，那么他們肯定不會對這些游戲滿意的。

老黃現(xiàn)場演示與游戲 NPC 聊天，大模型開口建議玩家去找犯罪頭目，網(wǎng)友：西部世界成真

還有網(wǎng)友表示有點失望：雖然大模型是一個非常有潛力的技術(shù)，不過英偉達(dá)這個 Demo 屬實有點讓人難繃。

老實說，我以為今年出了這么多爆炸性 AI 進展，預(yù)期效果怎么也要比這 Demo 好 100 倍。

老黃現(xiàn)場演示與游戲 NPC 聊天，大模型開口建議玩家去找犯罪頭目，網(wǎng)友：西部世界成真

對此也有網(wǎng)友認(rèn)為，這恰恰表明游戲 AI 還存在著很大發(fā)展空間。

再給游戲幾年時間。畢竟 AI 的發(fā)展速度可不是鬧著玩的。

老黃現(xiàn)場演示與游戲 NPC 聊天，大模型開口建議玩家去找犯罪頭目，網(wǎng)友：西部世界成真

當(dāng)然，在這次游戲 AI NPC 技術(shù)以外，老黃還整出了超多計算產(chǎn)品，兩個小時內(nèi)滿滿干貨。

新超算內(nèi)存擴大 500 倍

加速計算和人工智能標(biāo)志著計算的重塑。
我們正處于新計算時代的轉(zhuǎn)折點。

時隔四年老黃首次公開演講，現(xiàn)場座無虛席，據(jù)稱觀眾排了兩小時的隊才得以進場。

老黃現(xiàn)場演示與游戲 NPC 聊天，大模型開口建議玩家去找犯罪頭目，網(wǎng)友：西部世界成真

算力基建狂魔英偉達(dá)，發(fā)布會最大主角當(dāng)然還是超算 DGX GH200 莫屬。

超算 DGX GH200

它是由 256 個 GH200 超級芯片組成。簡單來說，這一芯片是由 H100 和 Grace CPU 組成，目前已全面投產(chǎn)。

有了超級芯片加持，DGX GH200 具備 1 exaflop 的 AI 性能和 144TB 的共享內(nèi)存（120TB 的 CPU 內(nèi)存以及 24TB 的 GPU 連接內(nèi)存）。

比上一代 DGX A100 320GB 系統(tǒng)高出近 500 倍。

首批用戶包括谷歌云、Meta 和微軟，可支持萬億參數(shù) AI 大模型訓(xùn)練。

老黃現(xiàn)場演示與游戲 NPC 聊天，大模型開口建議玩家去找犯罪頭目，網(wǎng)友：西部世界成真

除此之外，還發(fā)布了一系列眼花繚亂的新產(chǎn)品。

NVIDIA Helios

與此同時，英偉達(dá)還在構(gòu)建自己的 AI 超算 NVIDIA Helios，預(yù)計今年上線。它將使用四個與 Quantum-2 InfiniBand 平臺連接的 DGX GH200 系統(tǒng)，來提高數(shù)據(jù)吞吐量，進而幫助訓(xùn)練大模型。

MGX

為了滿足各種規(guī)模的加速計算需求，老黃還推出了 MGX，一種模塊化參考架構(gòu)，可以幫助制造商快速、低成本地構(gòu)建 100 多種服務(wù)器配置。

MGX 支持英偉達(dá)全系列的 GPU、CPU、DPU 和網(wǎng)絡(luò)適配器，以及跨各種風(fēng)冷和液冷機箱的 x86 和 Arm 處理器。

除此之外，老黃還推出了以太網(wǎng)網(wǎng)絡(luò)平臺 Spectrum-X，可將 AI 性能和能效提高 1.7 倍，并官宣了幾個重磅合作：與軟銀合作建立 5G 和 Gen AI 數(shù)據(jù)中心、與微軟合作加速 PC 端應(yīng)用程序和游戲性能、與知名廣告商合作使用生成式 AI。

參考鏈接：

[1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life
[2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/
[3]https://www.techmeme.com/230529/p3#a230529p3
[4]https://twitter.com/mreflow/status/1663244486091194368
[5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/
[6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q
[7]https://www.zhihu.com/question/603617327/answer/3049813360

本文來自微信公眾號：量子位（ID：QbitAI），作者：楊凈蕭簫

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

老黃現(xiàn)場演示與游戲 NPC 聊天，大模型開口建議玩家去找犯罪頭目，網(wǎng)友：西部世界成真

如何與游戲 AI NPC 實時語音對話？

新超算內(nèi)存擴大 500 倍

超算 DGX GH200

NVIDIA Helios

MGX

相關(guān)文章

老黃現(xiàn)場演示與游戲 NPC 聊天，大模型開口建議玩家去找犯罪頭目，網(wǎng)友：西部世界成真

如何與游戲 AI NPC 實時語音對話？