北京時(shí)間今天(3 月 19 日)凌晨,一年一度的“AI 界春晚”GTC 2025 在加州圣何塞正式召開。
老黃身著皮衣、不用提詞器,脫稿帶來了一場時(shí)長 2 個半小時(shí)的演講,從游戲顯卡、聊到 AI 芯片、再到機(jī)器人時(shí)代,IT之家這就來帶大家簡要回顧一下要點(diǎn)。
一、從 GeForce 游戲顯卡聊起
盡管英偉達(dá)并沒有在今年的 GTC 大會上發(fā)布新的 GeForce 游戲顯卡產(chǎn)品,但老黃依然選擇從 GeForce 的 25 周年聊起。
黃仁勛強(qiáng)調(diào),目前全球都已“售罄”的 RTX 5090 顯卡,比前代 RTX 4090 的體積足足小了 30%。
正是 GeForce 將 CUDA 帶給了世界,CUDA 讓 AI 成為了可能,AI 又反過來增強(qiáng)了游戲的視覺效果。
二、Agentic AI 時(shí)代
在發(fā)布新產(chǎn)品之前,老黃討論了我們在 AI 時(shí)代的發(fā)展階段。
現(xiàn)在我們處于生成式 AI(Generative AI)階段,根據(jù)路線圖,我們將邁向一個 Agentic AI 時(shí)代,隨后便是 Physical AI —— 機(jī)器人登場的時(shí)候。
老黃認(rèn)為,AI 領(lǐng)域 Scaling Law 的故事還沒有講完,而且仍在加速,我們對算力的需求并沒有減弱。
數(shù)據(jù)中心建設(shè)預(yù)計(jì)將在 2028 年達(dá)到 1 萬億美元(IT之家注:現(xiàn)匯率約合 7.23 萬億元人民幣)。
三、自動駕駛,安全第一位
自動駕駛汽車時(shí)代已來,英偉達(dá)將和 GM 通用汽車合作,打造未來的自動駕駛汽車。
面對安全問題,老黃還發(fā)布了英偉達(dá) Halos,一款從芯片到系統(tǒng)、軟件、算法、策略的全方位安全系統(tǒng),700 萬行代碼都經(jīng)過第三方的安全評估。
四、Dynamo,AI 工廠的操作系統(tǒng)
為了讓客戶“買得越多、省得越多”,英偉達(dá)發(fā)布了 Dynamo,號稱是“AI 工廠的操作系統(tǒng)”。
Dynamo 是一個“分布式推理服務(wù)庫”。本質(zhì)上,它是一個針對用戶需求 token 而無法生產(chǎn)足夠 token 之間問題的開源解決方案。
黃仁勛展示了一張關(guān)于推理的圖表,X 軸顯示用戶每秒的 Token 數(shù),Y 軸顯示工廠每秒的 Token 數(shù)。
在 Dynamo、Grace Blackwell NVLink72 超級芯片的加持下,Blackwell 相比 Hopper 可實(shí)現(xiàn) 25 倍的性能提升。
而在推理模型中,這一性能差距更是擴(kuò)大到了 40 倍。
五、超大杯 Blackwell Ultra 芯片
隨后,老黃正式發(fā)布了之前傳言已久的“超大杯”GB300 芯片,并將其命名為 Blackwell Ultra,單顆便配備了 288GB 的 HBM3e 內(nèi)存,擁有 15PF 的稠密 FP4 算力。
擁有 72 顆 GB300 的 Blackwell Ultra NVL72 平臺將于 2025 年下半年推出,算力達(dá)原本 GB200 NVL72 的 1.5 倍。
目前使用 Blackwell GB200 的客戶,也都可以平滑切換到 Blackwell Ultra。
六、下一代 Rubin 芯片,搶先預(yù)覽
接下來,黃仁勛公布了繼 Hopper、Blackwell 之后的下一代 AI 芯片 Rubin。
英偉達(dá)選擇以“證實(shí)暗物質(zhì)存在”的女性科學(xué)先驅(qū)薇拉?魯賓(Vera Rubin,1928–2016,婚前姓 Cooper)來命名,延續(xù)了該公司以杰出科學(xué)家命名芯片架構(gòu)的傳統(tǒng)。
Vera Rubin NVL144 將于 2026 年下半年推出,擁有 75TB 帶寬 13TB/s 的 HBM4 內(nèi)存,帶來 3.3 倍于上面介紹的 GB300 NVL72 的性能。
而更強(qiáng)的 Rubin Ultra NVL576 將于 2027 年下半年推出,擁有 365TB 帶寬 4.6PB/s 的 HBM4e 內(nèi)存,帶來 14 倍于 GB300 NVL72 的性能。
Rubin 的性能可達(dá) Hopper 的 900 倍,而 Blackwell 是 Hopper 的 68 倍。
為了匹配“AI 工廠”的需求,英偉達(dá)還發(fā)布了 Spectrum-X Photonics 與 Quantum-X Photonics 兩款光電一體化交換機(jī),為連接數(shù)百萬塊 GPU 做好準(zhǔn)備。
而 Rubin 的下一代架構(gòu)將被命名為 Feynman,用來紀(jì)念在量子力學(xué)領(lǐng)域作出了巨大貢獻(xiàn)的美國物理學(xué)家理查德?菲利普斯?費(fèi)曼。
七、全套 AI 計(jì)算機(jī),任你選擇
看完了上面的數(shù)據(jù)中心產(chǎn)品,我們再來看看老黃眼中 AI 時(shí)代的電腦應(yīng)該是什么樣的。
DGX Station 搭載一顆 GB300 超級芯片,擁有 784GB 統(tǒng)一內(nèi)存,AI 算力高達(dá) 20,000 TFLOPS。
之前在 CES 上發(fā)布的 Project DIGITS 迷你主機(jī),現(xiàn)已正式定名為 DGX Spark,僅需 3000 美元(現(xiàn)匯率約合 21691 元人民幣)即可獲得 1000 TFLOPS 的 AI 算力。
此外,英偉達(dá)還正式發(fā)布了面向工作站和服務(wù)器的 RTX PRO 系列 Blackwell 專業(yè)卡。
其中,旗艦級的 RTX PRO 6000 系列擁有 24,064 個 CUDA 核心、752 個 Tensor 核心、188 個 RT 核心。
八、步入機(jī)器人時(shí)代
在本次 GTC 的結(jié)尾,英偉達(dá)開始討論機(jī)器人的相關(guān)內(nèi)容。
老黃首先展示了與迪士尼和谷歌 Deepmind 團(tuán)隊(duì)合作打造的物理引擎 Newton,并把小機(jī)器人 Blue 請到了臺上進(jìn)行互動。
隨后老黃宣布,英偉達(dá) Isaac GROOT N1 —— 全球首款人形機(jī)器人功能模型將會開源!
Blackwell 芯片已經(jīng)開始全面生產(chǎn),Blackwell Ultra 超大杯將于今年年底登場,面向企業(yè)及個人的 AI 產(chǎn)品也箭在弦上,機(jī)器人具身智能時(shí)代也即將到來。
在 GTC 2025 上,英偉達(dá)傳達(dá)出的一個強(qiáng)烈信息,簡單來說便是:我們對 AI 算力的需求仍在持續(xù)加速中,快來買買買吧!
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。