【新智元導(dǎo)讀】老黃新 GPU 深夜炸場(chǎng),超高規(guī)格的背后也付出了不小的代價(jià),小編帶大家深入了解一下新架構(gòu)的硬件細(xì)節(jié)和成本,新顯卡的售價(jià)究竟高不高?英偉達(dá)也不得不開始卷了
老黃的新 GPU 又在深夜炸場(chǎng),震撼了所有的觀眾。
除了硬件參數(shù)上的震撼之外,大家伙最想知道的還是新 GPU 的售價(jià)會(huì)不會(huì)同樣震撼。
下面就讓我們從規(guī)格參數(shù)、工藝節(jié)點(diǎn)、封裝設(shè)計(jì)等方面來(lái)深入分析一下新一代 Blackwell GPU 的系統(tǒng)、定價(jià)、利潤(rùn),以及 Jensen's Benevolence(老黃的仁慈)
在這個(gè)大模型的時(shí)代,英偉達(dá)正處于世界之巔,擁有至高無(wú)上的定價(jià)權(quán)。
需要 AI 算力的用戶沒(méi)有更好的選擇,于是不得不接受英偉達(dá)「用銀湯匙喂給他們的東西」,—— 毛利率超過(guò) 85% 的 H100 就是最好的例子。
而這一代 B100 在性能和總體擁有成本方面的優(yōu)勢(shì)依然保持不變,超越了 AMD 的 MI300X、英特爾的 Gaudi 3。
不過(guò)這次新系列 GPU 的定價(jià),可能會(huì)讓很多人大吃一驚,也許我們會(huì)說(shuō)「B」代表的不是「Blackwell」架構(gòu),而是「Benevolence」(老黃的仁慈)。
—— 因?yàn)?AI 時(shí)代的主宰和救世主黃仁勛正在向全世界微笑,尤其是對(duì)于「GPU-poor」(缺乏 GPU 的用戶)來(lái)說(shuō)。
B100 / B200 規(guī)格
首先,Blackwell 架構(gòu)將 2 個(gè) GPU 芯片粘在了一起,而工藝制程仍然保持在 4nm,跟上一代的 Hopper 架構(gòu)一樣。
—— 在以往發(fā)布的最新數(shù)據(jù)中心 GPU 上,英偉達(dá)都會(huì)采用更新的工藝制程,而這一次沒(méi)有。
這是因?yàn)榕_(tái)積電最初的 3 納米 N3B 工藝存在問(wèn)題,所以英偉達(dá)不僅沒(méi)有吃到提升制程的紅利,還不得不把硅片的總量增加一倍。
此外,新架構(gòu)使用了 8-hi HBM3E,容量高達(dá) 192GB,這些顯存的供應(yīng)商是 SK Hynix 和 Micron。
盡管其中絕大部分來(lái)自 SK Hynix,但這也改變了 SK Hynix 作為 H100 顯存唯一供應(yīng)商的局面。
至于早就宣布要開發(fā) "世界上最快" 的 HBM3E 的三星,目前仍然差點(diǎn)意思。
GPU 的進(jìn)化趨勢(shì)是在更大的封裝中使用更多的硅片(包括邏輯和存儲(chǔ)器),而目前硅基插值器(silicon-based interposers)的尺寸已達(dá)到極限。
尺寸的增大會(huì)使硅片的生產(chǎn)面臨更多問(wèn)題,從而降低產(chǎn)量。相比于上一代,B100 的封裝尺寸要大得多,它將成為首款采用 CoWoS-L 的大容量產(chǎn)品(CoWoS-L 是一種帶有無(wú)源硅橋的有機(jī) RDL 基底面)。
Umbriel 和 Miranda
Blackwell 的第一個(gè)版本代號(hào)叫 Umbriel,它保留了前代 PCIe Gen 5、400G 網(wǎng)絡(luò)等,B100 風(fēng)冷式 700W 甚至可以無(wú)縫接入現(xiàn)有的 H100 和 H200 服務(wù)器底板。
不過(guò) B200 的功率上限將提高到 1000W,就需要重新設(shè)計(jì)服務(wù)器了。當(dāng)然也有信息顯示,1000W 版本仍然可以采用風(fēng)冷方式,令人感到意外。
標(biāo)準(zhǔn)版 GPU 的代號(hào)是 Miranda,擁有 PCIe Gen 6 和 800G 的網(wǎng)絡(luò),而顯存容量更是高達(dá) 192GB。
目前,英偉達(dá)已經(jīng)買斷了所有 36GB HBM 的供應(yīng),SK Hynix 和 Micron 將在明年初開始生產(chǎn)。這意味著,每塊 GPU 的容量實(shí)際上可以達(dá)到 288GB。
GB200 平臺(tái)
在供應(yīng)鏈中,每個(gè)人都在討論的產(chǎn)品是 Oberon GB200 平臺(tái),新平臺(tái)解決了 GH200 的許多問(wèn)題。
首先,GB200 將所需的 CPU 數(shù)量減半,從而在總體擁有成本(TCO)上占據(jù)了優(yōu)勢(shì)?!狦H200 的價(jià)格實(shí)在是太貴了,而大多數(shù)的 AI 負(fù)載,實(shí)際上用不到服務(wù)器上昂貴的英偉達(dá) Grace CPU 所提供的功能。
很多時(shí)候,GH200 中的 Grace 芯片只是充當(dāng)了世界上最昂貴的內(nèi)存控制器。在可以單獨(dú)購(gòu)買 GPU 的場(chǎng)景下,基本上所有 AI 大公司都會(huì)選擇買更多的 GPU,而不是英偉達(dá)的 CPU。
另一方面,英偉達(dá)正試圖銷售帶液體冷卻的集成機(jī)架。
英偉達(dá)不愿意單賣 GPU 或者 NVSwitch,雖然讓一些用戶感到不滿,但由于交換機(jī)背板、電源匯流排和冷卻系統(tǒng)的集成度要求很高,也算是無(wú)可厚非。
在新的液冷機(jī)架中,CPU、GPU、NVSwitches 和 ConnectX7 網(wǎng)卡全部采用水冷技術(shù)。
機(jī)架有兩個(gè)版本:一種是 120kW,可容納 72 個(gè) GPU(總功率有點(diǎn)過(guò)分了),機(jī)架頂部有 10 個(gè)計(jì)算托盤,中間有 9 個(gè) NVSwitch 托盤,底部有 8 個(gè)計(jì)算托盤。
每個(gè)計(jì)算托盤包含 4 個(gè) GPU、4 個(gè)網(wǎng)卡、2 個(gè) CPU、768GB HBM 和 2,000GB LPDDR5X。這個(gè)版本會(huì)晚一些上市。
另一種是功率較低的版本,這版本的機(jī)架有 36 個(gè) GPU 和 9 個(gè)計(jì)算托盤,可以通過(guò) NVLink 擴(kuò)展連接兩個(gè)機(jī)架。
對(duì)大多數(shù)公司來(lái)說(shuō),這個(gè)版本可能更容易部署。英偉達(dá)已通知機(jī)架的 ODM 廠商準(zhǔn)備明年生產(chǎn) 50,000 個(gè)機(jī)架。
被卷到了
盡管 B100 為最終用戶提供了更好的性價(jià)比,但本身的制造成本卻增加了一倍以上。
SemiAnalysis 表示,對(duì)于大批量超大規(guī)模定價(jià),B100 基板的平均售價(jià)僅僅約 240,000 美元。這對(duì)許多人來(lái)說(shuō)是一個(gè)驚喜,因?yàn)檫@遠(yuǎn)低于 ASP 逐代增長(zhǎng) 50% 的預(yù)期。
那么為什么老黃的定價(jià)會(huì)如此仁慈?答案是被卷到了。
AMD 的 MI300 目前成為了合格的競(jìng)爭(zhēng)對(duì)手,已經(jīng)成功拿到了英偉達(dá)最大的兩個(gè)客戶 Meta 和微軟的大訂單,盡管 AMD 為此承擔(dān)了很大的技術(shù)風(fēng)險(xiǎn)、并盡力降低了利潤(rùn)。
而另一方面,英偉達(dá)的所有主要客戶都在設(shè)計(jì)自己的芯片。雖然迄今為止,只有谷歌取得了成功,但亞馬遜仍在繼續(xù)推出 Inferentia 和 Trainium,Meta 也在長(zhǎng)期押注 MTIA,微軟同樣開啟了芯片之旅。
英偉達(dá)的防御形態(tài)
很明顯,生產(chǎn)成本翻倍,但售價(jià)增加得不算太多,B100 的利潤(rùn)率肯定是趕不上前代了。
H200 也是如此,它的 ASP 與 H100 相同,但 HBM 顯著增加,從而增加了 BOM。
而 H20 則更糟糕,盡管價(jià)格賣的更低,但實(shí)際上它與 H100 使用了相同的 GPU 芯片,HBM 容量也從 80GB 增加到 96GB,因此總體 BOM 成本實(shí)際上也增加了。
—— 以上的分析雖然聽起來(lái)很可怕,不過(guò)別擔(dān)心,毛利率只會(huì)再下降幾個(gè)百分點(diǎn)而已。
SemiAnalysis 對(duì)此評(píng)價(jià)道:“英偉達(dá)更關(guān)心毛利潤(rùn)和市場(chǎng)份額,而不是毛利率。過(guò)分擔(dān)心幾個(gè)百分點(diǎn)是精打細(xì)算的人所做的事情,而不是像黃仁勛這樣的有遠(yuǎn)見的人所做的,他想以仁慈的計(jì)算獨(dú)裁者的身份統(tǒng)治世界?!?/p>
畢竟,英偉達(dá)在數(shù)據(jù)中心上的收入持續(xù)飆升,并且正在實(shí)現(xiàn)供應(yīng)鏈多元化,從 800G 收發(fā)器到電力傳輸組件,—— 老黃正在下一盤大棋。
也許,隨著時(shí)代的發(fā)展,英偉達(dá)這個(gè)顯卡帝國(guó)可能不得不轉(zhuǎn)換成防御形態(tài),因?yàn)橛布蛙浖系淖o(hù)城河,都不會(huì)永遠(yuǎn)堅(jiān)不可摧。
但也許,新的帝國(guó)正在誕生之中。
參考資料:
https://www.semianalysis.com/p/nvidia-b100-b200-gb200-cogs-pricing
本文來(lái)自微信公眾號(hào):新智元 (ID:AI_era)
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。