放核彈之前,馬斯克搞了一次小小的“試爆”。
剛剛透露了特斯拉下一代車載計算平臺的信息:不叫 HW5.0,直接改名叫 AI5。能耗提升 5 倍,算力提升 10 倍。
為啥不叫 HW5.0?有啥提升
HW 其實就是 Hardware 的縮寫,字面上自動駕駛系統(tǒng)硬件的意思。
這應(yīng)該是早期馬斯克直接把內(nèi)部工程項目的代號拿來當(dāng)產(chǎn)品名稱了。
創(chuàng)業(yè)階段初出茅廬,這樣搞挺好,凸顯特斯拉技術(shù)宅、工程師基因。
但現(xiàn)在特斯拉家大業(yè)大,全球智能車行業(yè)都在模仿和試圖超越,再這么隨意,好像也不太合適。
于是馬斯克宣布,我們改名啦,新一代自動駕駛硬件平臺,名字就叫 ——AI5。
這屬于是自動駕駛第一性原理命名法了。
老馬透露的相關(guān)信息還有這些:首先是算力比現(xiàn)款 HW4.0 提升 10 倍,其次是功耗整體提高 4-5 倍。2025 年下半年推出。
有這么幾個點(diǎn)值得留意。算力方面,馬斯克特別提到整個平臺的算力大概是 HW4.0 的 10 倍。
其實特斯拉從未明確公布過 HW4.0 的具體數(shù)據(jù),只是說是 HW3.0 的 5 倍(國內(nèi)三方資料中的 750TOPS 數(shù)據(jù)無官方證實),所以根據(jù)已知信息和國外發(fā)燒友的實機(jī)拆解測試,大概可以推測出 HW4.0 的算力在 300TOPS-500TOPS 之間。
也就是單顆 FSD 芯片 200 多 TOPS 算力。這樣計算,AI5 整個平臺算力可能達(dá)到 3000-5000TOPS,這個數(shù)據(jù)是十分恐怖的。
目前國內(nèi)的 TOP 玩家,比如華為、小鵬等等,支撐無圖、輕圖城市 NOA 功能的算力平臺,不過就在 400-500TOPS 左右。
“芯皇”英偉達(dá) Thor,頂配才 2000 多 TOPS,而且業(yè)內(nèi)已經(jīng)有很多意見認(rèn)為量產(chǎn)車并不需要如此過剩的算力。
馬斯克到底是在“放衛(wèi)星”提振外界對特斯拉的信心,還是真的對自動駕駛技術(shù)范式做出了革命性變革,是個很大的懸念和看點(diǎn)。
第二個值得留意的是能耗方面。馬斯克提到五代硬件平臺,整體能耗比 HW4.0 提升 4-5 倍,相比于 10 倍的性能提升,其實證明特斯拉自動駕駛軟硬結(jié)合能力更進(jìn)一步,能耗控制更合理了。
還要補(bǔ)充一點(diǎn),車載計算芯片和手機(jī)計算芯片的不同之一,就是可以無后顧之憂地打“富裕仗”,不必過于把能耗、尺寸作為衡量優(yōu)劣的指標(biāo)。車載計算平臺的散熱條件,天然也比 PC、手機(jī)優(yōu)良得多。
畢竟電動車的電池容量遠(yuǎn)大于手機(jī),而且就算芯片能耗再高,相比于電機(jī)、空調(diào)等等,也只能算零頭。
還有一點(diǎn)容易被忽略,馬斯克說 AI5 是“特斯拉最新一代計算平臺”,但是嚴(yán)謹(jǐn)?shù)卣f,特斯拉的業(yè)務(wù)就僅僅有汽車嗎?
所以這也是大部分網(wǎng)友推測的依據(jù):AI5 很可能并不是專門為 FSD 準(zhǔn)備,如此高的算力,匹配的可能是今年 8 月即將發(fā)布的特斯拉 Robotaxi、人形機(jī)器人 Optimus,以及未來支持 L4、L5 的特斯拉車型。
也許那個時候的特斯拉產(chǎn)品,真的會取消駕駛艙。
不過也有用戶提了一個很尖銳的問題:
之前 HW3.0 面世時,馬斯克就拍胸脯保證可以實現(xiàn)無監(jiān)督的 FSD 功能,但顯然是鴿了。直到今天的 HW4.0 仍然不行。AI5 就一定可以嗎?
AI5 會帶來什么樣的改變?
現(xiàn)在已知的信息并不多,只有一點(diǎn)是較為確定的,AI5 由三星代工,4nm 工藝。
最早特斯拉曾表示過 100% 給臺積電代工,不過后來馬斯克和三星高層見了一面后,又改了最初的決定。
據(jù)說是三星給馬斯克開了一個“沒法拒絕”的優(yōu)惠價格,而且先進(jìn)制程的良品率提升到 70% 多,和臺積電相差不多了。
所以可以基本肯定,AI5 仍然會采用基于 Exynos-IP 的內(nèi)核。Exynos-IP 是三星基于 ARM 構(gòu)架設(shè)計的自有 IP,谷歌的手機(jī)也用過。
2019 年三星因為和高通合作,就停止了相關(guān)工作,不過 Exynos-IP 設(shè)計非常超前,基本上近似于目前 ARM Cortex X 系列的旗艦 X3 的設(shè)計,所以 2020 年之后才開始設(shè)計的 HW4.0,經(jīng)國外特斯拉爆料大神 Greentheonly 拆解發(fā)現(xiàn),仍然采用了 Exynos-IP。
AI5 很可能延續(xù)這個路線。
當(dāng)然,今時不同往日,自動駕駛算法的技術(shù)范式已經(jīng)發(fā)生了深刻變革,從最初的 CNN 為主的模塊化網(wǎng)絡(luò)結(jié)構(gòu),轉(zhuǎn)變?yōu)橐?Transformer 為主的端到端一體化網(wǎng)絡(luò)。
外界通常更加關(guān)心自動駕駛芯片的 NPU 算力,這本身沒錯,大模型時代,當(dāng)然需要更強(qiáng)的 AI 計算能力。
但對于自動駕駛?cè)蝿?wù)來說,光 NPU 變強(qiáng)還不夠,AI 處理器的速度再快,算力再高,如果 90% 的時間都是在等內(nèi)存搬運(yùn)數(shù)據(jù),那也是白搭。
CNN 時代外置 CPU 足以配合好 AI 處理器,但到了 Transformer,CPU 反而成了瓶頸,內(nèi)置成了最佳選擇。
實際上,HW4.0 就是添加了一個 CPU 以應(yīng)對 Transformer,剛好和特斯拉超算芯片 Dojo 的 D1 架構(gòu)原理相同。
這也就解釋了馬斯克在劇透 AI5 的同時,還特意強(qiáng)調(diào)了 HW4.0 不是直接退役,而是拿去構(gòu)建訓(xùn)練集群(和英偉達(dá) A100 同時服役)。
所以特斯拉對于下一代計算平臺 AI5 的安排和帶來的影響,大概也能推測一二了。
AI5 的超大算力,極大可能不是單一芯片或雙芯片實現(xiàn),而是多個下一代 4nm FSD 芯片組合的結(jié)果。
如果真是單顆 / 雙顆芯片數(shù)千 TOPS 算力,成本就會到幾乎無法量產(chǎn),不是汽車工業(yè)也不是科技行業(yè)的玩法。
這也就說明,AI5 很有可能是一個平臺方案,根據(jù)任務(wù)、場景、產(chǎn)品成本要求不同,“豐儉由馬斯克”。
最復(fù)雜的人形機(jī)器人,可能會用到數(shù)千 TOPS 算力,Robotaxi 可能就會低一點(diǎn)。相應(yīng)的,特斯拉量產(chǎn)車可能會更低。
至于完全無監(jiān)督的 FSD 在車端到底需要多大算力支持,可能馬斯克自己現(xiàn)在也不清楚,仍在摸索中。
“端到端”最合理最高效的模式,到底是全部 AI 模型化,做成一個大黑盒,還是有條件的、逐步一體化,業(yè)內(nèi)也沒有定論。
AI5 最終體現(xiàn)在特斯拉量產(chǎn)車的算力有多大,不好判斷,但肯定大于現(xiàn)在的四五百 TOPS。
所以 AI5 帶來的沖擊和影響,最直接的是開啟智能汽車、自動駕駛的算力軍備競賽。
全行業(yè)玩家在這樣的競賽過程中,逐漸就會明確端到端自動駕駛的實現(xiàn)基本前提和門檻。
L4 也是同樣,AI5 在特斯拉的 Robotaxi 上的探索和試錯,作用也相當(dāng)于量產(chǎn)車,那就是給 Robotaxi 的落地打造出一個樣板:多大算力、什么樣的方案配置、多少成本。
更重要的,是特斯拉身體力行為所有“AGI”玩家打樣:需要什么樣的技術(shù)體系,底層通用平臺如何打造,云端終端的架構(gòu)分別怎么選擇…
本文來自微信公眾號:智能車參考(ID:AI4Auto),作者:有車有據(jù)
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。