設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

蘋果性能最強 M1 Ultra 芯片解密:業(yè)內(nèi)首個 GPU 裸片集成,如何實現(xiàn)?

2022/3/12 18:41:19 來源:愛集微 作者:思坦 責(zé)編:瀟公子

這顆采用 2.5D 封裝的芯片十分符合其“Ultra”的名頭:通過硅中介層將兩個 M1 Max 裸片集成在一起,帶來了驚人的 2.5TB / 秒的帶寬。但亮點卻在于,M1 Ultra 首次實現(xiàn)了兩顆 GPU 裸片的集成。這是過去的幾年來,AMD、英偉達、英特爾都宣稱要做,卻至今未能做到的成就。

憑借這一突破,蘋果終于如愿以償?shù)卦?GPU 領(lǐng)域?qū)τミ_構(gòu)成了挑戰(zhàn)。據(jù)蘋果所說,M1 Ultra 的 GPU 性能超過了英偉達的 GeForce RTX 3090,后者是目前市面上速度最快的 GPU。

踏入自研芯片領(lǐng)域不過幾年的蘋果,究竟是如何做到業(yè)內(nèi)首個 GPU 裸片集成的?而這一技術(shù)的實現(xiàn),又將為巨頭爭霸的 GPU 市場,帶來什么樣的變局?

圖源:蘋果

AMD、英偉達紛紛折戟 GPU 裸片集成難在哪?

自 MCM(Multi Chip Module,多芯片模組)技術(shù)誕生以來,像搭建樂高一樣,在單一芯片中實現(xiàn)不同技術(shù)節(jié)點、不同功能的裸片的集成堆疊,成為了摩爾定律之外,半導(dǎo)體技術(shù)發(fā)展的另一路徑,其本質(zhì)在于將多個裸芯片和其它元器件組裝在同一塊多層互連基板上。

隨著臺積電、三星、英特爾的 2.5D / 3D 封裝逐漸成熟、商業(yè)化,在高端處理器領(lǐng)域,單顆芯片中 CPU 與 Memory、GPU 與 memory 的裸片集成,已不再是新鮮事。然而,兩顆 GPU 裸片的集成,在蘋果 M1 Ultra 發(fā)布之前,只存在于英偉達、AMD、英特爾的 PPT 中。

2017 年,英偉達發(fā)表論文詳細(xì)解釋了一種名為可組合封裝 GPU(Composable On-Package Architecture GPU,COPA GPU)的架構(gòu),核心在于將多個 GPU 模塊和內(nèi)存系統(tǒng)模塊集成。同年,AMD 對外展示了由四個 GPU 裸片集成的 MCM 設(shè)計,宣稱其性能將比當(dāng)時最大的單片 GPU 的性能高 45.5%。

COPA GPU;來源:英偉達

然而,直到后來者英特爾在今年年初提出了一種 GPU 裸片集成解決方案,英偉達和 AMD 的多裸片集成 GPU 仍未問世。當(dāng)然,AMD、英偉達的 Instinct MI200 系列和 Hopper 系列據(jù)稱均有望在今年年底前姍姍來遲,但顯然,拖延癥讓他們在“業(yè)內(nèi)首個”上輸給了蘋果。

這種“拖延癥”背后的無奈,是市場和技術(shù)兩個方面的。廈門云天董事長于大全教授對筆者表示,過去對處理器的要求不那么高,一顆 GPU 裸片就夠了,兩顆集成的成本過高。這也與此前一些業(yè)內(nèi)觀點一致。有評論甚至認(rèn)為,對 GPU 需求最大的游戲領(lǐng)域,這樣的設(shè)計并無價值。

2020 年初,時任 AMD Radeon 技術(shù)事業(yè)部工程研發(fā)高級副總裁的 David Wang 在接受外媒采訪時就表示,多裸片集成的 GPU 幾乎不可能出現(xiàn)在 2021 年發(fā)布的 Navi 系列產(chǎn)品中,“我們正在研究 MCM 架構(gòu),”他說,“但我們尚未得出結(jié)論,這是一種可以應(yīng)用于傳統(tǒng)游戲 GPU 的架構(gòu)?!?/p>

市場未成氣候外,技術(shù)難點則是 GPU 裸片集成的最大痛點。據(jù)于大全介紹,與 CPU+Memory 或 GPU+Memory 的裸片集成相比,GPU+GPU 的裸片集成最大的難點在于線路更細(xì)更密,就需要更多的接口(I / O),為此,就需要將用于引出裸片信號的凸點間距縮小到 50/40um 規(guī)格以下。

紅框標(biāo)注為凸點;圖源:英特爾

后來者蘋果彎道超車 臺積電無凸點技術(shù)幫了大忙?

從目前業(yè)內(nèi)最前沿技術(shù)來看,凸點間距縮小到 20um 以下已成為 2.5D / 3D 封裝的一大門檻,英特爾、臺積電均已將此作為先進封裝的研發(fā)重點,例如英特爾的 Foveros 就將凸點間距縮小到 10um,而臺積電的想法更加跳躍,提出了“無凸點”互連方法 SoIC,而這或許正是幫助蘋果彎道超車的利器。

從 C4 凸點到無凸點;圖源:臺積電

根據(jù)臺積電此前介紹,SoIC 是對前道芯片堆疊技術(shù)的統(tǒng)稱,主要特征是不再使用后道集成所用的凸點技術(shù),轉(zhuǎn)而直接將裸片堆疊到一起。這種方法除了沒有“凸點間距”這一緊箍咒外,還能大大降低熱阻,不過缺點是必須在芯片最開始設(shè)計時就要一起被確定,技術(shù)要求自然更高。

據(jù)于大全介紹,蘋果很早就開始與臺積電共同研究無凸點連接方法,因此其也推測,正是這種技術(shù),幫助蘋果 M1 Ultra 實現(xiàn)了 GPU 裸片集成?!埃闫c裸片間互聯(lián))最終的解決方案就是無凸點,就是上下裸片之間銅對銅、介質(zhì)層對介質(zhì)層的這種鍵合?!庇诖笕f。

這種推論是有理由成立的。雖然蘋果在通稿中僅透露使用了在 2.5D 封裝常用的硅中介層,但結(jié)合蘋果官方給出的宣傳視頻和動畫模型來看,似乎使用了某種小型 Si 橋,在生產(chǎn)中實際上與英特爾的 EMIB 或 AMD 的 Elevated Fanout Bridge (EFB)相似,兩者均無凸點設(shè)計。

除此之外,蘋果是否為其 GPU 裸片集成設(shè)計了新的接口 IP 也讓人浮想。這一點在蘋果的新聞通稿中未置一詞,但從技術(shù)實現(xiàn)上來看,接口 IP 的重要性幾乎僅次于微凸點和 TSV 技術(shù)。于大全也表示,接口 I / O 變多,必須要采用新的解決方案。這也是英偉達、AMD 此前的重要發(fā)力點。

AMD 于 2020 年初宣布,將 Infinity Fabric 總線互聯(lián)技術(shù)升級至 Infinity Architecture,除了支持 CPU-CPU 集成外,還支持最多 8 個 GPU 芯片的連接以及 CPU-GPU 集成。同時表示,其新一代 El Capitan 超級計算機將搭載 Infinity Architecture,Genoa EPYC 基于 Zen 4 架構(gòu),1 個 CPU 與 4 個 GPU 裸片集成。

英偉達早在 2014 年即推出了 NVLINK,實現(xiàn)了芯片層級的 GPU 的高速互聯(lián),2016 年,發(fā)布了搭載 NVLINK 的第一款產(chǎn)品 P100,此后不斷進行更新?lián)Q代,并在 NVLINK 的基礎(chǔ)上推出了 NVIDIA NVSwitch,可在單個服務(wù)器節(jié)點中支持 8-16 個全互聯(lián)的 GPU,實現(xiàn)更高速度的通信。

需要指出的是,在這一層面上,蘋果方面的進展目前只能停留在猜測階段,但蘋果從來不會在技術(shù)不成熟的時候就推出產(chǎn)品,可以試圖推斷,蘋果雖然并未在新聞稿中提到接口 IP,但并不代表其在此方面并無突破,更大的可能是其對關(guān)鍵技術(shù)仍然有所保留。

寫在最后

無論如何,M1 Ultra 的推出,除了再次拔高外界對蘋果芯片能力的預(yù)期之外,還將 GPU 能力的擴展真正與先進封裝綁定了起來,雖然 GPU 進入多裸片集成時代是早就被預(yù)測的,但被產(chǎn)品搭載進入商業(yè)化量產(chǎn)是完全不同的概念,且實現(xiàn)這一目標(biāo)的是這一市場的新入者蘋果,就更加耐人尋味。

這或許將意味著,在 GPU 領(lǐng)域,先進封裝有望成為 X 因素,打破當(dāng)前英特爾、AMD、英偉達三強爭霸的格局,而掌握最高端先進封裝技術(shù)的臺積電亦或是英特爾,將擁有更大的話語權(quán)。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:蘋果,芯片,M1 Ultra

軟媒旗下網(wǎng)站: IT之家 辣品 - 超值導(dǎo)購,優(yōu)惠券 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 魔方 酷點桌面 Win7優(yōu)化大師 Win10優(yōu)化大師 軟媒手機APP應(yīng)用