美國硅谷創(chuàng)企 Cerebras Systems 推出了其新的 Wafer Scale Engine 2(WSE-2)處理器,該處理器為超級計算任務而構建,具有破紀錄的 2.6 萬億個晶體管(市場上最大的 GPU 只有 540 億個晶體管)和 85 萬顆 AI 優(yōu)化內核,大小類似餐盤,采用臺積電的 7nm 工藝。
這是 Cerebras 第二次使用整個 300mm 晶圓制造單顆芯片。這么大的晶圓一般會被切割成數百個獨立芯片,Cerebras 卻將其制成一個芯片。在龐大的體積之下,這種芯片相比同等算力的 GPU 集群,功耗和所占空間更小。
▲WSE-2 與最大的 GPU 尺寸對比
一、Cerebras 估值約 24 億美元,創(chuàng)始人斯坦福出身
Cerebras Systems 位于美國加利福尼亞州,創(chuàng)建于 2016 年。該公司專注于深度學習的計算機系統。目前該公司在硅谷、多倫多和東京都有辦事處,2019 年 11 月獲得了 4.75 億美元的 E 輪融。融資后,Cerebras Systems 估值約為 24 億美元。
安德魯?費爾德曼(Andrew Feldman)是 Cerebras 的聯合創(chuàng)始人兼首席執(zhí)行官,他具有斯坦福大學學士學位和工商管理碩士學位,曾經創(chuàng)辦了專注于超高密度計算機服務器業(yè)務的 Seammicro 公司。Seammicro 在 2012 年被 AMD 以 3.57 億美元價格收購。
▲Cerebras 聯合創(chuàng)始人兼首席執(zhí)行官 Andrew Feldman
2019 年,Cerebras 曾發(fā)布第一代 WSE 芯片,這款芯片具有 40 萬個內核和 1.2 萬億個晶體管,使用臺積電 16nm 工藝制程。
二、WSE-2 性能參數超競品幾個數量級,良率更高
WSE-2 仍由臺積電代工,但采用更加先進的 7nm 工藝。與第一代芯片相比,WSE-2 的晶體管數、內核數、內存、內存帶寬和結構帶寬等性能特征增加了一倍以上。由于 WSE-2 采用了 7nm 工藝制程,電路之間的寬度僅有七十億分之一米。
如此龐大的芯片尺寸帶來了 WSE-2 的大幅性能提升,該芯片的各類性能參數超出競品幾個數量級,能夠極大地縮減 AI 訓練時間。
相比競品 GPU,WSE-2 芯片的內核數量是其 123 倍,芯片內存是競品的 1000 倍以上,內存帶寬是 12000 倍,結構帶寬也增加了 45000 倍。
▲WSE、WSE-2 和英偉達 A100GPU 性能參數對比
Feldman 指出,通過將芯片放大互連,就可以在芯片上保留大量數據。WSE-2 相對普通 GPU 集群,延遲和能耗都會比較低。普通 GPU 集群在提供相同的算力時,將會需要數十個機架,花費數個月進行配置和編程,功率將高達數百瓦。
WSE-2 相對 GPU 還有很多核心冗余,如果有內核發(fā)生故障,單獨的故障內核并不影響芯片使用。而在臺積電這樣的晶圓代工廠中,很少出現連續(xù)的內核缺陷,因此 WSE-2 的良率較高。
三、Cerebras 擁有多位重量級客戶
國際調研機構 Moor Insights&Strategy 的分析師 Patrick Moorhead 認為,WSE-2 內核數量帶來的性能確實對英偉達的 GPU 產生了一定挑戰(zhàn)。但是英偉達的解決方案更加靈活,幾乎可以安裝在任何服務器機箱中。
Tirias Research 首席分析師 Jim McGregor 在一封電子郵件中寫道,雖然對于數以百萬的 AI 算法來說,Cerebras 不像英偉達一樣全面,但是 Cerebras 的解決方案顯然已經吸引到了許多客戶。
從 2019 年交付 WSE 芯片起,在過去的一年里,已經有很多重量級用戶使用了 Cerebras 的產品。
比如美國阿貢國家實驗室、勞倫斯利弗莫爾國家實驗室、匹茲堡超級計算中心、愛丁堡大學的超級計算中心、葛蘭素史克、東京電子器件等。
全球制藥巨頭葛蘭素史克的高級副總裁 Kim Branson 稱贊到,Cerebras 增加了編碼器模型的復雜性,將訓練時間減少到之前的 1/80。
在美國最大的科學與工程研究室阿貢國家實驗室,CS-1 芯片被用于癌癥研究,將癌癥模型的實驗周轉時間減少到 1/300 還少。
Feldman 說,Cerebras 將在明年公布產品在重型制造、制藥、生物技術和軍事等領域取得的成就。WSE-2 將被集成到 CS-2 超算系統中,在今年第三季度上市。
結語:Cerebras 另辟蹊徑展現巨型芯片前景
雖然相比英偉達,Cerebras 沒有那么全面,但是 WSE 系列芯片并非單純的放大。在芯片尺寸如此巨大后,互連技術、芯片封裝、散熱等問題都會發(fā)生很大變化。
Cerebras 解決了這些問題,用 WSE-2 的優(yōu)點向我們展示了芯片尺寸并非只能越做越小,巨型芯片也存在廣泛的應用前景。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。