科普：火遍全網(wǎng)的 DPU 到底是什么

鮮棗課堂 2022/8/18 14:09:11 責(zé)編：瀟公子

評(píng)論：

不管你是否身處 ICT 行業(yè)，這兩年有一個(gè)詞你肯定聽(tīng)說(shuō)過(guò)，那就是 DPU 。

作為一個(gè)全新興起的科技概念，DPU 正在以驚人的速度崛起，成為整個(gè)行業(yè)甚至整個(gè)社會(huì)的關(guān)注重點(diǎn)。尤其是投資領(lǐng)域，對(duì) DPU 簡(jiǎn)直是競(jìng)相追逐，將其視為未來(lái)顛覆行業(yè)的潛力技術(shù)。

究竟什么是 DPU ？它和我們熟悉的 CPU 、 GPU 有什么區(qū)別？

今天，小棗君就帶大家徹底搞明白 DPU 的來(lái)龍去脈。

█ 什么是 DPU

DPU 的英文全稱叫做 Data Processing Unit ，也就是數(shù)據(jù)處理器。

科普：火遍全網(wǎng)的 DPU 到底是什么

英偉達(dá)首席執(zhí)行官黃仁勛曾在演講中表示：“ DPU 將成為未來(lái)計(jì)算的三大支柱之一，未來(lái)的數(shù)據(jù)中心標(biāo)配是‘ CPU + DPU + GPU ’。CPU 用于通用計(jì)算，GPU 用于加速計(jì)算，DPU 則進(jìn)行數(shù)據(jù)處理。”

聽(tīng)著有點(diǎn)暈，DPU 到底進(jìn)行什么樣的數(shù)據(jù)處理？有了 CPU 和 GPU ，為啥還要 DPU ？

眾所周知，后來(lái)的計(jì)算機(jī)普遍采用著名的馮諾依曼架構(gòu)。

科普：火遍全網(wǎng)的 DPU 到底是什么

馮諾依曼架構(gòu)

這是一個(gè)以計(jì)算和存儲(chǔ)為核心的架構(gòu)，CPU 作為處理器單元，負(fù)責(zé)完成各種算術(shù)和邏輯計(jì)算。而內(nèi)存（運(yùn)存）和硬盤(pán)（外部存儲(chǔ)），負(fù)責(zé)存儲(chǔ)數(shù)據(jù)，與 CPU 交互。

除了 CPU 、內(nèi)存和硬盤(pán)之外，就是鍵盤(pán)、顯示器這樣的輸入和輸出設(shè)備。隨著時(shí)間的推移，后來(lái)，我們有了鼠標(biāo)，又有了顯卡、網(wǎng)卡。最終，形成了現(xiàn)在大家看到的電腦的基本構(gòu)造。

有了顯卡，就有了 GPU（Graphics Processing Unit），圖形處理器。大家都玩過(guò)游戲，很明白，正是游戲、 3D 設(shè)計(jì)等多媒體圖形軟件的高速發(fā)展，要處理的工作量越來(lái)越大，也越來(lái)越復(fù)雜，CPU 實(shí)在忙不過(guò)來(lái)，所以就有了專門進(jìn)行圖像和圖形相關(guān)運(yùn)算工作的 GPU ，分擔(dān) CPU 的壓力。

DPU 的出現(xiàn)，道理也是一樣的。同樣是因?yàn)?CPU 難以負(fù)擔(dān)一些復(fù)雜的計(jì)算，所以需要進(jìn)行任務(wù)分工。

█ DPU 到底算些什么

好了，終于到了關(guān)鍵點(diǎn)了。說(shuō)了半天，DPU 到底分擔(dān)了 CPU 的哪些工作呢？

說(shuō)實(shí)話，想要從技術(shù)上解釋 DPU 分擔(dān)的工作內(nèi)容，稍微有點(diǎn)困難，不容易看懂。但是，我們可以從工作場(chǎng)景上進(jìn)行解釋。

大致來(lái)看，DPU 分擔(dān)的工作可以歸納為四個(gè)關(guān)鍵詞，分別是虛擬化、網(wǎng)絡(luò)、存儲(chǔ)以及安全。

科普：火遍全網(wǎng)的 DPU 到底是什么

特別需要提醒大家，DPU 是一個(gè)緊密圍繞數(shù)據(jù)中心的概念。也就是說(shuō)，它主要用于數(shù)據(jù)中心這種大規(guī)模算力場(chǎng)景，而非我們每個(gè)人的臺(tái)式機(jī)、筆記本電腦或手機(jī)（至少目前不是）。

DPU 服務(wù)于云計(jì)算，主要作用是提升數(shù)據(jù)中心等算力基礎(chǔ)設(shè)施的效率，減少能耗浪費(fèi)，進(jìn)而降低成本。

前面提到的虛擬化、網(wǎng)絡(luò)、存儲(chǔ)以及安全，是數(shù)據(jù)中心非常重要的工作，也是大量消耗算力資源的工作。

科普：火遍全網(wǎng)的 DPU 到底是什么

以網(wǎng)絡(luò)為例。

在數(shù)據(jù)中心里，時(shí)時(shí)刻刻都有大量的數(shù)據(jù)在進(jìn)行傳輸。主機(jī)在收發(fā)數(shù)據(jù)時(shí)，需要進(jìn)行海量的?絡(luò)協(xié)議處理。根據(jù)傳統(tǒng)的計(jì)算架構(gòu)，這些協(xié)議處理都是由 CPU 完成的。

有人統(tǒng)計(jì)過(guò)，想要線速處理 10G 的?絡(luò)，需要的?約 4 個(gè) Xeon CPU 的核。也就是說(shuō)，僅僅是進(jìn)行?絡(luò)數(shù)據(jù)包的處理，就要占用?個(gè) 8 核?端 CPU ?半的算?。現(xiàn)在數(shù)據(jù)中心網(wǎng)絡(luò)不斷升級(jí)，從 10G 到 40G 、 100G ，甚至 400G ?速?絡(luò)，這些性能開(kāi)銷如何承受？

這些開(kāi)銷如此之大，以至于被稱為“ Datacenter Tax（數(shù)據(jù)中心稅）”。

業(yè)務(wù)程序尚未運(yùn)行，僅是接入網(wǎng)絡(luò)數(shù)據(jù)，就消耗了這么多算力資源，這是無(wú)法忍受的。所以，就有公司提出了 SmartNIC （智能網(wǎng)卡）的概念，將網(wǎng)絡(luò)協(xié)議處理的工作從 CPU “卸載”到網(wǎng)卡上，以此分擔(dān) CPU 的負(fù)載。

2015 年，云計(jì)算廠商 AWS 率先開(kāi)始探索這種 SmartNIC 模式。他們收購(gòu)了芯片廠商 Annapurna Labs ，并于 2017 年正式推出 Nitro 系統(tǒng)。同年，阿里云也官宣了有類似功能的神龍（ X-Dragon ）架構(gòu)。

2019 年 3 月，英偉達(dá)花費(fèi) 69 億美元收購(gòu)了以色列芯片公司 Mellanox 。英偉達(dá)將 Mellanox 的 ConnectX 系列高速網(wǎng)卡技術(shù)與自己的已有技術(shù)相結(jié)合，于 2020 年正式推出了兩款 DPU 產(chǎn)品：BlueField-2 DPU 和 BlueField-2X DPU 。

科普：火遍全網(wǎng)的 DPU 到底是什么

從此，DPU 這個(gè)概念正式進(jìn)入了公眾視野。2020 年，也被稱為 DPU 元年。

正因?yàn)?DPU 和 SmartNIC 有這樣的淵源，所以，人們普遍將 DPU 視為 SmartNIC 的擴(kuò)展升級(jí)版。

DPU 在 SmartNIC 的基礎(chǔ)上，將存儲(chǔ)、安全和虛擬化等工作負(fù)載也從 CPU 卸載到自己身上。

上世紀(jì) 90 年代末，以 VMWare 為代表的虛擬化技術(shù)剛剛出現(xiàn)的時(shí)候，完全是由軟件進(jìn)行模擬線的，缺乏硬件的支持，所以，性能很差，幾乎難以使用。

后來(lái)，2005 年，隨著技術(shù)的演進(jìn)，CPU 和內(nèi)存的硬件虛擬化問(wèn)題逐漸解決，才讓虛擬化系統(tǒng)的性能有了大幅的提升，也激活了這項(xiàng)技術(shù)的發(fā)展前景和價(jià)值。眾所周知，我們現(xiàn)在的整個(gè)云計(jì)算架構(gòu)，都是基于虛擬化技術(shù)發(fā)展起來(lái)的。

虛擬化技術(shù)發(fā)展的過(guò)程，是硬件能力不斷取代軟件能力的過(guò)程。前面我們提到 AWS 發(fā)布 Nitro 系統(tǒng)。這個(gè)系統(tǒng)除了 SmartNIC 之外，也完成了 I / O 的硬件虛擬化。它還將虛擬化管理程序 Hypervisior 從 CPU 卸載到專用硬件上。這樣做帶來(lái)的結(jié)果就是，虛擬化技術(shù)的性能損耗趨近于零，CPU 的負(fù)擔(dān)進(jìn)一步下降。

存儲(chǔ)也是如此。

現(xiàn)在數(shù)據(jù)中心對(duì)存儲(chǔ)讀取和寫(xiě)入的速率要求很高。SSD 價(jià)格逐漸下降后，將 SSD 通過(guò)本地 PCIe 或高速網(wǎng)絡(luò)與系統(tǒng)相連接，成為了一種主流的技術(shù)路線。針對(duì)分布式系統(tǒng)，在以往 InfiniBand 、 FC（Fiber Channel，光纖通道）、 Ethernet 的基礎(chǔ)上，RDMA（Remote Direct Memory Access，遠(yuǎn)程直接數(shù)據(jù)存?。┘夹g(shù)開(kāi)始流行。

科普：火遍全網(wǎng)的 DPU 到底是什么

在 RDMA 模式中，應(yīng)用程序的數(shù)據(jù)，不再經(jīng)過(guò) CPU 和復(fù)雜的操作系統(tǒng)，直接和網(wǎng)卡通信。這就意味著，DPU 可以承擔(dān)存儲(chǔ)相關(guān)的高速接口標(biāo)準(zhǔn)協(xié)議處理，進(jìn)一步為 CPU 分擔(dān)壓力。

最后再看看安全。

在目前越來(lái)越嚴(yán)峻的安全形勢(shì)下，為了確保網(wǎng)絡(luò)和系統(tǒng)的安全可靠，引入了大量的加密算法。以往，這些算法都是由 CPU 負(fù)責(zé)完成加密和解密的。

但事實(shí)上，網(wǎng)絡(luò)接口才是最理想的隱私邊界。在網(wǎng)絡(luò)接口上進(jìn)行加密和解密，才是最合理的。所以，像國(guó)密標(biāo)準(zhǔn)的非對(duì)稱加密算法 SM2 、哈希算法 SM3 和對(duì)稱分組密碼算法 SM4 等，其實(shí)都可以交給 DPU 進(jìn)行計(jì)算。未來(lái)，區(qū)塊鏈技術(shù)成熟應(yīng)用后，相關(guān)算法也是可以從 CPU 卸載到 DPU 進(jìn)行的。

綜上所述，大家應(yīng)該也看明白了，DPU 的作用本質(zhì)，就是卸載、加速和隔離 —— 把 CPU 的部分工作卸載到自己身上；利用自己的算力特長(zhǎng)，對(duì)這些工作進(jìn)行加速運(yùn)算；整個(gè)過(guò)程，實(shí)現(xiàn)了計(jì)算的隔離。

█ DPU 的未來(lái)前景

DPU 是一個(gè)新型可編程多核處理器，是一塊 SoC（System On Chip）芯片。它符合行業(yè)標(biāo)準(zhǔn)，具有很高的算力，還具備高性能的網(wǎng)絡(luò)接口，能高速解析、處理數(shù)據(jù)，并高效地將數(shù)據(jù)傳輸?shù)?CPU 和 GPU 。

DPU 和 CPU 的最大不同，是 CPU 擅長(zhǎng)通用性計(jì)算任務(wù)（什么任務(wù)都能接，比較“雜”），而 DPU 更擅長(zhǎng)基礎(chǔ)層應(yīng)用任務(wù)（做特定的任務(wù)，比較“專注”），例如網(wǎng)絡(luò)協(xié)議處理，交換路由計(jì)算，加密解密，數(shù)據(jù)壓縮等“臟活累活”。

所以說(shuō)，DPU 是 CPU 的一個(gè)好幫手，將與 CPU 、 GPU 形成“鐵三角”，徹底顛覆數(shù)據(jù)中心的運(yùn)算模式。

科普：火遍全網(wǎng)的 DPU 到底是什么

這就是為什么 DPU 如今備受關(guān)注的原因。

正如本文開(kāi)頭所說(shuō)，DPU 目前的火爆程度，已經(jīng)不能用詞語(yǔ)來(lái)形容。資本對(duì)于 DPU 的熱情，更是令人印象深刻。不管是巨頭還是初創(chuàng)公司，都紛紛入局 DPU 賽道。DPU 的市場(chǎng)仍在升溫，發(fā)展前景可期。

還是以英偉達(dá)為例。繼 BlueField-2 DPU 和 BlueField-2X 之后，2021 年 4 月，NVIDIA 又發(fā)布了新一代數(shù)據(jù)處理器 —— BlueField-3 DPU 。

科普：火遍全網(wǎng)的 DPU 到底是什么

BlueField-3 DPU

這是首款為 AI 和加速計(jì)算而設(shè)計(jì)的 DPU ，針對(duì)多租戶、云原生環(huán)境進(jìn)行了優(yōu)化，提供數(shù)據(jù)中心級(jí)的軟件定義和硬件加速的網(wǎng)絡(luò)、存儲(chǔ)、安全和管理等服務(wù)。

據(jù)稱，一個(gè) BlueField-3 DPU 所提供的數(shù)據(jù)中心服務(wù)，可相當(dāng)于多達(dá) 300 個(gè) x86 核才能實(shí)現(xiàn)的服務(wù)。這就釋放了大量的 CPU 資源，用于運(yùn)行關(guān)鍵業(yè)務(wù)應(yīng)用。

要想發(fā)揮 DPU 在現(xiàn)代數(shù)據(jù)中心的核心價(jià)值，離不開(kāi)軟件的加持。換句話說(shuō)，沒(méi)有軟件的芯片，只是昂貴的沙子。

為了構(gòu)建更為強(qiáng)大的 DPU 生態(tài)，英偉達(dá)專門推出了給 BlueField DPU 量身打造的軟件開(kāi)發(fā)平臺(tái) —— NVIDIA DOCA 。

DOCA 的全稱叫 Data Center Infrastructure On A Chip Architecture ，即“線上數(shù)據(jù)中心基礎(chǔ)設(shè)施體系結(jié)構(gòu)”。借助于 DOCA ，開(kāi)發(fā)人員能夠利用行業(yè)標(biāo)準(zhǔn)的 API ，在 NVIDIA BlueField DPU 上快速創(chuàng)建網(wǎng)絡(luò)，存儲(chǔ)，安全和管理服務(wù)，以及 AI / HPC 的一系列應(yīng)用程序和服務(wù)。

在 2022 年 5 月，NVIDIA 發(fā)布了 DOCA 1.3 。該版本不僅新增了 121 個(gè) API 開(kāi)發(fā)接口，還添加了優(yōu)化數(shù)據(jù)流插入的 DOCA Flow 庫(kù)、通信通道庫(kù)（ Communication Channel ）、正則表達(dá)式庫(kù)（ Regular Expression ）和基于 OVN 的數(shù)據(jù)路徑加密等功能，更添加了 HBN （基于主機(jī)的網(wǎng)絡(luò)）等服務(wù)，深受開(kāi)發(fā)者的歡迎。

科普：火遍全網(wǎng)的 DPU 到底是什么

DOCA 1.3 的架構(gòu)

近日，NVIDIA 又發(fā)布了 DOCA 1.4 ，在不重啟主機(jī)的情況下支持 DPU 固件升級(jí)，在 BlueField-2 DPU 25G & 100G w / BMC 產(chǎn)品上支持 32GB DDR 內(nèi)存，新增對(duì) AArch64 服務(wù)器主機(jī)支持，以及基于最長(zhǎng)前綴匹配（ LPM ）管道的路由功能。

借助 DOCA 1.4 版本，開(kāi)發(fā)者可以更靈活、更簡(jiǎn)單、更快捷地在 BlueField DPU 上進(jìn)行開(kāi)發(fā)環(huán)境的搭載，從而迅速推出新產(chǎn)品。

█ 結(jié)語(yǔ)

根據(jù)預(yù)測(cè)，到 2025 年，DPU 全球市場(chǎng)容量預(yù)計(jì)將達(dá)到 120 億美金。

隨著摩爾定律逐漸進(jìn)入瓶頸，為了更高效地利用算力資源，我們需要大力發(fā)展 DPU ，讓 CPU 、 GPU 、 DPU 進(jìn)行合理分工，各自更加專注于自己擅長(zhǎng)的工作。這樣，我們才能將數(shù)據(jù)中心的能效發(fā)揮到最大，為整個(gè)社會(huì)的數(shù)字化轉(zhuǎn)型提供強(qiáng)勁且綠色的動(dòng)力。

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

科普：火遍全網(wǎng)的 DPU 到底是什么

█ 什么是 DPU

█ DPU 到底算些什么

█ DPU 的未來(lái)前景

█ 結(jié)語(yǔ)

相關(guān)文章