今天這篇,小棗君和大家聊聊骨干網(wǎng)光通信的一些最新技術(shù)動向。
█ 400G,真的來了
大家也許都有所耳聞,從去年開始,國內(nèi)運(yùn)營商骨干網(wǎng)已經(jīng)全面拉開了 400G 商用的帷幕。
先是 2023 年大量的商用驗證,然后是集采的全面啟動。2024 年,是規(guī)模商用的正式落地。
不久前,2024 年 3 月,中國移動開通了全球首條 400G 全光省際(北京-內(nèi)蒙古)干線,被視為一個重要的標(biāo)志事件。
骨干網(wǎng)升級 400G 的原因,是顯而易見的。
一方面,居民數(shù)字生活(高清視頻、遠(yuǎn)程會議、在線直播、在線游戲等)所帶來的消費互聯(lián)網(wǎng)流量增長,仍在持續(xù)。
另一方面,全行業(yè)都在推動數(shù)字化轉(zhuǎn)型,來自行業(yè)數(shù)字化系統(tǒng)的流量激增,加劇了骨干網(wǎng)的壓力。
骨干網(wǎng)壓力陡增,還有一個關(guān)鍵的原因 ——AI 大爆發(fā)。
AIGC 大模型崛起之后,引發(fā)了一股 AI 浪潮。為了滿足 AI 業(yè)務(wù)的需求,需要建設(shè)大量的智算中心。模型從千億參數(shù)向萬億參數(shù)發(fā)展,GPU 算力集群也從千卡集群走向萬卡集群甚至十萬卡集群。
小棗君在以前的文章中介紹過,GPU 算力集群其實就是海量的 GPU 卡(GPU 服務(wù)器)通過高性能網(wǎng)絡(luò)(例如 InfiniBand、RoCEv2)連接在一起的一個陣列。它對網(wǎng)絡(luò)性能和可靠性的要求極高,直接影響到訓(xùn)練效率和成本。
僅從 GPU 服務(wù)器的網(wǎng)絡(luò)端口速率來說,就已經(jīng)從單口 400G 起步,甚至要用到 800G 或更高。
以前,GPU 算力集群屬于 DCN(數(shù)據(jù)中心內(nèi)部網(wǎng)絡(luò))的范疇。現(xiàn)在,隨著集群規(guī)模不斷擴(kuò)大,已經(jīng)開始考慮將分布式智算中心應(yīng)用于模型訓(xùn)練。
也就是說,將異地的幾個智算中心,一起用來進(jìn)行訓(xùn)練。
這就對 DCI(數(shù)據(jù)中心互聯(lián)網(wǎng)絡(luò))提出了更高要求,光通信骨干網(wǎng)必須在技術(shù)性能上能夠滿足這一需求。
我們國家在算力上的戰(zhàn)略,還是秉承了“全國統(tǒng)籌、整體布局”的思路。從 2022 年 2 月開始,我國啟動了東數(shù)西算工程,打造全國一體化算力體系。
簡單來說,一方面,我們要建設(shè)大量的數(shù)據(jù)中心(相當(dāng)于電廠),另一方面,也要建設(shè)粗壯的骨干傳輸網(wǎng)絡(luò)(相當(dāng)于輸電網(wǎng)),把這些算力給“流通”起來,滿足各行各業(yè)的需求。
█ 400G,是如何做到的?
當(dāng)前的光通信骨干網(wǎng),作為整個數(shù)字社會底座的光通信網(wǎng)絡(luò),必須具備超大帶寬(400G,將來 800G 甚至 1.6T)、超低時延(多級時延圈)、超大規(guī)模組網(wǎng)(服務(wù)于分布式計算,以及剛才說的 AI 集群)、超高穩(wěn)定性、超高可靠性、超高安全性、超靈活部署、智能運(yùn)維管控等多方面特性。
今天,主要說說最重要的速率帶寬。
光通信技術(shù)發(fā)展到現(xiàn)在,想要實現(xiàn)速率的提升,無非就是在以下幾個方面做文章:
首先,是波特率。
傳輸速率,是比特率,是單位時間傳送的比特個數(shù),單位是 bit / s。
比特率 = 波特率 × 單個調(diào)制狀態(tài)對應(yīng)的二進(jìn)制位數(shù)。
波特率是單位時間內(nèi)傳送的碼元符號(Symbol)的個數(shù)。波特率越高,每秒傳輸?shù)姆栐蕉?,?dāng)然信息量就越大,速率就上來了。
波特率由光器件的能力決定。器件芯片制程越先進(jìn),波特率越高,速率(比特率)就越高。
目前,CMOS 工藝從 16nm 提高到 7nm 和 5nm,波特率也逐漸從 30+Gbaud 提高到 64+Gbaud、90+Gbaud、128+Gbaud。
現(xiàn)在的 400G 能夠商用,就是得益于波特率能夠達(dá)到 128Gbaud。
再看看調(diào)制方式。
剛才那個公式,里面的“單個調(diào)制狀態(tài)對應(yīng)的二進(jìn)制位數(shù)”,就是調(diào)制方式?jīng)Q定的。
400G 技術(shù)的調(diào)制方案,目前主要有 16QAM、16QAM-PCS(PCS 是概率整形技術(shù),下次專門介紹)和 QPSK 三種,適用于不同的應(yīng)用場景。
光通信和無線通信不太一樣,不會一味追求高階調(diào)制。
調(diào)制階數(shù)越低,對線路的要求越低,建網(wǎng)成本也越低。所以,長途骨干網(wǎng)早期設(shè)計階段的時候,基本上聚焦于 16QAM 和 QPSK。后來有了 16QAM-PCS,也加入了競爭。
以前沒提“東數(shù)西算”、運(yùn)營商們都認(rèn)為 400G 不會需要太長距離的傳輸,所以,采用技術(shù)更成熟、價格更低的低波特率器件,配合調(diào)制階數(shù)較高的 16QAM,是行業(yè)的主流意見。
后來,一方面因為傳輸距離的要求增加,從 1000 多 km 變成幾千 km,再一個,128GBaud 波特率器件迅速成熟(在 DCN 場景,800G 迅速崛起,對產(chǎn)業(yè)鏈產(chǎn)生刺激和推動),為 QPSK 脫穎而出創(chuàng)造了條件。
QPSK 對非線性的耐受能力更高,相比 16QAM-PCS 可以適當(dāng)提高入纖功率。其次,QPSK 的背靠背 OSNR 門限相比 16QAM-PCS 有優(yōu)化。再有,設(shè)置 QPSK 的通道間隔為 150GHz,使得在傳輸過程中幾乎沒有濾波代價。
這些優(yōu)勢,都使得 QPSK 逐漸成為行業(yè)在骨干網(wǎng)和 DCI 的一致首選。
現(xiàn)在,前兩種方案,被考慮的應(yīng)用場景更多是城域或省干。
第三,是擴(kuò)展波段。
波特率和調(diào)制主要影響的是單波速率。一根光纖,是可以有多個波的,只要頻譜范圍足夠大,就可以了。
單波帶寬 × 單纖波數(shù) = 單纖帶寬。
前面表格寫了,QPSK 400G 的通道間隔達(dá)到 150GHz。傳統(tǒng)的 C 波段和擴(kuò)展 C 波段都不足以滿足頻譜帶寬的需求。
于是,現(xiàn)在逐漸采用了 C6T+L6T 的方式,一共是 12THz 的頻譜帶寬。計算一下,80 個波,單波 400G,一起就是單纖 32T 容量。如果犧牲一點距離,用在省干的話,部署 QPSK 或 16QAM-PCS,容量還能再大些,達(dá)到 48T。
關(guān)于波段的詳細(xì)介紹,可以看這里:光通信到底有哪些波段?
擴(kuò)展波段的最大問題,在于器件是否能夠支持,且成本是否可控。這里所說的器件,包括 ITLA、CDM、ICR、EDFA 及 WSS 等,涉及到光的收發(fā)和光路交換、放大等。
波段擴(kuò)展的話,還涉及到一個問題,那就是整合。
現(xiàn)在的波段擴(kuò)展,其實更像是兩套系統(tǒng)(C 和 L)的簡單綁定。兩套系統(tǒng)獨立運(yùn)作,通過合波的方式,進(jìn)行傳輸,然后到了對端,再進(jìn)行分波,各自繼續(xù)處理。
兩套系統(tǒng)的話,體積會更大,功耗會更高,設(shè)計也更復(fù)雜。所以,行業(yè)需要研究,怎么進(jìn)行器件整合,真正讓一套系統(tǒng),同時支持不同的擴(kuò)展波段。也就是實現(xiàn)真正的一體化。
光纖通信,除了光模塊和光設(shè)備,還需要關(guān)注光纖。
現(xiàn)在的主流光纖是 G.652D 光纖。400G QPSK,在 G.652D 上,借助 EDFA 放大,也能傳輸 1500km。
行業(yè)經(jīng)過多年的驗證,已經(jīng)認(rèn)定,G.654E 光纖是新的繼任者。如果用性能更好的 G.654E,同等條件下,400G QPSK 的傳輸距離,可以增加 30% 以上。
G.654E 光纖已經(jīng)具備規(guī)?;a(chǎn)的能力,將在長途干線上進(jìn)行大規(guī)模部署。G.654 系列的一些低損耗光纖,也成為海纜系統(tǒng)跨洋超長距離傳輸?shù)氖走x。
除了傳統(tǒng)光纖之外。行業(yè)還認(rèn)為,多芯光纖和空心光纖擁有廣闊的應(yīng)用前景。
多芯光纖是一種空分復(fù)用,在一個光纖里,塞入更多的纖芯,采用少模,可以大幅提升光纖的容量。
空心光纖就更牛逼了,直接把光纖做成空心,用空氣取代玻璃纖芯。
空心光纖被證明可以帶來更大的容量、更低的時延,更小的傳輸損耗,以及超低非線性,被行業(yè)一致認(rèn)為是光通信里最具潛力的技術(shù)之一。
█ 400G 的下一步,800G or 1.6T?
400G 正式規(guī)模商用之后,整個行業(yè)的目光將會放在 400G 以上(beyond 400G)的技術(shù)標(biāo)準(zhǔn)體系上。
對于接下來是搞 800G、1.2T 還是 1.6T,行業(yè)還在加緊論證。
如果想要實現(xiàn)更高的速率,就必須在“調(diào)制方式 + 波特率”上繼續(xù)做文章。130GBd,或者更高的 260GBd,是必然方向。更高波特率,意味著相關(guān)器件必須跟上,形成成熟的產(chǎn)業(yè)鏈。
超過 400G,不能再指望 QPSK 了。16QAM 調(diào)制,是行業(yè)目前普遍認(rèn)可的選項。
波段也需要進(jìn)一步擴(kuò)展。在擴(kuò)展 C 和 L 的基礎(chǔ)上,考慮往 S 波段、U 波段、E 波段等進(jìn)行擴(kuò)展。如果是 C+L+S,那就是 12T+5T,達(dá)到 17THz 的頻寬。
多方面因素相疊加,單根光纖單個方向傳輸速率超過 100Tbps,指日可待。
在數(shù)據(jù)中心內(nèi)部,800G(基于 100GBd 以上波特率,單通道 100G)已經(jīng)商用了。單通道 200G、400G、800G,只是時間有早有晚。在這方面,國外的進(jìn)度更快一些。
隨著容量的不斷提升,帶來的技術(shù)挑戰(zhàn)也不斷增加。光通信的發(fā)展,說白了,依賴于器件、芯片、制程、材料。
想要滿足前面提到的功耗、安全、運(yùn)維等方面的要求,還依賴于工藝、架構(gòu)、封裝、人工智能、數(shù)字孿生等一系列的創(chuàng)新。產(chǎn)業(yè)鏈上下游需要做的工作,還有很多。未來的路,還很長。
█ 最后的話
光通信是整個社會的數(shù)字動脈。這些年,人們對很多技術(shù)(包括 5G)都提出過質(zhì)疑,但沒有人會對光通信提出質(zhì)疑,因為它是社會發(fā)展的剛需。
人類數(shù)據(jù)流量不斷增加的趨勢,在未來幾十年都是不會變的。人工智能技術(shù)的高速崛起,會將這個趨勢進(jìn)一步放大。
光通信目前的發(fā)展,是無法滿足需求的。這意味著,企業(yè)會有更大的動力,投入資源進(jìn)行研發(fā),以獲得利潤。
希望光通信產(chǎn)業(yè)能進(jìn)一步爆發(fā),為數(shù)智社會發(fā)展鋪平道路。
參考文獻(xiàn):
1、《AI 時代高速光傳輸關(guān)鍵技術(shù)、應(yīng)用進(jìn)展及未來展望》,信通院技術(shù)與標(biāo)準(zhǔn)研究所,張海懿;
2、《算力網(wǎng)絡(luò)開啟 400G 全光新時代》,中國移動研究院,段曉東;
3、《AI 時代的 400G 全光算力互聯(lián)網(wǎng)》,中國聯(lián)通研究院,唐雄燕。
本文來自微信公眾號:鮮棗課堂 (ID:xzclasscom),作者:小棗君
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。