據(jù)南京大學(xué)人工智能學(xué)院網(wǎng)站報(bào)道,南大 LAMDA 組錢超教授團(tuán)隊(duì)在 DATE 2025 發(fā)表的芯片設(shè)計(jì)優(yōu)化論文「Timing-Driven Global Placement by Efficient Critical Path Extraction」獲會(huì)議最佳論文獎(jiǎng)。
電子設(shè)計(jì)自動(dòng)化(Electronic Design Automation,EDA)是芯片設(shè)計(jì)的基石產(chǎn)業(yè),被譽(yù)為「芯片之母」。
歐洲設(shè)計(jì)自動(dòng)化與測(cè)試會(huì)議(Design, Automation and Test in Europe Conference,DATE)是 EDA 領(lǐng)域的頂級(jí)國際學(xué)術(shù)會(huì)議。
本次 DATE 2025 最佳論文第一作者侍昀琦、第四作者林熙、第五作者薛軻分別是南京大學(xué)人工智能學(xué)院的碩士生、本科生和博士生,錢超教授為通訊作者,論文與華為諾亞方舟實(shí)驗(yàn)室合作完成。
在芯片設(shè)計(jì)領(lǐng)域,為多達(dá)百億量級(jí)晶體管設(shè)計(jì)最優(yōu)布局,一直是一個(gè)難解的技術(shù)難題。傳統(tǒng)的布局方法要么選擇快速但不夠精準(zhǔn)的網(wǎng)線加權(quán)方案,要么采用精確但運(yùn)算量巨大的路徑優(yōu)化方法。
就像在一個(gè)擁擠的城市規(guī)劃新的交通路線, 既要考慮道路長(zhǎng)度,又要確保交通暢通,面臨精度與效率、局部與整體的沖突。這個(gè)兩難困境一直困擾著芯片設(shè)計(jì)行業(yè)。
該論文提出了一種全新的時(shí)序驅(qū)動(dòng)布局方法,巧妙地將效率和精度統(tǒng)一起來:
經(jīng)典開源時(shí)序分析工具 OpenTimer 使用 O (n^2) 復(fù)雜度的算法提取 top-n 條時(shí)序違例路徑,且不支持基于違例端點(diǎn)的路徑分析。該論文針對(duì)每個(gè)違例端點(diǎn)提取其 top-n 條違例路徑,不僅能覆蓋所有時(shí)序違例端點(diǎn),還將提取 n 條違例路徑的復(fù)雜度降至 O (n),在時(shí)序分析中能夠?qū)崿F(xiàn) 6 倍加速。這個(gè)創(chuàng)新方法的核心在于「智能關(guān)鍵路徑提取」技術(shù),它能夠快速定位需要優(yōu)化的關(guān)鍵路徑,將分析速度提升了 6 倍。
傳統(tǒng)的基于線網(wǎng)的加權(quán)方案對(duì)于高扇出線網(wǎng)經(jīng)常帶來不必要的權(quán)重,從而過度優(yōu)化許多不涉及時(shí)序違例的路徑。論文提出了基于引腳間吸引力的精確指標(biāo),通過精確捕捉時(shí)序違例路徑上的引腳對(duì)來建模時(shí)序信息,在顯著提升時(shí)序指標(biāo)的同時(shí),幾乎不造成整體線長(zhǎng)的損失。
常用的時(shí)序模型 RC Delay Model 中,線網(wǎng)延時(shí)與其長(zhǎng)度的平方成正比。論文首次提出將引腳間歐式距離的平方作為損失函數(shù),并在 GPU 上實(shí)現(xiàn)了前向、反向傳播的加速。較以往常用損失函數(shù),在關(guān)鍵時(shí)序指標(biāo) TNS 和 WNS 上分別提升 50% 和 30%。
針對(duì)芯片宏元件布局問題,該團(tuán)隊(duì)在 NeurIPS’23 發(fā)表的工作「Macro Placement by Wire-Mask-Guided Black-Box Optimization」較 Google 在 Nature’21 提出方法的布線長(zhǎng)度縮短 80% 以上,并獲得 ACM SIGEVO Human-Competitive Results 獎(jiǎng);
針對(duì)芯片全局布局問題,該團(tuán)隊(duì)在 DAC’24 發(fā)表的 Poster 工作「Escaping Local Optima in Global Placement」通過變異算子緩解了當(dāng)前解析式布局器易于陷入局部最優(yōu)的問題,進(jìn)一步提升芯片布線長(zhǎng)度指標(biāo) 15%;
針對(duì)芯片宏元件布局問題,該團(tuán)隊(duì)在 NeurIPS’24 發(fā)表的工作「Reinforcement Learning Policy as Macro Regulator Rather than Macro Placer」提出了新的基于強(qiáng)化學(xué)習(xí)的問題建模,通過訓(xùn)練策略對(duì)已有布局進(jìn)行高效微調(diào)而不是從頭擺放,保證了宏元件布局的貼邊和規(guī)整,在時(shí)序和擁塞等指標(biāo)上均取得了一致的顯著提升;
針對(duì)芯片宏元件布局問題,該團(tuán)隊(duì)在 DAC’25 發(fā)表的工作「ReMaP: Macro Placement by Recursively Prototyping and Periphery-Guided Relocating」將大量專家知識(shí)引入算法,優(yōu)化了宏元件和標(biāo)準(zhǔn)元件的數(shù)據(jù)流,更加符合工業(yè)界的實(shí)際需求,較當(dāng)前最先進(jìn)的開源 EDA 工具 OpenROAD 的方法,提升芯片最終時(shí)序指標(biāo)超 65%;
若干技術(shù)在華為海思落地驗(yàn)證,包括攻克華為「揭榜掛帥」難題「EDA 專題難題:超高維空間多目標(biāo)黑盒優(yōu)化技術(shù)」,將芯片寄存器尋優(yōu)效率平均提升 22.14 倍等。
https://ai.nju.edu.cn/5d/02/c17806a744706/page.htm
論文在 ICCAD-2015 競(jìng)賽數(shù)據(jù)集上進(jìn)行了廣泛的對(duì)比,相較于最先進(jìn)的開源布局算法 DREAMPlace 4.0 做到了全部 8 個(gè)芯片的顯著領(lǐng)先,特別是在 TNS 指標(biāo)上達(dá)到 60% 的平均提升。
相較于 SOTA 方法 Differentiable-TDP 和 Distribution-TDP 算法分別達(dá)到 50% 和 40.5% 的 TNS 平均提升。
審稿人高度評(píng)價(jià)該工作,稱「結(jié)果令人印象非常深刻,超過了所有先進(jìn)工作」(「The results are very impressive, outperforming all state-of-the-art works」),取得顯著提升(「significant improvements」)。
DATE 自 1994 年創(chuàng)辦以來已舉辦 31 屆,今年將于 3 月 31 日至 4 月 2 日在法國里昂召開。DATE 今年收到逾 1200 篇投稿,錄用率約 25%,共評(píng)選出 4 篇最佳論文獎(jiǎng)(獲獎(jiǎng)率僅 0.3%)。
近期,AI 技術(shù)在芯片設(shè)計(jì)中的應(yīng)用受到了國際上高度關(guān)注。Google 在 Nature 提出 AlphaChip,應(yīng)用于 TPU 設(shè)計(jì),而多家 EDA 頭部廠商也推出了 AI 賦能的 EDA 產(chǎn)品。芯片設(shè)計(jì)流程冗長(zhǎng)復(fù)雜,存在大量復(fù)雜優(yōu)化問題。
作為人工智能的重要研究分支,演化算法受達(dá)爾文進(jìn)化論啟發(fā),通過模擬「交叉變異」和「自然選擇」行為,可用于求解機(jī)器學(xué)習(xí)中復(fù)雜優(yōu)化問題,但這類算法幾乎純粹是「啟發(fā)式」:在不少情況下有效, 但為何奏效、在何種條件下奏效卻并不清楚。
LAMDA 組周志華教授帶領(lǐng)俞揚(yáng)教授和錢超教授長(zhǎng)期努力,希望能夠建立起相應(yīng)理論基礎(chǔ),并對(duì)算法設(shè)計(jì)給出指導(dǎo);2019 年他們?cè)?Springer 出版專著《Evolutionary Learning: Advances in Theories and Algorithms》,總結(jié)了他們?cè)谠摲较蛏线^去二十年的主要工作,并于 2021 年出版中文版《演化學(xué)習(xí):理論與算法進(jìn)展》。
基于這些長(zhǎng)期理論研究,LAMDA 組近期針對(duì)芯片設(shè)計(jì)中的復(fù)雜優(yōu)化問題設(shè)計(jì)出了多個(gè)原創(chuàng)領(lǐng)先算法,如:
LAMDA 組目前與華為正在進(jìn)一步合作攻關(guān),希望通過先進(jìn)芯片設(shè)計(jì)緩解當(dāng)前先進(jìn)制造工藝局限。
參考資料:
本文來自微信公眾號(hào):新智元(ID:AI_era),原標(biāo)題《南大錢超團(tuán)隊(duì)攻克百億晶體管難題,斬獲 EDA 頂會(huì) 2025 最佳論文!AI 學(xué)院本碩博生聯(lián)手》
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。