IT之家 7 月 25 日消息,英特爾今日發(fā)布了全新的高級性能擴展指令集 (APX),并介紹了即將為 P 核和 E 核提供統(tǒng)一 AVX-512 支持的新型 AVX10 指令集。
簡單來說,AVX10(Advanced Vector Extensions 10)ISA 是 AVX-512 的超集,并具有 256bit 和 512bit 寄存器大小的所有 AVX-512 ISA 功能。
IT之家提醒,這種新的指令集暫時沒有英特爾 CPU 支持 —— 它預(yù)計將在未來的芯片中出現(xiàn),包括“Granite Rapids”。英特爾表示,AVX10 將成為其面向未來消費者和服務(wù)器處理器的矢量 ISA 選擇。
從最基本的層面來看,AVX10 將使同時具有 E 核和 P 核的英特爾芯片支持 AVX-512,盡管 512bit 版本只能在 P 核上運行,不過 256bit 的 AVX-256 模擬指令集可以同時在 P 核和 E 核上運行。
據(jù)介紹,AVX10 將包括“帶有 AVX512VL 功能標志的 AVX-512 矢量指令、最大矢量寄存器長度為 256bit 以及八個 32bit 掩碼寄存器,以及支持嵌入式舍入的新 256bit 指令”。
這個版本可以在 P 核和 E 核上運行,但 E 核限制為最大 256bit 長度,而 P 核可以使用完整的 512bit 矢量,這一點類似于 Arm 通過 SVE 對可變矢量寬度的支持。
英特爾表示,現(xiàn)有應(yīng)用程序在 AVX10 上的性能與 AVX-512 相同,至少在相同的矢量長度上。英特爾還聲稱:
英特爾 AVX2 編譯的應(yīng)用程序重新編譯為 AVX10 后無需額外軟件調(diào)整即可實現(xiàn)性能提升。
得益于新增的 16 個矢量寄存器和新指令,對于矢量寄存器壓力敏感的英特爾 AVX2 應(yīng)用程序可獲得大幅性能提升。
高度線程化的可矢量化應(yīng)用程序在使用基于 Intel Xeon E 內(nèi)核的處理器或具有混合架構(gòu)的 Intel 產(chǎn)品時,可能實現(xiàn)更高的總吞吐量。
后續(xù),英特爾將為消費級客戶提供 Meteor Lake,為 HPC 客戶提供 Granite Rapids 和 Sierra Forest,而這三個系列均采用類似的架構(gòu),其 P 核為 Redwood Cove 核,E 核則基于 Crestmont 架構(gòu)。
據(jù)悉,英特爾將從第六代 Xeon“Granite Rapids”芯片開始支持 AVX10 首個版本(AVX10.1),但該版本只支持 512bit 矢量指令,而不是新的 256bit 矢量指令。
也就是說,這一代只是作為從 AVX-512 到 AVX10 的過渡芯片。不過,未來所有的 Xeon 處理器本身就會繼續(xù)支持完整的 AVX-512 指令,以確保傳統(tǒng)應(yīng)用正常運行。
后續(xù)的 AVX10.2 將支持 256bit 矢量長度和其他新功能,如新的 AI 數(shù)據(jù)類型和轉(zhuǎn)換、數(shù)據(jù)移動優(yōu)化和標準支持。
為了解決開發(fā)者的擔(dān)憂,英特爾還計劃為 AVX10 實現(xiàn)與 AVX-512 相比大大簡化的枚舉方式,并確保每次轉(zhuǎn)向新修訂版時都有足夠的新指令和功能值得升級變,從而減少版本和枚舉膨脹。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。