設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

回歸 Pascal:英偉達(dá) RTX 50 顯卡全部 CUDA 核心支持 FP32 / INT32 雙功能

2025/2/1 13:27:28 來源:IT之家 作者:溯波(實習(xí)) 責(zé)編:溯波

IT之家 2 月 1 日消息,英偉達(dá)現(xiàn)已公布 Blackwell GPU 架構(gòu)白皮書,披露了 GeForce RTX 50 系列顯卡的大量技術(shù)細(xì)節(jié),其中相當(dāng)值得注意的一點是 Blackwell 架構(gòu)的全部單精度 CUDA 核心同時支持 FP32 / INT32 數(shù)據(jù),這點上回歸了九年前的 Pascal 架構(gòu)。

▲ Blackwell 架構(gòu) SM 設(shè)計

▲ Pascal 架構(gòu) SM 設(shè)計

英偉達(dá)在 GeForce 10 "Pascal" 世代仍采用單精度 CUDA 單元兼顧 FP32 / INT32 的設(shè)計,而在 Volta 和 Turing 兩代上換用了兩組 1:1 比例的 CUDA 核心分別承擔(dān) INT32 和 FP32 的方案

▲ Volta(左)、Turing(右)兩代架構(gòu) SM 設(shè)計

來到 Ampere 架構(gòu),英偉達(dá)則為每個 SM 流式處理器的四個處理塊(IT之家注:Processing Block)之一提供了 1 組 16 個 FP32 / INT32 單元和 1 組 16 個純 FP32 單元;而在 Ada GPU 上,這一設(shè)計得到延續(xù)。

▲ Ampere(左)、Ada(右)兩代架構(gòu) SM 設(shè)計

Blackwell 架構(gòu)上的統(tǒng)一 CUDA 使得每 SM 可能的 INT32 整數(shù)運算能力較 Ada 翻倍。不過在任何給定的時鐘周期內(nèi),Blackwell 統(tǒng)一內(nèi)核只能以 FP32 或 INT32 模式中的一種運行。

英偉達(dá)提到,Ada 架構(gòu) SM 是為標(biāo)準(zhǔn)著色器設(shè)計和優(yōu)化的,而 Blackwell SM 則是為神經(jīng)著色器設(shè)計和優(yōu)化的。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:英偉達(dá),RTX50Blackwell,顯卡

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知