在 CES 2025 大展上,英偉達(dá)推出了基于 Blackwell 架構(gòu)的 GeForce RTX 50 系列游戲顯卡。IT 之家已經(jīng)拿到了技嘉 GeForce RTX 5080 GAMING OC 16G。這款顯卡采用了全新一代的 Blackwell 架構(gòu),配備了 GDDR7 256Bit 顯存,容量高達(dá) 16GB,支持 DLSS 4 技術(shù),能在很大程度上提升游戲幀率。另外,其配備的風(fēng)之力散熱系統(tǒng)相比于公版解熱性能更好,可以充分發(fā)揮 RTX 5080 的全部實力。
為了釋放技嘉 RTX 5080 魔鷹的全部性能,本次測試平臺具體配置如下:
一、外觀設(shè)計
技嘉 GeForce RTX 5080 GAMING OC 16G 采用全黑設(shè)計,其風(fēng)之力散熱系統(tǒng)擁有三枚大尺寸的仿生散熱風(fēng)扇。其設(shè)計靈感來源于鷹的翅膀,形態(tài)更加符合空氣動力學(xué),有效降低了風(fēng)阻和噪音,在低噪音表現(xiàn)的同時,可將風(fēng)壓提升高達(dá) 53.6%,風(fēng)量提升 12.5%。
技嘉魔鷹 RTX 5080 背部采用大面積鏤空設(shè)計,透過格柵可以看到風(fēng)之力散熱系統(tǒng)大面積的散熱鰭片,背部黑色的線條涂裝也使得顯卡透露著滿滿的黑科技。
體積方面經(jīng)過IT之家實測,技嘉魔鷹 RTX 5080 顯卡的三圍分別是 330*128*69mm(不含金手指與擋片),裸卡重量約 1.84kg。
技嘉魔鷹 RTX 5080 的右側(cè)預(yù)留的顯卡安裝支架的三個孔位,安裝時用兩個即可固定住顯卡。
技嘉魔鷹 RTX 5080 的頂部為大面積散熱鰭片,左側(cè)印有 GEFORCE RTX LOGO 右側(cè)則是支持滑動的 GIGABYTE 的 LOGO,可透過 RGB 燈條發(fā)光。
技嘉魔鷹 RTX 5080 的供電接口具備指示燈提示功能,若是指示燈熄滅就是電源線連接正常狀態(tài),若是亮起則是電源線未連接,若是閃爍則是電源異常。這樣設(shè)計的好處是可以避免電源連接不良或是忘記接電源的造成顯卡故障。
技嘉魔鷹 RTX 5080 除了一根轉(zhuǎn) 3*8pin 電源轉(zhuǎn)接線外,還附送了顯卡支架,支架支撐部分有兩種尺寸可以安裝,以適配不同的機箱。
技嘉 GeForce RTX 5080 GAMING OC 16G 的 I/O 金屬擋板上,配備了 3 個 DP2.1b 接口和 1 個 HDMI2.1b 接口,支持最高 8K / 165Hz 輸出。
二、技術(shù)解析
NVIDIA GeForce RTX 5080 搭載了全新的 Blackwell 架構(gòu),其在游戲性能與 AI 性能方面均有大幅提升。英偉達(dá)認(rèn)為當(dāng)下人們對畫面質(zhì)量的追求,其所需的運算性能已遠(yuǎn)超摩爾定律所能提供的范疇。在此情形下,引入神經(jīng)網(wǎng)絡(luò)渲染技術(shù)以提高幀率才能滿足人們對于畫質(zhì)與幀率的高需求。
得益于神經(jīng)網(wǎng)絡(luò)渲染的融入,Blackwell 的多單元流處理器(SM)實現(xiàn)了處理吞吐量的提升,并且與 Tensor Core 的結(jié)合更為緊密,這一優(yōu)化有效提升了神經(jīng)網(wǎng)絡(luò)著色器的性能表現(xiàn)。
為確保下一代 DLSS 多幀生成技術(shù)下幀率的穩(wěn)定性,Blackwell 架構(gòu)特別配備了基于硬件的 Flip Metering。這一技術(shù)將幀率邏輯轉(zhuǎn)移至顯示引擎內(nèi),使 GPU 能夠更精準(zhǔn)地把控顯示時間。不僅如此,顯示引擎的像素處理能力也得到了翻倍增強,從而能夠更好地支持更高的分辨率與刷新率,充分釋放 DLSS 4 的性能潛力。
第五代 Tensor Core 支持 FP4 浮點運算精度,這種低量化方法類似文件壓縮,能減少模型推理的數(shù)據(jù)存儲與計算量,提升計算效率,顯存使用不到 FP16 的一半,卻可讓 GPU 性能提升 2 倍。
RT Core 提升了光線、路徑與三角形相交的檢測效能,能對大量幾何圖形細(xì)節(jié)光線追蹤。在新一代 Blackwell 架構(gòu)下,檢測效率是上一代的 2 倍、初代 Turing 架構(gòu)的 8 倍,還通過增強壓縮減少 25% 內(nèi)存占用,大幅提升光線追蹤細(xì)節(jié)。
Blackwell 架構(gòu) GPU 搭載 GDDR7 顯存,采用 PAM3 信號編碼機制,與 GDDR6、GDDR6X 不同,每兩周期傳輸 3 位數(shù)據(jù),更省電且?guī)捥嵘?,速度達(dá) 30Gbps。
具體到產(chǎn)品規(guī)格上,技嘉 GeForce RTX 5080 GAMING OC 16G 基于最新一代 GB200-400-A1 核心和 TSMC 4N 架構(gòu)制程工藝打造,內(nèi)有 10752 個 CUDA 核心、336 個 Tensor 核心、84 個光追核心、336 個紋理單元、128 個 ROP 單元,核心規(guī)模相比 RTX 4080 提升約為 10.5%,單元內(nèi)的 SM 和 TPC 群組數(shù)量也均有增加。GeForce RTX 5080 的核心頻率范圍是 2.3Hz-2.62GHz。顯存方面升級為 256-bit 16GB GDDR7,帶寬來到了 960GB/s。TGP 功耗為 360W,相比上代 RTX 4080 增加了 40W。
三、理論跑分
作為一款高端顯卡,GeForce RTX 5080 有著怎么的性能與性能釋放呢?接下來就進(jìn)入理論測試環(huán)節(jié)。先看烤機,單烤甜甜圈 10 分鐘,GPU 的核心溫度穩(wěn)定在 63.5℃左右,要比公版的 73.4°C 低很多,顯卡頻率 2600MHz,整張顯卡的功率在 360W 左右,與英偉達(dá)官方的 TGP 保持一致。搭配 i7 / i9 或銳龍 7、銳龍 9 這樣的高端處理器,1000W 的電源足矣。
在 3DMark Time Spy DX12 測試中,技嘉 GeForce RTX 5080 GAMING OC 16G 分?jǐn)?shù)達(dá)到了 33159 分,比公版的 32022 要高出一千多分。作為對比 GeForce RTX 4080s 公版的分?jǐn)?shù)為 29220 分,提升約為 13%,提升幅度較大。
而在 3D Mark Time Spy Extreme DX12 測試中,技嘉 GeForce RTX 5080 GAMING OC 16G 分?jǐn)?shù)達(dá)到了 16448 分,作為對比 RTX 4080s 公版的分?jǐn)?shù)為 14541 分,提升幅度同樣為 13%。
在 3DMark Portal Royal 實時光追測試中,技嘉 GeForce RTX 5080 GAMING OC 16G 的綜合分為 22587 分,作為對比 RTX 5080 公版為 22060 分,RTX 4080s 公版的分?jǐn)?shù)為 18439 分,提升幅度達(dá)到了 22%。
通過 3D Mark 一系列的顯卡測試項目跑分不難發(fā)現(xiàn),技嘉 GeForce RTX 5080 GAMING OC 16G 的圖形性能相比公版 RTX 5080 有略微提升,相比 RTX 4080s 各項測試有著 13%-22% 左右的提升幅度。
四、游戲?qū)崪y
這次的游戲?qū)崪y稍微有點不同,雖然 NVIDIA 官方宣稱首批支持 DLSS 4 的游戲高達(dá) 75 款,不過目前要想在游戲中順利開啟 DLSS 4 相關(guān)選項還需要通過 Steam 的測試版通道激活,所以多數(shù)主流游戲我們依舊測試的是 DLSS 3 和幀生成的表現(xiàn),并在最后以《賽博朋克:2077》這款游戲單獨為大家呈現(xiàn) DLSS 4 技術(shù)的實際表現(xiàn)。
1、《CS2》
首先是《CS2》,這款游戲相較于《CS:GO》性能壓力大了不少,不過即便如此技嘉 GeForce RTX 5080 GAMING OC 16G 依舊在 4K 分辨率 + 高畫質(zhì)下跑出了 298 分的游戲平均幀數(shù),1% Low 幀也有 137.6 幀。
而在 2K 分辨率 + 高畫質(zhì)下則跑到了平均 490.8 幀的游戲幀數(shù),1% Low 幀提升到 235.8 幀,完全不會影響游戲發(fā)揮。
2、《永劫無間》
競技游戲我們選擇測試的是《永劫無間》和《漫威爭鋒》,《永劫無間》目前支持了 DLSS 和幀生成技術(shù),我們打開 DLSS 選項前后 4K 與 2K 的幀率表現(xiàn)。在 4K 分辨率 + 高畫質(zhì) + DLSS 質(zhì)量檔 + 幀生成 / 低延遲下,游戲平均幀數(shù) 148 幀,1% Low 幀 100 幀,游戲平均延遲 28ms;
在 2K 分辨率 + 高畫質(zhì) + DLSS 質(zhì)量檔 + 幀生成 / 低延遲下,游戲平均幀數(shù) 217 幀,游戲平均延遲 20ms;
3、《無限暖暖》
接下來是兩款端游,首先是“優(yōu)化出色”的《無限暖暖》,這款游戲開啟光追后對硬件資源的開銷非常大,完全不輸 3A 大作。
在 4K 分辨率 + 極致畫質(zhì) + 上采樣抗鋸齒下,游戲平均幀數(shù)為 114 幀,1% Low 幀 92 幀;
在 4K 分辨率 + 極致畫質(zhì) + DLSS 抗鋸齒下,游戲平均幀數(shù)為 107 幀,1% Low 幀 80 幀;
整體接近于上一代卡皇 RTX 4090 的游戲幀數(shù),游戲明顯更加流暢,操作也更加跟手了。
在 2K 分辨率 + 極致畫質(zhì) + 上采樣抗鋸齒下,游戲平均幀數(shù)為 159 幀,1% Low 幀 143 幀;
在 2K 分辨率 + 極致畫質(zhì) + DLSS 抗鋸齒下,游戲平均幀數(shù)為 155 幀,1% Low 幀 95 幀;
4、《古墓麗影:暗影》
傳統(tǒng)光柵單機游戲可以考察一下 RTX 5080 在非光追和 DLSS 時的性能表現(xiàn):
在 4K 分辨率 + 最高畫質(zhì)下,游戲平均幀數(shù)為 152 幀;
在 2K 分辨率 + 最高畫質(zhì)下,游戲平均幀數(shù)為 279 幀;
5、《極限競速:地平線 5》
《極限競速:地平線 5》有著較為出色的優(yōu)化:
在 4K 分辨率 + 極端畫質(zhì)下,游戲平均幀數(shù)為 157 幀,1% Low 幀 129 幀;
在 2K 分辨率 + 極端畫質(zhì)下,游戲平均幀數(shù)為 212 幀,1% Low 幀 149 幀;
相比公版 RTX 4080s,4K 和 2K 分辨率下的游戲平均幀數(shù)提升分別達(dá)到了 23% 和 42%。
6、《孤島驚魂 6》
接下來就是光追游戲了,首先是《孤島驚魂 6》,它對 CPU 的單核性能要求也很高,支持光追和 DLSS。經(jīng)過實測:
在 4K 分辨率 + 極高畫質(zhì)下,游戲平均幀數(shù)為 135 幀,1% Low 幀 121 幀;
在 4K 分辨率 + 極高畫質(zhì) + 開啟光追 + DLSS 質(zhì)量下,游戲平均幀數(shù)為 118 幀,1% Low 幀 105 幀;
在 2K 分辨率 + 極高畫質(zhì)下,游戲平均幀數(shù)為 209 幀,1% Low 幀 191 幀;
在 2K 分辨率 + 極高畫質(zhì) + 開啟光追 + DLSS 質(zhì)量下,游戲平均幀數(shù)為 181 幀,1% Low 幀 164 幀;
7、《黑神話:悟空》
在測試?yán)@不開的“眾生平等”之作《黑神話:悟空》中:
4K 分辨率 + 影視級畫質(zhì) + 30% 超采樣分辨率 + 高全景光追,游戲平均幀數(shù)為 83 幀;
4K 分辨率 + 影視級畫質(zhì) + 30% 超采樣分辨率 + 高全景光追 + 幀生成下,游戲平均幀數(shù)為 126 幀;
可以看到在 RTX 5080 的加持下,4K 分辨率 + 影視級畫質(zhì)的黑猴也能達(dá)到 120 幀以上的游戲平均幀數(shù),體驗提升巨大。
而切換到 2K 分辨率后:
在 2K 分辨率 + 影視級畫質(zhì) + 30% 超采樣分辨率下,游戲平均幀數(shù)為 110 幀;
在 2K 分辨率 + 影視級畫質(zhì) + 30% 超采樣分辨率 + 高全景光追 + 幀生成下,游戲平均幀數(shù)為 160 幀;
8、《真三國無雙:起源》
最后我們再測一款剛發(fā)售不久的游戲《真三國無雙:起源》,它恰好就在首批支持 DLSS 4 技術(shù)的 75 款游戲當(dāng)中,可惜目前游戲還未激活 DLSS 4 選項開關(guān),只能看看它在 DLSS 3 下的表現(xiàn)了。
在 4K 分辨率 + 最高畫質(zhì),游戲平均幀數(shù)為 112 幀,1% Low 幀為 83 幀;
在 4K 分辨率 + 最高畫質(zhì) + DLSS 質(zhì)量 + 幀生成,游戲平均幀數(shù)為 208 幀,1% Low 幀 116 幀;
作為一款優(yōu)化非常出色的游戲,RTX 5080 在 4K 分辨率下不開光追和 DLSS 選項,都能得到較高幀平均幀數(shù),無雙割草的體驗感拉滿。
五、DLSS 4 游戲體驗
其實 RTX 40 系列所支持的 DLSS 3 技術(shù),實際展現(xiàn)出的游戲幀率提升效果就已然十分卓越。而 DLSS 4 技術(shù)則是在 DLSS 3 的基礎(chǔ)上,進(jìn)一步挖掘并提升了幀生成的性能潛力。它運用了全新的多幀生成技術(shù),借助第五代 Tensor Core 的強勁性能,通過 AI 技術(shù),能夠為每一個渲染幀生成多達(dá) 3 個額外的幀,進(jìn)而顯著提升游戲的 FPS。
DLSS 4 可以與光線重建、超分辨率以及 DLAA 等一系列 DLSS 技術(shù)協(xié)同工作,最高可使游戲幀率達(dá)到傳統(tǒng)圖像渲染方式的 8 倍。當(dāng)玩家在游戲中啟用 DLSS 4 技術(shù),搭配 RTX 5080 顯卡,便能夠輕松實現(xiàn)開啟全景光線追蹤的 4K 分辨率高幀率游戲體驗。
GeForce RTX 50 系列的第 5 代 Tensor Core,AI 處理性能相比前代提升 2.5 倍,極大抑制游戲延遲增長,后續(xù)游戲?qū)嵗龑⒀菔狙舆t實際變化。Blackwell 顯示引擎也對 DLSS 4 技術(shù)有著重要意義,能提升像素處理能力,助力游戲在高分辨率和刷新率下適配 DLSS 4 技術(shù),最高可使像素處理能力翻倍。
DLSS 4 技術(shù)實現(xiàn)了模型架構(gòu)的重大革新。DLSS 光線重建、DLSS 超分辨率以及 DLAA 這些特性,均由首個實時 Transformer 模型驅(qū)動,該模型旨在提升生成像素的質(zhì)量。它能夠借助自注意力操作,對一幀或多幀畫面中的每個像素的重要程度進(jìn)行評估,從而更好地理解場景中的各種關(guān)系。通過這種方式,生成的像素穩(wěn)定性更佳,偽影更少,同時在運動細(xì)節(jié)的呈現(xiàn)上更為豐富,邊緣也更加平滑。
英偉達(dá)宣稱,當(dāng)下已有超 75 款支持 DLSS 幀生成技術(shù)的游戲與應(yīng)用,在 GeForce RTX 50 系列 GPU 上可升級為 DLSS 多幀生成技術(shù)。50 系顯卡正式發(fā)售后不久,眾多主流 3A 大作也將適配 DLSS 4,其中涵蓋《心靈殺手 2》《奪寶奇兵:古老之圈》《真三國無雙:起源》《黑神話:悟空》《星球大戰(zhàn):亡命之徒》以及《寂靜嶺 2:重制版》等熱門游戲。
《賽博朋克:2077》目前的 steam 測試版已支持 DLSS 4,我們通過它來了解下 DLSS 4 的實際體驗。如果是 4K 分辨率 + 超級畫質(zhì),不開光追和 DLSS,游戲平均幀數(shù)的表現(xiàn)還可以,能達(dá)到 73.27 幀。
接著我們看下多幀生成的選項,打開幀生成選項后,下面多出了一個多幀生成的倍率選擇項,即 DLSS Multi Frame Generation,可選擇 2x、3x 和 4x 這 3 種生成倍率。
我們依次在 4K 分辨率 + 超級光追畫質(zhì) + DLSS 性能設(shè)置下,選擇 2x、3x 和 4x 多幀生成,運行游戲基準(zhǔn)測試,分別得到了 149.49 幀、206.15 幀和 255..69 幀的游戲平均幀數(shù),2x 和 3x 多幀生成的表現(xiàn),非常接近 71.25 幀的 2 倍和 3 倍幀數(shù),在 4K 分辨率下超 240 幀的超級光追畫質(zhì)體驗遠(yuǎn)超我們的預(yù)期,畫面流暢度極高。
當(dāng)我們進(jìn)一步切換到超速光追畫質(zhì) + DLSS 4 多幀生成時,游戲平均幀數(shù)分別也有 106.3 幀、150.81 幀、189.68 幀。對于硬件性能要求極高的一款 3A 游戲中,我們竟獲得了前所未有的游戲性能體驗。不得不說,DLSS 4 技術(shù)的出現(xiàn),完全打破了大家以往對游戲性能的固有認(rèn)知。
當(dāng)然,無論是何種形式的插幀,延遲的增加都不可避免,所以我們也實測了關(guān)閉和打開多幀生成后的延遲表現(xiàn)。在關(guān)閉幀生成選項的情況下,我們測試 4K 超速光追畫質(zhì)的游戲平均延為 33ms。依舊在同一場景下分別開啟 2x、3x 和 4x 多幀生成,游戲平均延遲分別為 41ms、44ms 和 49ms。
如此看來相比開啟幀生成之前,延遲的確有一定的增加。不過隨后的 3x 和 4x 多幀生成延遲依次遞增 3ms、5ms,總體延遲都控制在 50ms 以內(nèi),對于非競技類單機游戲來說這個表現(xiàn)完全可以接受。
針對目前 DLSS 4 適配游戲較少的問題,英偉達(dá)推出了 DLSS Override 功能進(jìn)行緩解,這個功能能讓支持 DLSS 且還沒有適配 DLSS 4 的游戲獲得 DLSS 4 的幀生成和超分體驗。
我們以《漫威爭鋒》為例,在 4K 分辨率 + 高畫質(zhì) + 關(guān)閉 DLSS 情況下,游戲平均幀數(shù) 155 幀,1% Low 幀 63 幀,游戲平均延遲 15ms;
在 4K 分辨率 + 高畫質(zhì) + DLSS 質(zhì)量檔,游戲平均幀數(shù) 185 幀,1% Low 幀 107 幀,游戲平均延遲 25ms;
在同樣情境下,啟用 DLSS Override,并將 DLSS 4 幀生成設(shè)置為 X4 后,游戲平均幀數(shù) 372 幀,1% Low 幀 206 幀,游戲平均延遲 22ms。游戲幀率得到大幅度提升,體驗和原生適配 DLSS 4 已經(jīng)很接近了。
除 DLSS 4 技術(shù)外,新一代 NVIDIA Reflex 2 低延遲技術(shù)進(jìn)一步降低游戲延遲,提升操作手感與響應(yīng)速度。過去四年,NVIDIA Reflex 已集成超 100 款游戲,能將 PC 延遲降低 50%。新 Reflex 2 采用 Reflex Frame Warp 技術(shù),通過同步鼠標(biāo)輸入指令與渲染幀,實時控制游戲幀,實現(xiàn)定制化低延遲調(diào)整。未來,NVIDIA Reflex 2 不僅支持《無畏契約》等主流競技、動作游戲,搭配 DLSS 4,游戲低延遲表現(xiàn)將更出色。
六、生產(chǎn)力
生產(chǎn)力方面,IT之家實測了 UL Procyon 的照片編輯、視頻剪輯、以及 AI 文本撰寫等性能。在照片編輯上,技嘉魔鷹 RTX 5080 配合 AMD 9800X3D 獲得了 9369 分比公版 RTX 5080 高了 683 分。
在視頻剪輯性能測試中我們開啟了 GPU 加速,得益于 RTX 5080 Blackwell 架構(gòu)的第九代 NVENC,其在 H.264 / H.265 4:2:2 編碼的 8 位和 10 位視頻上有著非常大的優(yōu)勢,技嘉魔鷹 RTX 5080 最終獲得了 63208 分,比公版 RTX 5080 高了 575 分。
最后是考驗 AI 性能的大語言模型測試,面對 13B 參數(shù)量的 LLAMA 2 模型平均 OTS 也有著 84.49tokens / s,相比于公版 RTX 5080 的 83.48tokens / s 有所提升,表現(xiàn)出色。
七、總結(jié)
在這次對技嘉 GeForce RTX 5080 GAMING OC 16G 的首次測試中,我們獲得了極為深刻的印象。特別是在第五代 Tensor Core 與 DLSS 4 技術(shù)的雙重助力下,游戲性能的提升十分顯著,游戲幀數(shù)成倍增長變得輕而易舉。并且,其風(fēng)之力散熱系統(tǒng)的表現(xiàn)也極為出色,技嘉魔鷹 RTX 5080 搭配新一代仿生風(fēng)扇,有效降低了風(fēng)阻和噪音,其在低噪音表現(xiàn)的同時,可將風(fēng)壓提升高達(dá) 53.6%,風(fēng)量提升 12.5%,升級導(dǎo)熱凝膠,
大型均熱板和復(fù)合式熱管、進(jìn)氣格柵等散熱技術(shù)進(jìn)一步提升產(chǎn)品散熱性能。其性能與散熱要優(yōu)于公版 RTX 5080。關(guān)于技嘉 GeForce RTX 5080 GAMING OC 16G 售價到小編截稿時還是未定狀態(tài)。除此之外,技嘉也同步推出了技嘉 GeForce RTX 5080 SFF 風(fēng)魔 OC 顯卡,這款顯卡同樣搭載新一代仿生風(fēng)扇,同時滿足 NVIDIA SFF-Ready 標(biāo)準(zhǔn),更適合小尺寸機箱用戶使用,這款顯卡售價 8299 元,也與今天同步開售。
DLSS 4 技術(shù)的應(yīng)用,將為顯卡游戲性能開啟全新篇章。一方面,廣大玩家將迎來更流暢、精彩的游戲體驗;另一方面,游戲開發(fā)者也獲得了更廣闊的創(chuàng)作天地,能夠打造出畫面更精美、運行更流暢的游戲作品。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。