隨著光追技術(shù)加持的新游戲越來越多,主流 PC 玩家群體所追求的 4K 游戲體驗對顯卡的壓力也越來越高,在 RTX 40 系顯卡時代,60 和 70 后綴的顯卡想要征服 4K + 最高畫質(zhì)下的 3A 大作多少還是有些困難的。好在新一代 RTX 5070 顯卡擁有全新 Blackwell 架構(gòu)和第五代 Tensor 核心,還有 DLSS 4 技術(shù)加持,玩家們總算看到了一絲希望。
本次我們評測的這款影馳 GEFORCE RTX 5070 FIRE 顯卡主打輕薄設(shè)計和高性價比,那么它的性能能夠征服 4K 游戲呢?咱們今天就來揭曉答案。
為了發(fā)揮顯卡的全部性能,本次我們搭建了如上圖所示的硬件測試平臺。
一、外觀設(shè)計
影馳 GEFORCE RTX 5070 FIRE 顯卡的造型非常硬朗,顯卡裝甲邊緣只做了小弧度的倒角處理,視覺上看起來四四方方。純黑配色搭配部分類凱芙拉紋理裝飾和凹槽紋路都讓它充滿了暗黑機械風(fēng)的味道。
其實這個外觀在之前的影馳 RTX 5090 D 大將上就見過,只是風(fēng)扇由黑透改為了黑色,風(fēng)扇上的 Logo 也不一樣,但中間風(fēng)扇周圍的一圈“尖刺”設(shè)計仍舊得以保留,“旭日黑鎧”直接傳承了過來。
新一代的霜環(huán)風(fēng)扇包含 3 個 90mm 直徑風(fēng)扇;扇葉數(shù)量調(diào)整到 7 葉,風(fēng)壓提升約 15%,同轉(zhuǎn)速下噪音降低 5%,整體使用體驗更好。
顯卡背板的設(shè)計也和影馳 RTX 5090 D 大將基本保持一致,只是左側(cè)的字母印花范圍更大,右側(cè)還是以圓角矩形開口為基礎(chǔ),內(nèi)部做了四個梯形斜對稱的個性鏤空裝飾。
尺寸方面,影馳 GEFORCE RTX 5070 FIRE 顯卡的三圍分別是 300*120*40mm(含擋片),凈重約 829g,符合 SFF-Ready 顯卡設(shè)計規(guī)范,旨在通過小尺寸規(guī)格簡化小機箱和配件的選擇。
顯卡正面裝甲也對側(cè)面形成了全包裹支持,有效提升保護性的同時,也讓一體性變得更強。
金手指區(qū)域改成了新版 PCIe5.0*16 規(guī)格設(shè)計。
顯卡供電接口依舊為 12V-2*6 設(shè)計,而且保持了反扣式朝向和獨立背板開槽,這點好評。
接口擋板區(qū)域,影馳還設(shè)計了如動物鱗片般的不規(guī)則開孔組,接口包含 3 個 DP2.1b 和 1 個 HDMI2.1b,支持最高 8K / 165Hz 輸出。
配件給到了 1 根黑色編織材質(zhì)的 16pin 轉(zhuǎn) 2*8pin 電源轉(zhuǎn)接線和 1 本快速安裝指南。
二、架構(gòu)分析
Blackwell 架構(gòu)
RTX 50 系列顯卡這次采用的 Blackwell 加入了神經(jīng)網(wǎng)絡(luò)渲染的特性,其多單元流處理器 (SM) 具有更高的處理吞吐量,并且支持了 Flip Metering 來代替 CPU Pacing,讓 GPU 更精準(zhǔn)管理顯示時間,盡可能達到每幀的畫面生成時間保持一致,從而滿足 DLSS 多幀生成的穩(wěn)定性需求。
第五代 Tensor 核心
第五代 Tensor 核心能夠加速重新排序,并新增了對 FP4 精度模型的支持,相較于第四代 Tensor 核心上所支持的 FP8 精度模型,吞吐量提升 2 倍;相比 FP16 精度模型,F(xiàn)P4 的顯存使用不到一半,GPU 性能的提升卻高達 2 倍。正是由于第五代 Tensor 核心的加入,才讓 DLSS 4 技術(shù)能夠順利支持多幀生成功能。
第四代 RT 核心
在 RT Core 方面,提升了檢測光線、路徑與三角形相交的效能,可以對大量幾何圖形細節(jié)進行光線追蹤。在新一代 Blackwell 架構(gòu)下光線、路徑與三角形相交的檢測效率為上一代的 2 倍,初代使用 RT Core 的 Turing 架構(gòu)的 8 倍,并增強了壓縮以減少內(nèi)存占用,相比上代的顯存占用減少 25%,光線追蹤效果也得到了前所未有的細節(jié)提升。
配備 GDDR7 顯存
除了技術(shù)上的提升,Blackwell 架構(gòu)的 GPU 還搭載了 GDDR7 顯存。GDDR7 采用的是 PAM3 信號編碼機制,與 GDDR6 和 GDDR6X 有所區(qū)別。PAM3 每兩周期的數(shù)據(jù)傳輸為 3 位,相比 GDDR6 和 GDDR6X 更省電,帶寬也進一步提升,速度高達 30 Gbps。
RTX 5070 規(guī)格
具體到產(chǎn)品規(guī)格上,影馳 GEFORCE RTX 5070 FIRE 顯卡基于最新一代 GB205-300 核心和 TSMC 4N 架構(gòu)制程工藝打造,包含 6144 個 CUDA 核心、988 個 Tensor 核心、 94 個光追核心。
影馳 GEFORCE RTX 5070 FIRE 顯卡的核心頻率工作范圍是 2325MHz-2512MHz,顯存方面升級為 192-bit 顯存位寬的 12GB GDDR7 規(guī)格,總帶寬來到了 672GB/s。TDP 功耗為 250W,相比上代 RTX 4070 增加了 50W。
三、理論跑分
烤機環(huán)節(jié),影馳 GEFORCE RTX 5070 FIRE 顯卡在甜甜圈單烤 20 分鐘后,GPU 功耗穩(wěn)定在了 250W,GPU 主頻為 2415MHz,而 GPU 溫度 71.5℃。其中 GPU 主頻給的稍微有點保守,并沒有上到 2500MHz,但也在標(biāo)稱的主頻區(qū)間內(nèi)。
在 3DMark Time Spy DX12 測試中,影馳 GEFORCE RTX 5070 FIRE 顯卡得分達到了 22187 分,對比 RTX 4070 的 17392 分,提升幅度約 27.5%。
在 3D Mark Time Spy Extreme DX12 測試中,影馳 GEFORCE RTX 5070 FIRE 顯卡得分達到了 10656 分,對比 RTX 4070 的 8261 分,提升幅度約 28.9%。
在 3DMark Portal Royal 實時光追測試中,影馳 GEFORCE RTX 5070 FIRE 顯卡的綜合分為 14031 分,對比 RTX 4070 的 11006 分,提升幅度達到了 27.5%。
理論測試環(huán)節(jié),影馳 GEFORCE RTX 5070 FIRE 顯卡的成績相比 GeForce RTX 4070 顯卡均高出 25% 以上,簡單粗暴的性能提升讓駕馭 4K 游戲不再只是想象,那接下來就用游戲?qū)崪y來驗證一下吧。
四、游戲?qū)崪y
GeForce RTX 5070 顯卡在 4K 游戲的表現(xiàn)上,應(yīng)該是玩家朋友們最關(guān)心的,所以游戲測試環(huán)節(jié)依舊會以 4K 分辨率為主。
1、《CS2》
在競技游戲《CS2》中:
RTX 5070 在 4K 分辨率 + 高畫質(zhì)下,游戲平均幀數(shù)為 215 幀,1% Low 幀 93 幀,平均延遲 12ms;
RTX 4070 在 4K 分辨率 + 高畫質(zhì)下,游戲平均幀數(shù)為 162 幀,1% Low 幀 85 幀,平均延遲 16ms;
影馳 GEFORCE RTX 5070 FIRE 顯卡相比 RTX 4070 顯卡的平均幀數(shù)提升約 32.7%,1% Low 幀提升 9.4%,平均延遲降低 25%。
RTX 5070 在 2K 分辨率 + 高畫質(zhì)下,游戲平均幀數(shù)為 376 幀,1% Low 幀 135 幀,平均延遲 8ms;
RTX 4070 在 2K 分辨率 + 高畫質(zhì)下,游戲平均幀數(shù)為 269 幀,1% Low 幀 124 幀,平均延遲 11ms;
影馳 GEFORCE RTX 5070 FIRE 顯卡相比 RTX 4070 顯卡的平均幀數(shù)提升約 37.7%,1% Low 幀提升 8.8%,平均延遲降低 28%。
2、《無限暖暖》
《無限暖暖》作為一款上市不到半年的端游,也支持了光線追蹤和 DLSS,經(jīng)過實測:
RTX 5070 在 4K 分辨率 + 極致畫質(zhì) + 開啟光追 + DLSS 抗鋸齒下,游戲平均幀數(shù)為 83 幀,1% Low 幀 62 幀;
RTX 4070 在 4K 分辨率 + 極致畫質(zhì) + 開啟光追 + DLSS 抗鋸齒下,游戲平均幀數(shù)為 66 幀,1% Low 幀 57 幀;
影馳 GEFORCE RTX 5070 FIRE 顯卡相比 RTX 4070 顯卡的平均幀數(shù)提升約 25.7%,1% Low 幀提升 8.7%。
RTX 5070 在 2K 分辨率 + 極致畫質(zhì) + 開啟光追 + DLSS 抗鋸齒下,游戲平均幀數(shù)為 123 幀,1% Low 幀 110 幀;
RTX 4070 在 2K 分辨率 + 極致畫質(zhì) + 開啟光追 + DLSS 抗鋸齒下,游戲平均幀數(shù)為 102 幀,1% Low 幀 81 幀;
影馳 GEFORCE RTX 5070 FIRE 顯卡相比 RTX 4070 顯卡的平均幀數(shù)提升約 20.5%,1% Low 幀提升 35.8%。
3、《古墓麗影:暗影》
《古墓麗影:暗影》只支持初版 DLSS,可以看作是傳統(tǒng)光柵游戲的代表,經(jīng)過實測:
RTX 5070 在 4K 分辨率 + 最高畫質(zhì)下,游戲平均幀數(shù)為 95 幀,1% Low 幀 83 幀;
RTX 4070 在 4K 分辨率 + 最高畫質(zhì)下,游戲平均幀數(shù)為 78 幀,1% Low 幀 66 幀;
影馳 GEFORCE RTX 5070 FIRE 顯卡相比 RTX 4070 顯卡的平均幀數(shù)提升約 21.7%,1% Low 幀提升 25.7%。
RTX 5070 在 2K 分辨率 + 最高畫質(zhì)下,游戲平均幀數(shù)為 188 幀,1% Low 幀 141 幀;
RTX 4070 在 2K 分辨率 + 最高畫質(zhì)下,游戲平均幀數(shù)為 148 幀,1% Low 幀 119 幀;
影馳 GEFORCE RTX 5070 FIRE 顯卡相比 RTX 4070 顯卡的平均幀數(shù)提升約 27%,1% Low 幀提升 18.4%。
4、《極限競速:地平線 5》
《極限競速:地平線 5》游戲優(yōu)化出色,但對顯存的要求并不低,經(jīng)過實測:
RTX 5070 在 4K 分辨率 + 極端畫質(zhì)下,游戲平均幀數(shù)為 118 幀,1% Low 幀 101 幀;
RTX 4070 在 4K 分辨率 + 極端畫質(zhì)下,游戲平均幀數(shù)為 91 幀,1% Low 幀 77 幀;
影馳 GEFORCE RTX 5070 FIRE 顯卡相比 RTX 4070 顯卡的平均幀數(shù)提升約 29.6%,1% Low 幀提升 31.1%。
RTX 5070 在 2K 分辨率 + 極端畫質(zhì)下,游戲平均幀數(shù)為 166 幀,1% Low 幀 138 幀;
RTX 4070 在 2K 分辨率 + 極端畫質(zhì)下,游戲平均幀數(shù)為 127 幀,1% Low 幀 83 幀;
影馳 GEFORCE RTX 5070 FIRE 顯卡相比 RTX 4070 顯卡的平均幀數(shù)提升約 30.7%,1% Low 幀提升 66.2%。
5、《荒野大鏢客:救贖 2》
《荒野大鏢客:救贖 2》在傳統(tǒng)光柵游戲中,也是很吃性能的,經(jīng)過實測:
RTX 5070 在 4K 分辨率 + 最高畫質(zhì)下,游戲平均幀數(shù)為 77 幀,1% Low 幀 60 幀;
RTX 4070 在 4K 分辨率 + 最高畫質(zhì)下,游戲平均幀數(shù)為 60 幀,1% Low 幀 55 幀;
影馳 GEFORCE RTX 5070 FIRE 顯卡相比 RTX 4070 顯卡的平均幀數(shù)提升約 28.3%,1% Low 幀提升 9.0%。
RTX 5070 在 2K 分辨率 + 最高畫質(zhì)下,游戲平均幀數(shù)為 118 幀,1% Low 幀 80 幀;
RTX 4070 在 2K 分辨率 + 最高畫質(zhì)下,游戲平均幀數(shù)為 94 幀,1% Low 幀 73 幀;
影馳 GEFORCE RTX 5070 FIRE 顯卡相比 RTX 4070 顯卡的平均幀數(shù)提升約 25.5%,1% Low 幀提升 9.5%。
6、《黑神話:悟空》
在“眾生平等”代表之作《黑神話:悟空》中,開啟全景光追后的顯卡壓力非常大。經(jīng)過實測:
RTX 5070 在 4K 分辨率 + 超高畫質(zhì) + 50% 超采樣分辨率 + 高全景光追 + 幀生成下,游戲平均幀數(shù)為 64 幀,1% Low 幀 53 幀;
RTX 4070 在 4K 分辨率 + 超高畫質(zhì) + 50% 超采樣分辨率 + 高全景光追 + 幀生成下,游戲平均幀數(shù)為 52 幀,1% Low 幀 45 幀;
影馳 GEFORCE RTX 5070 FIRE 顯卡相比 RTX 4070 顯卡的平均幀數(shù)提升約 23%,1% Low 幀提升 17.7%。
RTX 5070 在 2K 分辨率 + 超高畫質(zhì) + 50% 超采樣分辨率 + 高全景光追 + 幀生成下,游戲平均幀數(shù)為 98 幀,1% Low 幀 60 幀;
RTX 4070 在 2K 分辨率 + 超高畫質(zhì) + 50% 超采樣分辨率 + 高全景光追 + 幀生成下,游戲平均幀數(shù)為 79 幀,1% Low 幀 52 幀;
影馳 GEFORCE RTX 5070 FIRE 顯卡相比 RTX 4070 顯卡的平均幀數(shù)提升約 24%,1% Low 幀提升 15.3%。
五、DLSS 4 游戲體驗
RTX 50 系顯卡新增的 DLSS 4 技術(shù)在 DLSS 3 的技術(shù)上,新增了全新的多幀生成技術(shù),結(jié)合第五代 Tensor 核心的強大性能,利用 AI 為每個渲染幀生成至多 3 個額外幀,從而大幅提升游戲的 FPS 水平。
DLSS 4 配合全套 DLSS 技術(shù),包括光線重建、超分辨率以及 DLAA 等功能,最多可實現(xiàn)傳統(tǒng)圖像渲染的 8 倍幀率。
多幀生成技術(shù)還可配合 NVIDIA Reflex 低延遲技術(shù)保持較低的游戲延遲,讓游戲的操作和響應(yīng)影響很小。Blackwell 顯示引擎也在 DLSS 4 技術(shù)發(fā)揮了重要作用,通過提升其像素處理能力,讓游戲在更高分辨率和刷新率下滿足 DLSS 4 技術(shù)的要求,最高可提升 1 倍的像素處理能力。
DLSS 4 技術(shù)還帶來了模型架構(gòu)的重大升級,DLSS 光線重建、DLSS 超分辨率和 DLAA 特性均由首個實時 Transformer 模型驅(qū)動,并用來提升生成像素的質(zhì)量,它支持通過自注意力操作評估整個幀及多個幀中每個像素的重要程度,更好理解場景關(guān)系,讓生成的像素具有更好穩(wěn)定性、更少的偽影、更豐富的運動細節(jié)和平滑邊緣。
官方表示,目前已有超過 75 款支持 DLSS 幀生成技術(shù)的游戲和應(yīng)用可在 GeForce RTX 50 系列 GPU 上升級至 DLSS 多幀生成技術(shù),不少主流 3A 大作也已于 50 系顯卡正式發(fā)售后更新了 DLSS 4 多幀生成功能的支持,包括《心靈殺手 2》、《奪寶奇兵:古老之圈》、《黑神話:悟空》、《星球大戰(zhàn):亡命之徒》《寂靜嶺 2:重制版》等熱門作品。
《賽博朋克:2077》作為首批支持 DLSS 4 技術(shù)最完善的游戲之一,如果在 4K 分辨率下開啟光追,但不開啟 DLSS 和幀生成選項,那么:
在 4K 分辨率超級光追畫質(zhì)下,游戲平均幀數(shù)為 21 幀;
在 4K 分辨率超速光追畫質(zhì)下,游戲平均幀數(shù)為 5 幀;
即使不開啟光追,4K 分辨率下游戲平均幀數(shù)也只有 48 幀,在沒有 DLSS 和幀生成技術(shù)的加持下,基本告別 4K 體驗了。
幸好顯卡支持 DLSS 4 技術(shù),在游戲中開啟 DLSS Multi Frame Generation(DLSS 多幀生成)選項后,游戲幀數(shù)的表現(xiàn)瞬間就不一樣了。我們依次在 4K 分辨率 + 超級光追畫質(zhì) + DLSS 質(zhì)量檔設(shè)置下,選擇 2x、3x 和 4x 多幀生成,運行游戲基準(zhǔn)測試,分別得到了 67 幀、94 幀和 119 幀的游戲平均幀數(shù),相比不開 DLSS 時的 21 幀,提升幅度分別達到了 3.19 倍,4.47 倍和 5.66 倍,原本完全無法在 4K 分辨率下暢玩,現(xiàn)在直接可以跑到 4K / 120Hz 了,不得不說 DLSS 4 給了 RTX 5070 這張顯卡在光追游戲上脫胎換骨的體驗。
在我們測試 RTX 5070 的這幾天,《永劫無間》游戲推送了一次更新,支持了 DLSS 4 多幀生成功能,恰好可以作為一個典型競技游戲,來測試下 DLSS 4 的性能提升和延遲表現(xiàn)如何。
首先,RTX 5070 在 4K 分辨率 + 最高畫質(zhì) + DLSS 質(zhì)量模式下,游戲平均幀數(shù)為 105 幀,1% Low 幀 77 幀,平均延遲 41ms;
隨后,當(dāng)我們在設(shè)置菜單中開啟 2x、3x 和 4x 多幀生成選項后,RTX 5070 的游戲平均幀數(shù)分別提升到 136 幀、170 幀、199 幀;而游戲平均延遲方面分別為 31ms、36ms 和 41ms。大家不難發(fā)現(xiàn),開啟多幀生成后游戲的平均延遲竟然還降低了,只有 4x 多幀生成下,平均延遲才回升到不開多幀生成時的 41ms,毫無疑問 DLSS 4 技術(shù)配合 Reflex 低延遲技術(shù),在競技游戲中的延遲表現(xiàn)完全可以接受。
那么多幀生成會影響畫質(zhì)嗎?通俗點說就是會不會令畫面變得更糊?為此我們也在《心靈殺手 2》中同一個場景截取了 3 種不同畫質(zhì)設(shè)置的游戲畫面,分別是:
4K 原生畫質(zhì) + 路徑光追;
4K 最高畫質(zhì) + DLSS 性能檔(1080P 渲染)+4x 幀生成
4K 最高畫質(zhì) + DLAA(4K 渲染)+4x 幀生成
然后通過 NVIDIA ICAT 工具進行比較,在不放大的情況下 3 者根本看不出區(qū)別,所以我們挑選了 3 處細節(jié)進行放大對比。
首先是警員手臂衣服上的 FBI 標(biāo)志,左側(cè)和右側(cè)分別是 DLAA(4K 渲染)和原生 4K 畫質(zhì),中間是 DLSS 性能(1080P 渲染),經(jīng)過放大可以看到中間圖片的 FB 文字更糊一點,但左右基本看不出清晰度上的區(qū)別。
同樣在警員的波浪卷發(fā)以及身旁右側(cè)的樹葉上也能看出中間的畫面更糊一點,左右兩邊的圖片卻難以發(fā)現(xiàn)差距。
也就是說對于物理渲染分辨率上的天然鴻溝,DLSS 技術(shù)肯定是無法完全彌補畫質(zhì)差距的,但只要保持和原生畫質(zhì)相同的分辨率(即開啟 DLAA),畫面清晰度和細節(jié)幾乎沒有區(qū)別,更別說我們這種“盯幀式”比較有點吹毛求疵,正常游戲無論是 DLSS 性能檔(1080P 渲染)還是 DLAA(4K 渲染)都不會有糊成一片,鋸齒滿滿這種明顯問題,所以最主要的還是看游戲適配,在乎畫質(zhì)的小伙伴直接開啟 DLAA 就好了。
六、創(chuàng)意生產(chǎn)
生產(chǎn)力方面,IT之家實測了 UL Procyon 的圖像視頻剪輯、以及 AI 文本撰寫等性能。
在 UL Procyon 的視頻剪輯性能測試項目中,GPU 加速,得益于 Blackwell 架構(gòu)升級的第九代 NVENC 編碼器和 NVDEC 解碼器,其在 H.264/ H.265 4:2:2 編碼的 8 位和 10 位視頻上有著非常大的優(yōu)勢,經(jīng)過實測:
RTX 5070 顯卡得分 56444 分;
RTX 4070 顯卡得分 48427 分;
影馳 GEFORCE RTX 5070 FIRE 顯卡的視頻編輯性能相較于 RTX 4070 顯卡提升約 16.5%。
在 UL Procyon AI 推理性能測試項目中的 Microsoft Windows ML 版本測試中:
RTX 5070 顯卡得分 1077 分;
RTX 4070 顯卡得分 989 分;
影馳 GEFORCE RTX 5070 FIRE 顯卡的 Microsoft Windows ML 版本 AI 推理性能提升相較于 RTX 4070 顯卡提升了約 8.8%。
在側(cè)重建模和渲染性能的 blender Benchmark 4.3.0 版本基準(zhǔn)測試中:
RTX 5070 顯卡的 3 個場景分別拿到了 2907 分、1640 分、1552 分;
RTX 4070 顯卡的 3 個場景分別拿到了 2554 分,1260 分、1325 分;
在 Blender 基準(zhǔn)測試的 3 場景渲染中,影馳 GEFORCE RTX 5070 FIRE 顯卡的渲染性能相較于 RTX 4070 顯卡提升分別約為 13.8%、30.1%、17.1%。
七、總結(jié)
作為一款“標(biāo)準(zhǔn)版”RTX 5070 顯卡,影馳 GEFORCE RTX 5070 FIRE 顯卡沒有驚艷的外觀設(shè)計和華麗的 RGB 燈效,但性能表現(xiàn)和穩(wěn)定性都較為出色,成功躍升 4K 全能游戲卡的行列,讓消費者有了更加實惠的選擇。
4599 元的價格配合 DLSS 4 技術(shù)的加持,不論是當(dāng)下還是未來,都能滿足主流玩家的游戲需求,這樣一款簡約且實用的顯卡應(yīng)該令注重實用性的玩家“青睞”。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。