耕升 GeForce RTX 4070 星極皓月 OC評測:清新雅致的2K光追遊戲神器

2023-04-22     太平洋電腦網

原標題:耕升 GeForce RTX 4070 星極皓月 OC評測:清新雅致的2K光追遊戲神器

寫在開頭

RTX 40系顯卡至今已經發布了三款,RTX 4090與RTX 4080這兩張旗艦卡的性能有目共睹,不過高昂的售價確實令不少人望而卻步。後續老黃雖然帶來了RTX 4070 Ti,不過6499的售價也讓囊中羞澀的玩家下不去手。這不為了讓更多人能夠用上最新黑科技,體驗Ada Lovelace架構與DLSS 3,老黃終於發布了GeForce RTX 4070顯卡,4799元的起售價相比前面三位老大哥可以說是友好了許多,這無疑會吸引不少玩家關注。

而耕升作為深耕顯卡市場30多年的老品牌,同時還是NVIDIA在國內重要的AIC合作夥伴,GeForce RTX 4070的發布自然不能缺席。我們也在第一時間上手了最新的RTX 4070顯卡,這次我們測試的是耕升 GeForce RTX 4070 星極皓月 OC。雪白的外衣、強勁的性能、合理的售價,每一點都透露著這張顯卡的「不簡單」。下面就一同探索它的性能上限,究竟能給玩家帶來怎樣的驚喜。

*下文「耕升 GeForce RTX 4070 星極皓月 OC」簡稱為「耕升RTX 4070星極皓月OC」

規格對比

在開始測試前,我們先了解一下耕升RTX 4070星極皓月OC的配置,首當其衝的自然是顯卡的「心臟」——AD104核心,在RTX 4070 Ti首發測試時我們知道,那上面搭載的才是完整版的AD104核心,而RTX 4070上的這顆則是閹割版。

從下圖可以看到,完整的AD104核心應該包括5個GPC(圖形處理集群)、30個TPC(紋理處理集群)、60個SM(流式多處理器)以及一個帶有6個32Bit顯存控制器的256Bit顯存帶寬。

而RTX 4070上的這顆AD104核心則只有4個GPC(圖形處理集群),其中1個GPC也是經過閹割的、另外還有23個TPC(紋理處理集群)、46個SM(流式多處理器)以及一個帶有6個32Bit顯存控制器的256Bit顯存帶寬。二級緩存部分也與RTX 4070 Ti有細微差距,RTX 4070 Ti為48MB的二級緩存,而RTX 4070則是36MB,不過相比起前代的RTX 3070或RTX 3070 Ti的4MB二級緩存,可以是降維打擊了。

除此之外,耕升RTX 4070星極皓月OC上的這顆AD104核心被命名為AD104-250-A1,TSMC 4N工藝製造,晶片面積為295平方毫米,雖然不及上代的面積大,但因為工藝製程的進步,耕升RTX 4070星極皓月OC上的這顆AD104內塞下了更多的電晶體,足足有358億之多,並且頻率上也往前邁進了300MHz以上,可以說是全方位的領先。

其他參數也是堆料十足,5888個CUDA,46個第三代RTX Cores,184個第四代Tensor Cores,並且用上了12GB的GDDR6X顯存,相比上代的提升還是很明顯的,大顯存配合性能上的提升更可以為遊戲以及創作者帶來更好的使用體驗。

外觀賞析

耕升RTX 4070星極皓月OC的外包裝還是相當有特點的,正面滿滿當當的賽博朋克風。在包裝的右下角標明了自己的身份GeForce RTX 4070,而在左下角是型號星極皓月OC 12GB GDDR6X。

包裝盒的背面就相當簡約了,不像正面那麼「張牙舞爪」,更多的是介紹耕升的品牌理念與星極系列顯卡的獨特設計。

整個包裝盒上最重要的當然是右上角標明的「支持三年質保以及個人送保「,展現了耕升對自家產品的信心,玩家可以放心購買。

拆開包裝就能見到顯卡本體了,包裝盒內還附贈了「不用讀「系列說明書、RGB同步線以及耕升定製的顯卡支架。

初看耕升RTX 4070星極皓月OC就被它的設計所驚艷到,身披雪色戰甲配合銀色的散熱器,冷艷中顯露出高貴的氣息。純白的設計風格給玩家帶來全新視覺風格的同時,也給白色主題裝機用戶提供了新選擇。

正面最搶眼的應該是三把散熱風扇,每把風扇都達到了92mm的直徑,甚至左右兩邊都已經撐過了外殼邊界。每把散熱風扇都配備了第二代耕升「炫風之刃」造形扇葉,特殊分葉型設計讓風扇在相同的轉速底下比傳統扇葉擁有更大的風流量,進一步舒緩顯卡溫度,加強核心動態頻率的提升幅度。

並且這三把散熱風扇還是有小設計的,放大中間的風扇,可以發現其實它更像一隻眼睛,四周還有一圈鏤空做映襯,上面密密麻麻排滿了大寫的「G「字樣,象徵著耕升對性能的極致渴望。

顯卡的背面是巨幅的白色金屬背板,提高散熱效能的同時也很好的保護了PCB板。背板上還印有「耕升「與」GEFORCE RTX「,辨識度拉滿。

穿透式散熱設計也讓顯卡背面多了一絲美感,在金屬背板的右方進一步加大積鏤空間,配合散熱器上第三組風扇的風流直接穿透散熱鰭片以及鏤空的PCB設計,令顯卡溫度進一步下降。

視角轉到顯卡頂部,熟悉的「GEFORCE RTX「字樣牢牢鑲嵌在上,旁邊是巨大的「耕升GAINWARD」Logo,不點亮時有著銀色的反光,與雪白的機身相得益彰。

當你點亮顯卡以後,這個「耕升GAINWARD」Logo開始熠熠生輝!跟定製的顯卡支架一起搭配使用,兩道RGB為顯卡顯著提升戰力,帶來全新的視覺享受。

顯卡的兩側,一大排鰭片出風口貫穿始終,並且緊貼金屬背板,多重散熱加持,相信耕升RTX 4070星極皓月OC在後續的測試中有不錯的表現。

供電接口使用的是傳統的8pin供電接口,放在一眾RTX 40系顯卡中可以說是相當罕見了。不過以它的供電能力帶動這張顯卡還是綽綽有餘的。

底部的顯卡金手指為標準的PCIe 4.0 x 16速率,擁有更快的傳輸速度,有利於顯卡釋放更強的性能。

IO擋板上是這款顯卡的輸出接口,從上往下依次是3個DP 1.4a和HDMI 2.1接口,可實現最高8K@60Hz的視頻輸出,並且最大支持4屏輸出,如果你是一個多屏黨,它絕對能夠滿足你的需求。

最後從這個角度看過去可以發現耕升RTX 4070星極皓月OC比自家的老大哥要瘦了,52mm的厚度再也不是驚人的三槽厚度了,這個體積,小點的機箱也能容納,組建一台性能小鋼炮成為可能。

顯卡拆解

見識完耕升RTX 4070星極皓月OC的冷艷外觀,下面讓我們看看它的內部構造。想要拆解這張卡僅需卸下背板上的幾顆螺絲即可。

首先引入眼帘的正是純黑色的PCB,可以說這一代RTX 40系顯卡的集成度相當高,PCB的大小都控制得恰到好處,並且還用上了8層PCB設計,可以說電氣性能相比以前有了長足的進步。

翻過背面看看,PCB上是密密麻麻的控制晶片與濾波用的MLCC,整齊有序的排列宛如一座雄偉的城池一般。

PCB的正中央就是備受矚目的AD104-250-A1核心,雖然是閹割版,但還是蘊含了不小的能量。其採用TSMC 4N工藝打造,295mm2的晶片面積內塞下了5888個CUDA 核心。

核心四周是6顆GDDR6X顯存顆粒,來自美光科技,型號是3DU47 D8BZC,單顆顯存容量為2GB,6顆顯存共組成12GB,相比上代的RTX 3070可以說是史詩級進步了。不過顯存速率僅有21Gbps,相比大哥RTX 4080略低。

耕升為這款顯卡配備了10相供電,其中8相為核心供電,位置安排在PCB的左側,每相供電都配上固態電容、封閉電感,以及DrMos晶片。

剩餘2相則是顯存供電,位置在GDDR6X顯存附近,配置與核心供電一致,可以說相當豪華了。

無論是核心供電還是顯存供電都採用了獨立的DrMos晶片,來自安森美,型號是NCP302150,單顆持續輸出電流為50A,足以帶動AD104與GDDR6X顯存這兩個性能大戶。

PWM供電晶片則被安排在PCB背面,型號為uP9512R,用於管理核心供電。

顯存供電則由uP9529Q晶片負責。

背面還有一顆名為uS5650Q的晶片,其擔任電壓/電流/功耗監控的工作,是不可或缺的晶片之一。

PCB的底部就是PCIe金手指了,標準的PCIe 4.0 x16速率,使用前務必確保其接入主板上最高速率的PCIe插槽及開啟主板Resizable BAR功能,這樣顯卡才能夠滿血釋放。

再看看電源接口,我們熟悉的老朋友——8Pin接口,這個接口用在耕升RTX 4070星極皓月OC上可以說是恰到好處。

看完了堆料配置,該看看這款顯卡的散熱如何了,耕升RTX 4070星極皓月OC用上了RTX 4070 Ti的同款散熱,因此筆者也對它的散熱表現充滿期待。

散熱器的一端是大面積的均熱板,耕升在均熱板上為顯存、電感、MOS管接觸的地方用上了高係數的導熱墊輔助散熱,就連AD104核心處也是厚厚的一層矽脂,基本上把能堆料的地方都拉滿了。

散熱器另一邊是大面積緊密的散熱鰭片,能夠更快的將顯卡內部的熱量導出,讓顯卡保持「冷靜」,全力輸出。

厚重的散熱器內還藏了4根6mm的復合式熱導管,貫穿整個散熱器,還用上了抗氧化能力極強的鍍鎳工藝,延長使用壽命。

主動散熱部分用的是3把92mm的散熱風扇,說實話以這張顯卡的功耗,再有TSMC 4N工藝的加持,3把風扇可以把顯卡吹感冒了!

風扇扇葉用的是經優化的耕升專用「炫風之刃」扇葉,改良後可以提升風流量,並減低聲噪,有效加強散熱,內外兼備。

測試平台介紹

首先介紹一下本次的測試平台,我們用上了評測室的最強硬體,使用的是目前的旗艦—— i9-13900KS處理器,為ROG Z790 HERO,搭配金士頓32GB DDR5-6000高規格,確保這張能夠釋放全部性能。

測試平台方面我們已經祭出了目前地表最強的硬體,那拿來襯這張顯卡的顯示器自然也不能弱,用的依舊是天花板級別的AGON PD32M保時捷聯名款,4K@144Hz的高刷,絲般順滑暢享市面上的3A遊戲。

測試前通過GPU-Z看看顯卡的規格參數,產品名稱中有「OC」字樣代表顯卡加速頻率會比公版高一些,因此耕升RTX 4070星極皓月OC顯卡的加速頻率為2580MHz,擁有5888個CUDA單元,12GB GDDR6X顯存,192bit顯存位寬。

另外,這張顯卡的TGP設定給到了215W,溫度牆也跟RTX 4080為同一水平線的88℃,給極客玩家預留了充足的超頻空間。

理論性能測試

國際慣例,我們先對耕升RTX 4070星極皓月OC顯卡進行理論性能測試,軟體大家dou很熟悉了,就是Steam上最火爆的《3DMark》。

單從圖中就可以看出這張顯卡的性能就是爆殺上一代兩張的70顯卡,用一句話描述就是,在2K解析度下,耕升RTX 4070星極皓月OC的理論性能表現是RTX 3070的1.3倍,約為RTX 3070 Ti的1.3倍。

再看看老黃引以為傲的光追項目,耕升RTX 4070星極皓月OC在 PortRoyal項目中突破1w分大關,領先前代的RTX 3070 Ti 約3000分,提升幅度令人驚喜。可見新架構的革新不僅帶來了性能的飛躍,光追也得到了很好的補全,相信這款顯卡在光追遊戲中的表現一定會給我們帶來不一樣的驚喜。

在GPGPU理論性能測試方面,擁有Ada Lovalace架構的RTX 40系列顯卡在算力上也有出色的性能表現,尤其是單精度和雙精度浮點運算上,提升幅度是最大的。整體性能是RTX 3070 Ti的1.4倍,對比RTX 3070更是可以達到1.5倍之多。

遊戲性能測試

遊戲測試玩家們已經等很久了,事不宜遲馬上開始,首先是常見的1080P解析度,說實話多少有點看不起耕升RTX 4070星極皓月OC了。實測結果來看,不少遊戲都能穩定運行在150 FPS以上,像《荒野大鏢客2》這樣優化比較好的遊戲,僅需開啟DLSS 2,它就已經能夠達到150+ FPS。相比起20系的RTX 2070 Super,幀數幾乎是翻倍的提升,即便是面對上一代的RTX 3070或RTX 3070 Ti,耕升RTX 4070星極皓月OC一樣能夠領先30 FPS左右。

升級到遊戲玩家更常用的2K高解析度,耕升RTX 4070星極皓月OC依舊亂殺,大部分遊戲依舊有120 FPS以上的水平,要知道這還是不開DLSS或者只開了DLSS 2的水平,更不用說它還有黑科技DLSS 3。看看熱門的《地平線5》,這張顯卡的幀數去到了149 FPS,上代的兩張70級顯卡只有120 FPS,當耕升RTX 4070星極皓月OC已經能夠2K高刷暢玩時,其他卡才剛到高刷的及格線,性能差距不言而喻。

總的來說,耕升RTX 4070星極皓月OC完全對得起2K高幀遊戲神卡的稱號,遊戲性能提升相當理想,領先上代RTX 3070顯卡約26%;尤其是隨著解析度的提升,部分光線追蹤能力要求更高的遊戲提升就越為明顯。即使面對RTX 4070 Ti也不虛,性能差距僅有16%左右,從這一點來看,性價比顯著。

DLSS 3性能測試

DLSS可以說是AI時代最具革命性的突破,隨著DLSS的更新,現在已經發展到了3.0時代。全新的DLSS 3技術不僅可以大幅提升幀率,還可以讓系統延遲大大降低,生成的畫面更是足以媲美甚至超越原始渲染的效果。我們也是準備了一系列的測試驗證DLSS究竟有沒有老黃說得那麼神。

3DMark DLSS 3理論性能測試

老慣例,先測試一次理論性能,在3DMark的DLSS 3測試中,耕升RTX 4070星極皓月OC僅開啟DLSS 2的情況下就已經能夠實現2K@120Hz,4K@60Hz的遊戲體驗了;如果開啟DLSS 3後,2K下幀數能夠上升至130FPS,4K畫質下也能勉強體驗90Hz的高刷效果。

《光明記憶:無限》遊戲實測

光有理論測試還不夠,並且現在支持DLSS 3的遊戲已經有50多款,不實測怎麼能見識到DLSS 3的真實戰力。我們選擇了一款首發就支持DLSS 3的國產遊戲《光明記憶:無限》,這是一款FPS射擊遊戲。我們使用耕升RTX 4070星極皓月OC進行測試,2K解析度下新顯卡的幀數相比前作高出了幾十幀的差距,如果放在1080P畫質下,領先幅度將繼續加大到接近1倍的水平。值得一提的是不單止性能有飛躍,功耗還維持在低位,可以說是花小錢辦大事的典範了。

這裡也給大家看看遊戲中DLSS 3的實際表現,解析度為2K,畫質極高 ,DLSS模式為性能,可以看到即使是開啟DLSS 3後,遊戲畫面肉眼看去幾乎沒有畫質損失,而遊戲幀數卻一直穩定在高位,可以說DLSS 3讓遊戲體驗達到了新的境界。

在其他幾款遊戲中也是如此,耕升RTX 4070星極皓月 OC在開啟DLSS 3後,遊戲幀數相比RTX 3070 Ti都有60%-70%左右的提升,不少項目更是有翻倍的幀數提升,並且功耗都更低,用更低的功耗實現更強的性能,這才是玩家所樂見的。

DLSS 3帶來的另一優勢是由於集成了NVIDIA Reflex,因此開啟DLSS 3之後,將會帶來更低的遊戲延遲,對MOBA、大逃殺或FPS類遊戲玩家來說,其意義也是非常重大的。

1080P解析度DLSS性能測試

1080P的畫質對在座的顯卡幾乎沒有難度,這裡的測試主要用來看DLSS 3能否帶來神秘加成。毫無疑問,開啟DLSS 3後的耕升RTX 4070星極皓月OC猶如開了外掛一般,不少RTX 3070或RTX 3070 Ti只能運行在100 FPS出頭的遊戲,耕升RTX 4070星極皓月OC直接抬到了200+ FPS的水平。性能領先前代顯卡70%以上,可見DLSS 3真的有點東西。

2K解析度DLSS性能測試

作為一張定位2K高幀的遊戲顯卡,耕升RTX 4070星極皓月OC的表現果然不負眾望,在DLSS 2下,這款顯卡已經超越了RTX 3070 Ti,開啟DLSS 3後,遊戲性能更是飛躍,RTX 3070跟RTX 3070 Ti只能望其項背,它的性能甚至一度超越了RTX 3080!從表格數據就可以看出,開啟DLSS 3後,耕升RTX 4070星極皓月OC的性能是RTX 3070的243%,可想而知有DLSS 3的介入,性能可以有多離譜。

我們也使用耕升RTX 4070星極皓月OC在DLSS 2和DLSS 3兩種模式下測試了多款遊戲,從實測結果來看,DLSS 3確實有點東西,不少遊戲的幀數都有明顯提升,其中不乏一些遊戲有翻倍的性能提升。

更讓人驚喜的是開啟DLSS 3後,遊戲的1% Low幀也有提升,這也意味著你在玩遊戲時更穩定更絲滑。想像一下,換裝耕升RTX 4070星極皓月OC後在2K畫質下暢玩3A大作,電競級的體驗可以說是真的爽。

4K解析度DLSS性能測試

雖然說這是一張定位2K 100+FPS遊戲級別的顯卡,但耕升RTX 4070星極皓月OC仍是具備一定的4K遊戲能力,只要把DLSS 3一開,或者是把遊戲畫質降低一些,遊戲流暢度就直接上來了,跑個60+FPS不成問題。

RTX VSR性能測試

有些時候你是不是也會有這樣的煩惱,那些480P甚至360P的早期視頻清晰度不夠,看起來不夠清楚?現在這種煩惱將不再困擾你。NVIDIA帶來了視頻版的DLSS 3!正是前不久發布的RTX Video Super Resolution 視頻超解析度技術(RTX VSR),通過AI技術即可提高瀏覽器內的視頻的解析度,展現前所未有的顯示效果。

今天我們也測試了這項劃時代的RTX VSR技術,在RTX 30系和RTX 40系的NVIDIA控制面板中找到視頻圖像設置,手動開啟RTX Video enhancement即可啟用RTX VSR技術,其中分為1-4檔調節,數字越大質量越好。

實測環節,可以看到在開啟RTX VSR技術之後,原視頻里的人物線條由原本的模糊不清變得十分清晰銳利,並且隨著VSR級別的提高,清晰度逐級提升,甚至部分細節已經接近原生1080P了。

在暗部表現同樣如此,原視頻里地板如同劣質貼圖,有VSR加持後每塊磚頭都清晰可見,且立體感滿滿,尤其是旁邊綠色植被的清晰度更高了一個數量級。除此之外,RTX VSR技術的AI算法似乎還能夠通過類似DLSS幀生成的方式計算出物體的遠近關係優化景深效果,這一點同樣能夠使得畫面整體觀感得到提升。

這裡我們也給大家準備了對比視頻,從視頻里就可以看到VSR的效果之明顯,最高級別的VSR 4跟原生480P相比就是一眼的區別,在開啟RTX VSR技術後,部分圖像質量有了顯著提高,不僅鋸齒和噪點幾乎全部消失,顏色過渡也更為平滑,目前VSR能有這種表現堪稱驚艷。

當然你除了在瀏覽器能夠使用這項功能外,本地瀏覽器也能享受黑科技的魅力,VLC是目前首個支持RTX VSR技術的本地播放器,且能夠支持多種視頻格式播放。正式版也隨著RTX 4070的解禁上線了,你里的老視頻也能搖身一變成1080P了!

我們將瀏覽器中的視頻與本地的視頻同時進行RTX VSR 4檔渲染,從畫面上看,右側本地播放器的效果要弱於左側瀏覽器的,瀏覽器上的4檔VSR線條更銳利,畫質也更清晰,不過即使是本地播放器的效果也要遠強於原生480P,筆者猜測可能是目前本地瀏覽器的優化還不到位。

我們也將原生480P與瀏覽器和本地播放器上的VSR渲染視頻進行對比,從視頻畫面中可以看到,本地播放器上4檔VSR渲染過後,文字或線條都相比原生480P有一定提升,至少以前模糊不清的視頻可以看了,不過對比瀏覽器的效果還略有差距,後者的效果已經接近原生1080P了。

有用戶可能擔心功耗的問題,在VSR開啟最高檔4檔的情況下,耕升RTX 4070星極皓月OC的功耗僅有24W左右,顯卡利用率也遠沒有網絡上傳得那麼高,在HWINFO64中可以看到顯卡全程利用率不過25%。

總的來說,耕升RTX 4070星極皓月OC上的RTX VSR技術將為玩家和視頻觀看者帶來革命性的新體驗!無論是性能上還是技術上的創新,都稱得上是流媒體時代的革命!

創作性能測試

理論與遊戲上的性能提升讓筆者對耕升RTX 4070星際皓月OC充滿期待,在創作生產力上是否也是如此?我們選擇PugetBench、PCMark 10、UL Procyon等多款常見的測試軟體,來測試這款顯卡在日常辦公、視頻內容生產方面的表現。

從實測結果中可以看到,PCMark10 Extended測試中,耕升RTX 4070星極皓月OC在遊戲這個子項目上對比前代的RTX 3070與RTX 3070 Ti有明顯的優勢,領先幅度高達20%。這也跟上述遊戲性能測試結果相符,可見遊戲玩家這次真是撿到寶了,花更低的價格用更強的顯卡。

創作生產力部分,這款顯卡的表現也令人喜出望外,不單止超越前代顯卡不少,甚至在達文西測試中還反殺了老大哥RTX 4070 Ti。提到達文西測試就不得不提這款顯卡支持AV1編解碼,這是一項新技術,有了AV1的加持後,耕升RTX 4070星極皓月OC的性能相比RTX 3070足足提升了38%,因此換裝新顯卡意味著在未來的創作生產中講給你帶來更極致的體驗。

創作生產已經如此出色了,面向渲染、工業設計等專業生產又如何?一句話概括就是:強!很強!非常強!單是在Blender渲染軟體中,耕升RTX 4070星極皓月OC相比RTX 3070就有50%的性能提升,就算是RTX 3070 Ti,它依舊領先45%以上。

再看看OC渲染器,性能領先可以用離譜來形容,耕升RTX 4070星極皓月OC的渲染性能領先RTX 3070 Ti有50%之多,如果對比同代的RTX 3070,差距將拉大到60%!這也意味著渲染同一段素材,換裝耕升RTX 4070星極皓月OC的你可以比別人快出接近一倍的速度,生產效率將極大的提高。

NVIDIA編碼器測試

熟悉RTX 40系顯卡的玩家對NVIDIA編碼器一定不陌生,它支持時下熱門的AV1編碼,作為下一代主流的視頻編碼技術有著自己獨特的優勢,更快的編碼速度和更高質量的流媒體傳輸性能,讓越來越多的剪輯軟體和視頻網站青睞於它,像我們熟悉的達文西、剪映、B站等已經支持AV1編解碼,未來AV1將會成為一個新趨勢。

我們使用NVIDIA提供的8K片源與工程文件分別測試AV1格式和H.265格式下的編碼時間。實測同一段素材下,同樣使用H.265編碼,有編碼器的加持下,耕升RTX 4070星極皓月OC的效率比RTX 3070快40%以上,如果使用AV1編碼,那效率會比H.264快50%。

值得一提的是AV1編碼不止導出速度更快,它的文件占用空間也比H.265要小,無論是4K解析度還是8K解析度,使用AV1編碼後,文件整體大小能夠降低25%以上。經過對比,AV1編碼的視頻在畫質上與H.265也沒有明顯差距,可以說AV1對戰H.265是全方位的領先,勢必會成為下一個最受歡迎的格式。

AI運算能力測試

AI是目前備受關注的議題,AI作畫、AI寫稿、AI剪輯等各種應用如雨後春筍般接踵而至,不少玩家也想趁著這股東風,搭上AI的快速列車!那我們手上的耕升RTX 4070星極皓月OC你一定不能錯過,畢竟玩轉AI可是老黃的拿手好戲。

我們對耕升RTX 4070星極皓月OC顯卡進行AI運算能力測試,在使用達文西AI ACCELERATED MAGIC MASK測試時,可以看到它的完成時間為14秒,而前代的RTX 3070則是21秒,你可能覺得時間差距不大,但項目一旦複雜起來,選用耕升RTX 4070星極皓月OC會讓你的效率快33%以上。

在另一款AI應用軟體ON1 Resize AI 2023中,使用AI將多張圖片提升200%解析度,此時耕升RTX 4070星極皓月OC的速度為10秒一張,而上代的RTX 3070和RTX 3070 Ti均為12秒,即使對比RTX 4070 Ti,耕升RTX 4070星極皓月OC也只慢了2秒而已。

而在最近大火的AI作畫中,耕升RTX 4070星極皓月OC更是大放異彩。我們用Stable Diffusion生成50張768 x 768的圖片進行測試,從生成時間上就可以看到耕升RTX 4070星極皓月OC的強勢,前代的RTX 3070 Ti生成50張圖需要接近3分鐘的時間,而前者只需要2分11秒!

另外在測試中還有一個值得關注的地方就是顯存占用,基本上RTX 20系跟RTX 30系的幾張顯卡在測試時顯存占用都達到了7.6G以上,雖然我們手頭上的耕升RTX 4070星極皓月OC顯存占用也有7G以上,不過得益於12GB大顯存,因此在生成速度上有明顯優勢,所以大家在玩這個軟體的時候應該是顯卡顯存越高越好,選擇耕升RTX 4070星極皓月OC就是你高性價比兼高性能的選擇。

功耗與發熱

上面提到以RTX 4070的體量,散熱風扇完全用不上三把,所以我們也對耕升RTX 4070星極皓月OC進行了功耗和發熱測試。

在室溫25℃的情況下,使用Furmark單烤15分鐘後,耕升RTX 4070星極皓月OC的GPU核心運行在2655MHz以上的高頻,但此時核心溫度僅有61℃,顯存更是僅有50℃出頭。並且此時它的功耗和噪音控制也相當優秀,烤機15分鐘,最高功耗僅有215W,上一張做到這個功耗的顯卡是RTX 2070 Super,可以說30系顯卡在耕升RTX 4070星極皓月OC面前完全沒有勝算。

TSMC 4N工藝與新架構給大家帶來了一點點小震撼,我們進一步做了更深入的測試。利用HWINFO64軟體與FrameView軟體雙重記錄多款顯卡的功耗表現情況,從圖中可以看到耕升RTX 4070星極皓月OC整體功耗控制相當出色,在所有測試場景內近乎都是維持在200W左右,用RTX 2070 Super一樣的功耗,但性能卻已經實現全方位的領先!

實測下來,不禁感慨RTX 40系顯卡確實有點東西,耕升RTX 4070星極皓月OC無論是性能表現、溫度控制甚至是能耗比都可以說是N卡的新高度,相比前代的RTX 30系還是初代光追顯卡20系都是一次降維打擊。

超頻能力測試

眾所周知,耕升RTX 4070星極皓月OC是一張帶」OC」後綴的顯卡,那筆者自然是不會放過這個超頻的機會,下面一同看看這款顯卡的超頻潛力究竟有多大吧。

這裡我們使用經典的小飛機進行顯卡超頻,首先當然還是對這張顯卡有個基本的性能了解。耕升RTX 4070星極皓月OC在默頻狀態下Time Spy得分18213分。

緊接著我們小超一下,核心先超頻250MHz,顯存超500MHz,沒想到僅僅超頻250MHz後,Time Spy得分就已經19057分,接近2W分大關了,此時耕升RTX 4070星極皓月OC在測試中的核心頻率也已經有3000MHz了,相比默頻時最高的2790MHz剛好提升了200多MHz左右。

繼續加碼,我最後將耕升RTX 4070星極皓月OC的頻率定格在核心和顯存分別提升了280MHz和1500MHz。此時在Time Spy測試中,顯卡的核心頻率已經上到了3015MHz,在頻率上甚至比RTX 4070 Ti還要再強一些,當然頻率的提升帶來的是性能的增強,測試總分也來到了19413,相比默頻的18213分,提升近1200分,能力可見一斑。

評測總結

測試完這張耕升 GeForce RTX 4070 星極皓月 OC,感嘆遊戲發燒友終於等來了最值得選購的一張RTX 40系顯卡。見過RTX 40系顯卡的玩家應該都會被其中的黑科技所折服,這張新顯卡不僅繼承了Ada Lovelace架構、DLSS 3等,還帶來了全新的RTX VSR等極具生產力的功能,讓新顯卡不僅有著超常的性能、超低的功耗,還有超越的技術,滿滿的亮點帶給玩家最大的驚喜。

說回耕升 GeForce RTX 4070 星極皓月 OC,這張顯卡最吸睛的應該是它的顏值。白色冷艷的外觀設計無疑是一眾顯卡中獨具一格的存在。純白的金屬外殼與正面鏤空的眼睛設計別有一番韻味,黑與白的相互碰撞,擦出了驚艷的火花,讓遊戲玩家也能感受「科技美學」的力量。老實說,初看它的第一眼,就被深深吸引,相信這樣的外觀也能俘獲玩家的心。

性能方面自不必多說,AD104核心的戰力大家有目共睹!耕升 GeForce RTX 4070 星極皓月 OC的表現可以說是完勝RTX 3070 Ti,甚至對比RTX 3080都有不小的優勢。性能飆升的同時,功耗還維持在RTX 2070 Super的水平,可以說遙遙領先於30系顯卡。遊戲性能更是驚艷,DLSS 3的加持下,2K 100+ FPS感受細膩畫質與絲滑體驗,即使4K下,有了DLSS 3也有一戰之力。

最後再聊聊耕升 GeForce RTX 4070 星極皓月 OC顯卡的售價,作為一款兼具顏值與性能的中端旗艦,顯然是眾多遊戲發燒友的首選。5099元的售價也讓這款顯卡相比起老大哥們更為「親民」,性價比十足。目前耕升 GeForce RTX 4070 星極皓月 OC已在各大電商平台開售,手持舊顯卡的玩家不妨趁這個機會入手新顯卡,感受最新科技帶來的極致體驗。

Ada Lovelace架構講解

Turing、Ampere上兩代架構核心均以人物來命名,前者是計算機科學之父——艾倫·麥席森·圖靈;後者則是「電學中的牛頓」——安德烈·瑪麗·安培,電流的國際單位安培就是以其姓氏命名。那Ada Lovelace定非凡人,度娘一下果然,這是 人稱「數字女王」的阿達·洛芙萊斯,編寫了歷史上首款電腦程式,是被世界公認的第一位電腦程式員,果真是一代比一代還要更牛。PS:她的父親是《唐璜》的作者,詩人拜倫。

從Turing架構開始,NVIDIA首次在顯卡中加入了加速光線追蹤的RT Core單元,以及面向AI推理的Tensor Core單元,這革命性的創新使實時光線追蹤成為可能。而Ampere架構則是全面的架構改進,在加入新一代的二代RT Core和三代Tensor Core基礎上,還有著更先進的SM單元設計,這樣顯卡工作效率那是翻倍的提升。而來到Ada Lovelace架構,同時是以效率提升為大前提,自然是引入了最新的第三代 RT Cores與第四代 Tensor Cores單元,同時加入眾多新穎的黑科技,從執行效率來說Ada Lovelace架構是上代Ampere架構的2倍以上,甚至光線追蹤能力更是達到了恐怖的4倍性能。

全新的SM流式多處理器

Ada Lovelace架構中最大的亮點之一:全新的SM流式多處理器,每個SM包含了128個CUDA核心、1個第三代的RT Cores,4個第四代 Tensor Cores(張量核心)、4個Texture Units(紋理單元)、256 KB Register File(寄存器堆),以及128 KB L1 數據緩存/共享內存子系統,於是這一個全新的SM單元有著超過上一代2倍之的性能表現。

過去的Turing架構INT32 計算單元與FP32數量是一致的,而兩者相加才組成了64個CUDA核心。但是Ampere架構開始,左側的計算單元實現了FP32+INT32的計算單元並發執行,也就是說CUDA核心數量翻倍到了128個。

再來看看Ada Lovelace架構的SM,FP32/INT32的計算單元組合,同樣實現了每個SM內含128個CUDA的設計,看似提升不大,但是當你了解到GeForce RTX 4070擁有46個SM,5888個CUDA核心,那你也就應該明白它的著色器能力進一步加強,跟上一代的RTX 3070相比,雖然是同樣的CUDA核心,但得益於新架構的優勢,完全可以說是遙遙領先。

另外緩存方面Ada Lovelace架構也進行了大規格的提升,首先每個SM單元中單獨配上了128 KB的緩存,其次核心的二級緩存進行進行了重新的設計,使得RTX 4070配備了36MB二級緩存,相比RTX 3070可以說是質的飛躍,足足提升了9倍之多。

技術講解:第三代 RTX Cores 與 第四代 Tensor Cores

以為剛才的CUDA數量與超大L2緩存就已經很猛了,實現上Ada Lovelace架構最大的提升還是在第三代 RTX Cores與第四代 Tensor Cores身上。

第三代 RTX Cores

RTX Cores用於光線追蹤加速,第三代 RTX Cores 的有效光線追蹤計算能力達到 191 TFLOPS,是上一代產品 2.8 倍。

在Ampere架構中,第二代RT Cores支持邊界交叉測試(Box Intersection testing)和三角形交叉測試(Triangle Intersection testing),用於加速BVH遍歷和執行射線三角交叉測試計算,雖然光線追蹤處理能力已經比初代的Turing架構核心更高效,但是隨著環境和物體的幾何複雜性持續增加,傳統的處理方式很難再以更高效率、正確反應出的現實世界中的光線,尤其是光的運動準確性。

所以在第三代 RTX Cores增加了兩個重要硬體單元:Opacity Micromap Engine與Displaced Micro-Meshes Engine引擎。Opacity Micromap Engine,主要是用於alpha通道的加速,可以將 alpha 測試幾何體的光線追蹤速度提高2倍。

在傳統光柵渲染中,開發人員使用一些 Alpha 通道的素材來實現更高效的畫面渲染,例如 Alpha 通道的葉子或火焰等複雜形狀的物體。但在光線追蹤時代,這傳統的做法會為光線追蹤帶為不少無效的計算,例如運動性的光線多次通過一塊葉子,光線每擊中一次葉子,都會調用一次著色器來確定如何處理相交,這時就會做成嚴重的執行成本與時間等待成本。

而Opacity Micromap Engine用於直接解析具有非不透明度光線交集的不透明度狀態

三角形。根據Alpha 通道的不透明,透明與未知等三個不同的塊狀態進行處理:透明則直接忽略繼續找下一個,不透明塊則記錄並告之命中,而未知的則交給著色器來確定如何處理,這樣GPU很大部分都不需要進行著色器的調試處理,能夠實現更為高效的性能。

Displaced Micro-Meshes Engine

如果說Opacity Micromap Engine加速的是面處理,那麼Displaced Micro-Meshes Engine就是幾何曲面細節的加速器。如上圖所示,在Ada Lovelace架構中,通過1個基底三角形+位移地圖,就可以創建出一個高度詳細的幾何網格,所需要資源占用比二代RTX Cores更低,效率也更高。

通過NVIDIA給出的創建14:1珊瑚蟹例子來說事,這裡我們需要需要1.7萬個微網格、160萬個微三角形,在Ada Lovelace架構中BVH創建速度可加快7.6倍,存儲空間縮小8.1倍。Displaced Micro-Meshes Engine起到了關鍵性的作用,其將一個幾何物體根據不同細節分成密度不一的微網絡處理,紅色密度超高,細節處理越為複雜 。相應的低密度微網絡區域則可以釋放更多的資源與存儲空間,這樣Displaced Micro-Meshes Engine就可以幫助BVH加速過程,減少構建時間和存儲成本。

同時Ada Lovelace架構SM中新增了著色器執行重排序(Shader Execution Reordering,SER),這是由於光線追蹤不再只有強光或者陰影渲染處理,未來將會更多的是在光線的運動性,這樣光線就會變得越來越複雜,想要第三代 RTX Cores與第四代 Tensor Cores有著更高的執行效率,那就得為他們來安排一位管家。而著色器執行重排序(SER)就是為了能夠即時重新安排著色器負載來提高執行效率,為光線追蹤提供2倍的加速,也能更好地利用 GPU 資源。不過目前仍未有實例,想實現這個功能,還得遊戲與開發工具的支持才行。

第四代 Tensor Cores

Tensor Cores是專門為執行張量/矩陣運算而設計的專用執行單元,這些運算是深度學習中使用的核心計算功能。第四代Tensor Cores新增FP8引擎,具有高達1.32 petaflops 的張量處理性能,超過上一代的5倍。

技術講解:DLSS 3

或者說第四代Tensor Cores太硬核你不會知道是啥?提升意義在哪?但是Tensor Cores最經典的應用DLSS你肯定會知道,這一次Ada Lovelace架構支持NVIDIA最新的DLSS 3技術。

之前我們也聊過DLSS技術,其設計之初是為了彌補光線追蹤技術後的性能損失,具體的表現為開啟光線追蹤技術後遊戲幀數大幅度的下降,甚至很難保證遊戲流暢的運行。於是DLSS使用低解析度內容作為輸入並運用AI技術輸出高解析度幀,從而提升光線追蹤的性能。

在DLSS 3中包含了三項技術:DLSS幀生成、DLSS超解析度(也稱為DLSS 2)和NVIDIA Reflex。你可以理解為DLSS 3是在DLSS 2的基礎上,新增了DLSS幀生成技術;而後兩技術中,DLSS超解析度只需要GeForce RTX顯卡都能使用上,NVIDIA Reflex則是GeForce 900 系列以後的顯卡都用使用上。

想實現DLSS幀生成可不簡單,這需要配合上Ada Lovelace架構的GeForce RTX 40系列顯卡才行。DLSS幀生成技術原理是:利用AI技術生成更多幀,以此提升性能。DLSS會藉助 GeForce RTX 40系列GPU所搭載的全新光流加速器分析連續幀和運動數據,進而創建其他高質量幀,同時不會影響圖像質量和響應速度。

從Ampere架構開始,NVIDIA顯卡就已經支持了光流加速器,而Ada Lovelace架構的光流加速器升級到了第二代,其提供了高達300 TeraOPS (TOPS) ,比安培架構的初代光流加速器(Optical Flow Acceleration,OFA)快2倍以上。為了實現DLSS幀生成,OFA扮演了重要的角色,其配合上新的運行矢量分析算法在DLSS 3技術框架內實現精確和高性能的幀生成能力。

另外,由於DLSS幀生成是在GPU上作為後處理執行的,那麼即使在遊戲受到CPU性能限制的時候,我們同樣能夠從中獲得更好的遊戲性能提升。尤其是那種物理計算密集型的遊戲或大型場景遊戲,DLSS 2均可以讓GeForce RTX 40系列顯卡以高達兩倍於CPU可計算的性能來渲染遊戲。

最後由於DLSS 3是建立在DLSS 2基礎之上的,遊戲開發者可以在已支持DLSS 2或NVIDIA Streamline的現有遊戲中快速集成該功能,所以DLSS 3已在遊戲生態得到廣泛應用,目前已有超過35款遊戲和應用即將支持該技術。

閱讀小亮點:NVIDIA Reflex

NVIDIA Reflex也是DLSS 3其中的一環,它可以使GPU和CPU同步,確保最佳響應速度和低系統延遲。

想要實現端對端的最低延遲,你需要確保遊戲、顯示器以及滑鼠三者都同時支持並開啟了Reflex 技術。

當GeForce RTX 40系列顯卡和NVIDIA Reflex搭配上後,直接達到1440p解析度360 FPS的體驗,這著實是性能有點強勁了。

在GTC2022大會時已經透露將會還有4 款 1440p 解析度的新型 G-SYNC 電競顯示器將要發布,包括採用mini-LED技術的AOC AG274QGM – AGON PRO Mini LED、MSI MEG 271Q Mini LED 和 ViewSonic XG272G-2K Mini LED三款顯示器刷新率均為300Hz,而最猛的是ASUS ROG Swift 360 Hz PG27AQN ,刷新率直接來到了360Hz。

但唯一一個問題就在於,部分顯示器廠商認為此類產品受眾人群較少,會降低此類顯示器的產能,甚至產品就已經被內部PASS掉,所以1440p 360Hz是很美好,但現實也是相當的骨感。

技術講解:NVIDIA編碼器

GeForce RTX 40系列顯卡還有一個全新的升級,那就是編碼器NVENC。第八代的NVENC編碼器不僅支持H.264與H.265,還支持開放式視頻編碼格式 AV1。

而由於AV1是一種免版稅的視頻編碼格式,上游軟體廠商與下遊戲的配套端都在大力推廣此編碼格式,我們也會看到越來越多的硬體與軟體支持AV1格式,包括剪映專業版、DaVinci Resolve、以及Adobe Premiere Pro較為流行的Voukoder插件均支持,且均可通過編碼預設使用編碼器,這樣我們等待視頻導出的時間縮短將近一半。

不單是視頻製作軟體,AV1格式也將會是主播、遊戲直播UP主們的新寵兒,在保證畫面最高質量的情況下,AV1 編碼器可將效率提高 40%,同時顯卡的占用也更低。包括OBS Studio一代軟體中也會增加AV1格式的支持。另外我們還能通過 GeForce Experience 和 OBS Studio 錄製高達 8K60 的內容,這樣我們做遊戲錄製也會變得更為輕鬆。

包括我們之後測試時使用的遊戲內錄視頻都是支持AV1格式,同時編碼器NVENC在資源占用和適配上做得越來越好。

文章來源: https://twgreatdaily.com/98d13086d34a62b972f7f25f13fd3f90.html