耕升RTX 4070踏雪評測:素雅純白配色,暢玩2K遊戲性價比新選

2023-04-12     泡泡網

原標題:耕升RTX 4070踏雪評測:素雅純白配色,暢玩2K遊戲性價比新選

剛剛,NVIDIA正式發布了GeForce RTX 4070顯卡,新卡號稱擁有遠超前代同檔次的性能,將帶來1440P光追遊戲100幀的表現,下面我們就來實測看看它的表現究竟如何,又是否成為使用2K屏的玩家們更具性價比的選擇。

01/ Ada Lovelace架構與GeForce RTX 4070

AD104核心

GeForce RTX 4070採用了與GeForce RTX 4070 Ti同款的AD104核心,該系列GPU核心基於台積電4N定製工藝與全新的Ada Lovelace架構打造,在性能、能耗比等方面帶來了飛躍式的進步。

Ada Lovelace架構核心配備了全新的第三代RT Core(光線追蹤核心)、第四代Tensor Core(張量核心)以及SM(流式多處理器)。據了解,Ada Lovelace架構核心所採用的新一代SM(流式多處理器)帶來了至高2倍的性能以及能效提升。

Ada Lovelace架構核心 SM結構圖

Ada Lovelace架構核心在RT Core上引入的兩個全新硬體單元——Opacity Micro-Map引擎和Displaced Micro-Mesh引擎,大幅度提升了光線追蹤的計算表現,則使得全景光線追蹤得以實現,從而帶來更為逼真的陰影及紋理細節,

第三代RT Core結構示意圖,相比前代,增加了2個功能

Ada Lovelace架構核心配備的第四代Tensor Core則是引入了來自專業級H100數據中心GPU的 FP8 Transformer 引擎帶來了更加強悍的AI算力。這部分AI算力的提升不僅在DLSS 3技術中有所發揮,也可以使得其在AIGC的內容生產上擁有更好的表現。

Ada Lovelace架構核心的升級也帶來了Shader Execution Reordering(SER/著色器執行重排序)技術來更好的對於著色器的工作進行調度排序,在使用上可以根據不同的負載需求來執行渲染,可對負載較為統一的畫面進行渲染,降低工作開銷。

SER 著色器執行重排序

Ada Lovelace架構核心還配備有全新的第八代NVENC硬體編碼器,這一全新的第八代NVENC編碼器在支持傳統的H.265等格式之外,整合了對AV1視頻編碼格式的支持,有效提升了在視頻內容創作方面的生產力表現。

Ada Lovelace架構核心在提供了諸如SER技術、全局光線追蹤技術、AV1格式等方面的提升以外,還在現階段顯存帶寬提升有限的情況下,大幅度提升了Die上的L2緩存容量,從而帶來數據命中率的有效提升,為光線追蹤等相關性能場景的表現帶來更高的收益。

DLSS 3

Ada Lovelace架構核心的升級也使得RTX 40系列顯卡得以通過DLSS 3技術來進一步獲得相關的表現提升。根據NVIDIA官方的介紹,DLSS 3技術由DLSS 2(DLSS 超解析度技術)+DLSS 幀生成技術+NVIDIA Reflex這三方面所共同組成。

DLSS 3幀生成技術依賴於Ada Lovelace架構核心的獨立光流處理器以及Tensor Core的AI算力,這一項技術在運作過程中,將通過光流處理器所得到的一系列數據,以光流加速技術(Optical Flow Acceleration,簡稱為OFA)以及Tensor Core所提供的AI算力來進演算畫面內容以及進行畫面的優化,從而實現幀數上的提升。

DLSS 3幀生成技術可直接生成遊戲第1幀3/4的像素以及整個遊戲第2幀,相當於使用1/8的算力,就完成了整個計算過程。而通過這一個流程的循環,可在提升幀數的同時節省資源開銷,進一步帶來更好遊戲體驗。

DLSS 3幀生成技術可以極大提升遊戲的幀數表現,但由於可能帶來延遲的增加,因此DLSS 3中幀生成技術的開啟需要整合NVIDIA Reflex這一技術來降低渲染以及操作的延遲,從而帶來幀數更高且流暢性更佳的體驗。根據NVIDIA官方的說法,DLSS 3幀生成技術配合NVIDIA Reflex,可使得遊戲體驗擁有媲美甚至是超越原生級的渲染、操作體驗。

GeForce RTX 4070

GeForce RTX 4070顯卡採用了AD 104-250核心,這一核心為TSMC 4N工藝進行製造,其晶片面積以及電晶體密度與RTX 4070 Ti的AD 104-400核心一致,晶片面積為294.5 平方毫米、電晶體密度為358億。

不過值得注意的是,雖然GeForce RTX 4070採用的AD 104-250核心其面積與電晶體密度和RTX 4070 Ti的AD 104-400核心一致。但通過架構圖我們可以看到,AD 104-250核心相比較於 AD 104-400核心少了1組GPC+1組TPC,合計少了14組SM(流式多處理器)。

RTX 4070 Ti採用的AD104-400核心架構切片

RTX 4070採用的AD104-250核心架構切片

顯存方面, RTX 4070與RTX 4070 Ti保持了一致,均為192 bit位寬、21Gbps的顯存速率、12GB的 GDDR6X顯存容量以及504.2GB/s的顯存總帶寬。雖然僅從參數看顯存位寬較RTX 3070 Ti有所下降,但由於這一代的二級緩存來到了36MB(為上一代的9倍),所以RTX 4070對於顯存帶寬的依賴性已經大大降低,從理論來說是完全可以輕鬆超越上一代同級的RTX 3070 Ti的。

02/ 外觀拆解

本期我們拿到的耕升GeForce RTX 4070 踏雪顯卡,對應的是原先入門定位的的追風系列,價格採用了NVIDIA官方的4799元起步價,不過換上了全新的純白配色,也為追求性價比的玩家帶來全新的視覺風格,整卡尺寸為315*122*40mm(不含擋板)。

顯卡正面採用了三個92mm 而且經優化的耕升專用「炫風之刃」扇葉,經改良後提升風流量,並減低聲噪,有效加強散熱。

顯卡背板同樣以白色為底色,背板右方的做了大面積的鏤空,配合散熱器上第三組風扇的風流直接穿透散熱鰭片以及鏤空的PCB設計,進一步提升散熱效率。

耕升GeForce RTX 4070 踏雪採用了傳統的單8 Pin供電接口,使用非PCIe 5.0的電源也能直插白色模組線,不需要轉接,對於使用純白主題機箱的用戶來說非常友好。供電旁邊還有一個顯卡燈效同步接口。

耕升GeForce RTX 4070 踏雪採用了標準的雙槽設計,整卡厚度僅為40mm,在緊湊型的機箱中安裝有更良好的兼容性。顯卡側邊擋板提供了3個DP 1.4a和1個HDMI 2.1a接口,前者至高可支持4K@240Hz或8K@60Hz超清輸出。

位於顯卡頂部的耕升ARGB炫光LOGO,可通過附贈的燈光同步線來支持主流板廠的神光同步功能。

通過升級版GW-SOUL調控軟體,玩家可以輕鬆實現性能監控、超頻設置、ARGB燈效操控等。

耕升GeForce RTX 4070 踏雪的散熱器內部配備了大面積的緊密散熱鰭片,以及4根6mm復合式熱導管,導管還加入了抗氧化鍍鎳設計。底座與GPU核心接觸的部分採用了更加高效的散熱銅板。

耕升GeForce RTX 4070 踏雪採用8層PCB設計,短小的面積為鏤空散熱提供了更充分的空間,PCB上面共有8相核心供電和2相顯存供電。

PCB正中間為AD104-250-A1核心,核心周圍是6顆鎂光GDDR6X顯存,組成了12GB的容量,顯存為192 bit,等效顯存頻率為21 Gbps。

03/ 基準測試

測試平台選用了目前主流的i7-13700KF處理器和DDR5-6400內存的組合。

從GPU-Z的信息可以看到,耕升GeForce RTX 4070 踏雪的加速頻率達到2535MHz,相比公版高了60MHz,同時TGP功耗也對應提升至215W。

從理論測試來看,綜合FSE和TS兩項2K測試成績來說,耕升GeForce RTX 4070 踏雪相比RTX 3070 Ti的OC非公版性能提升在20%以上,同時光追遊戲性能提升約25%。

在3DMark 2K質量檔為的DLSS性能測試里,耕升GeForce RTX 4070 踏雪的DLSS 2幀率高出近25%,開啟DLSS 3後幀率差距更是能夠拉大到50%。

04/ 遊戲測試

首先在三款熱門的吃雞類FPS網遊中,耕升GeForce RTX 4070 踏雪均能滿足全高畫質2K 144Hz的電競幀率要求,對比RTX 3070 Ti也基本符合20%左右的理論提升幅度。

在以下三款以光柵化渲染為主的3A大作中,耕升GeForce RTX 4070 踏雪也都可以跑到100幀以上,另外對於支持DLSS 2超解析度的遊戲,開啟功能後幀率還能更進一步提升至144幀級別。

支持完整光線追蹤渲染的遊戲對性能有著更為嚴苛的要求,可以看到在不具備DLSS技術支持的情況下,耕升GeForce RTX 4070 踏雪在運行2K光追畫質時,大多很難達到60幀的流暢水準。

不過在開啟DLSS 3幀生成功能後,即便是原生2K下只有十幾幀的《傳送門RTX》也達到了2K60幀的流暢標準,部分遊戲甚至可以獲得超過100幀的表現。與此同時,在NVIDIA Reflex技術的加持下,遊戲在插幀過程中的畫面延遲甚至比原生還要更低。

相比起僅支持DLSS 2技術的RTX 3070 Ti而言,耕升GeForce RTX 4070 踏雪在DLSS 3下的幀率表現進一步拉開了差距,如在《賽博朋克:2077》當中近乎擁有翻倍的提升。

另外值得注意的是,RTX 3070 Ti的顯存容量僅有8GB,在光追重製版的《巫師3》全高畫質下疑似出現了爆顯存的情況,導致畫面幀率異常低,而擁有12GB顯存的RTX 4070則未出現這一問題。

05/ 直播及內容創作測試

除了遊戲以外,如今從遊戲主播、內容創作者,到視頻編輯、3D 建模和渲染等生產力工作,同樣離不開 GPU 的性能支持。

在渲染能力方面,我們先圍繞 V-Ray5 進行,在 CUDA和RTX兩個渲染場景中,耕升GeForce RTX 4070踏雪顯卡相對 GeForce RTX 3070 Ti 分別提升了17%和45%。

RTX系列顯卡的Tensor核心擁有強大的深度學習能力,可以高效完成AI繪圖創作。這次測試我們使用Satble Diffusion應用運行AI程序,繪製20張718*718高清圖片,並計算每分鐘生成的張數。結果顯示,RTX 4070平均每分鐘可生成9.3張圖片,對比RTX 3070 Ti效率也有32%的提升。

在視頻內容創作方面,GeForce RTX 40系列顯卡還首次加入了 AV1 雙編碼器。AV1 編碼是由英特爾、微軟、亞馬遜、谷歌、網飛等網絡巨頭組成的開放多媒體聯盟 AOMedia 所推出的免費編碼格式,在國內已經獲得了剪映Pro、嗶哩嗶哩、愛奇藝的支持。它的特點是能在相同文件體積下擁有更高清的畫質,或者相同清晰度的畫質下擁有更小的體積。在傳輸同樣質量的畫面時候AV1對比傳統H.264格式只需要大約70%的數據量。

AV1(左)和AVC(右)畫質對比

GeForce RTX 40系列顯卡是目前市面上為數不多可以支持硬體AV1渲染加速的GPU。視頻內容創作方面,在使用剪映Pro渲染同一段4K H.264視頻的任務中,耕升GeForce RTX 4070踏雪顯卡也比GeForce RTX 3070 Ti快了30%以上。實測渲染導出同一段AV1視頻,其效率對比不支持AV1編碼的RTX 30系列顯卡(僅採用CPU軟體編碼)效率高了4倍左右。

與此同時,AV1編碼也可以用於OBS直播推流,在相同的碼率和網絡帶寬下實現更高的畫質。對視頻主播而言,使用GeForce RTX系列顯卡支持的Broadcast工具還可以一鍵實現人像跟蹤、視頻去噪、噪音和回聲消除、消除/虛化背景等實用功能。

英偉達在近期推出了一項重磅更新——RTX Video Super Resolution,這一項功能翻譯過來就是視頻超解析度技術,簡稱VSR。它可以允許用戶在播放視頻時,以GPU配備的Tensor Core以及強悍的AI算力來進行內容的計算,從而提升畫面解析度,帶來至高4K解析度視頻輸出,為用戶帶來視頻觀感的提升。

VSR功能目前可在30/40系列顯卡上進行開啟,用戶能在英偉達控制面板內開啟這一項功能的使用,其在70級別以上顯卡提供了4檔的VSR增強選項可供調整。這一項VSR功能可在Google Chrome(110.0.5481.105版本以上)或者Microsoft Edge(110.0.1587.56版本以上)播放視頻時進行調用。

我們也採用RTX 4070顯卡對英偉達推出的VSR功能進行了實際的體驗,首先選取的是在網頁上播放480P的經典動畫《貓和老鼠》,這一動畫由於成片年代較早,因此畫面在4K解析度螢幕上的播放存在許多瑕疵。而通過開啟VSR進行增強後,畫面的細節有了明顯的改善,並且畫面的噪點有了明顯的降低。在這裡我們也通過截取同一幀畫面,通過英偉達ICAT進行畫面對比,方便各位感受到VSR 帶來的畫面效果提升。

左480P原生畫面,右 480P RTX VSR 4X畫面

左480P原生畫面,右 480P RTX VSR 4X畫面

除了在網頁端可以進行VSR的調用外,英偉達也在和不少的本地播放器進行合作,讓用戶在本地播放器也可以體驗到VSR功能帶來的提升。比如知名的開源播放軟體VLC將會提供到VSR的功能支持,而我們也是提前拿到了VLC的內部測試版本進行了本地VSR播放的體驗。

在通過VLC本地播放《少女與戰車》720P畫面時,我們截取關閉與開啟VSR功能的畫面,通過ICAT進行了A/B畫面對比。從對比中可看到,在VLC播放時開啟VSR功能後,畫面的噪點被進行了明顯的壓制,並且畫面的線條整體更為銳利清晰,對於觀感加成不少。

左720P原生畫面,右 720P RTX VSR 4X畫面

左720P原生畫面,右 720P VSR 4X畫面

06/ 功耗與散熱表現

耕升GeForce RTX 4070 踏雪在Time Spy壓力測試中,以99.7%的成績通過了測試,穩定性表現優異。

FurMark 30分鐘烤機測試中,耕升GeForce RTX 4070 踏雪的顯卡功耗穩定在215W左右,核心溫度63.5°C,顯存溫度52°C,散熱性能相當不錯,此時風扇轉速約為1800轉。

值得注意的是,215W只是這張顯卡的功耗上限,除了極限的烤機場景外,實際遊戲中即使滿載運行也往往達不到這麼高,大多數情況下都運行在200W以內。

也就是說,RTX 4070在遊戲幀率顯著提高的情況下,功耗相比RTX 3070 Ti還降低了近30%,足見其能耗比的優勢顯著。

07/ 總結

對於目前廣大正在使用2K螢幕的用戶而言,RTX 4070不僅能提供穩定的144+電競遊戲幀率,而且在全新DLSS 3技術的加持下,光追遊戲能夠獲得百幀的體驗,相比同等畫質只有60幀左右的及格水準的RTX 3070 Ti,流暢度可以說是有了質的飛躍。

同時,新卡在視頻渲染、3D、AI等生產力項目中,也能帶來相當明顯的效率提升,綜合來說無疑比目前價位近似RTX 3070 Ti、RTX 3080都更加值得選購。

而耕升GeForce RTX 4070 踏雪作為一款定位持平起售價的非公版顯卡,不僅擁有強勁的散熱,還給玩家帶來了素雅的純白配色以及5V RGB燈效,性價比相當不錯。並且值得稱道的是,它也充分地利用了這一代顯卡低功耗的優勢,採用了兼容性更佳的雙槽設計,適合更多玩家裝機時選擇。

文章來源: https://twgreatdaily.com/zh-hk/1fc0ec412d2293c9a1772ff48eb0a4f6.html