北京時間1月4號晚上10點,NVIDIA解禁了RTX4070Ti顯卡的性能表現。作為RTX40系列的第三款顯卡,RTX4070Ti到底具備怎樣的性能表現呢?本篇文章筆者便為大家揭曉。
此次首發評測,筆者選用的RTX4070Ti顯卡為影馳RTX4070Ti星曜OC,它採用了醒目的白色雅致外觀配色,配合ARGB炫彩燈效,適合打造個性化的電腦主機。
此外,這款影馳RTX4070Ti星曜OC還是一款高頻版顯卡,頻率更高,性能自然更強悍。再加上全新的星卓 III 散熱系統,保障了這款顯卡出色的性能發揮。個性、高頻、散熱,這就是影馳RTX4070Ti星曜OC的優勢所在。
全新的Ada Lovelace架構與RTX4070Ti
RTX40系列顯卡基於英偉達新一代的Ada Lovelace架構設計。為了讓大家更好地了解到這一顯卡的升級,筆者首先會對Ada Lovelace架構以及所支持的一些重要技術進行介紹。
(一) Ada Lovelace架構核心
(Ada Lovelace架構核心)
(完整規格的AD102顯示核心,具備144組SM單元)
(Ada Lovelace架構核心GPC單元)
Ada Lovelace架構核心配備了全新的第三代RT Core(光線追蹤核心)、第四代Tensor Core(張量核心)以及SM(流式多處理器)。根據NVIDIA官方的介紹,Ada Lovelace架構核心所採用的第3代RT Core不僅將光線與三角形求交性能提高了一倍,還將RT-TFLOP峰值性能提高了一倍之多。第3代RT Core還配備了全新的Opacity Micromap (OMM)引擎和Displaced Micro-Mesh (DMM)引擎,進一步提升了光追計算的性能以及減少計算開銷,帶來了更好的光線追蹤效果表現。Ada Lovelace架構核心配備的第四代Tensor Core引入了來自專業級H100數據中心GPU的FP8 Transformer引擎帶來了更加強悍的AI算力。
(第三代RT Core結構示意圖,相比前代,增加了2個功能)
Ada Lovelace架構核心在SM單元上引入了Shader Execution Reordering(SER著色器執行重排序)技術來更好的對於著色器的工作進行調度排序,在使用上可以根據不同的負載需求來執行渲染,可對負載較為統一的畫面進行渲染,降低工作開銷。根據英偉達官方的介紹,這一個SER功能將作為API開放給開發者使用。英偉達官方宣稱,SER功能的加入至高可帶來兩倍RT Core性能上的改善,對於光追遊戲來說更可帶來體驗的升級。根據NVIDIA官方的數據,全新的SM(流式單元處理器)可帶來至高兩倍的性能以及能效升級,這一項升級不可謂不小。
(Ada Lovelace架構核心SM結構圖)
Ada Lovelace架構核心除了第三代RT Core(光線追蹤核心)、第四代Tensor Core(張量核心)以及SM(流式多處理器)的升級以外,帶來了全新的第八代NVENC雙硬體編碼器,這一全新的第八代NVENC雙硬體編碼器整合了對AV1視頻編碼格式的支持,可以在傳統的H.264等格式之外,加入了對AV1這一主流新標準的支持,可以進行對於AV1格式的編碼與解碼,有效提升了生產力方面的表現,對於創作型用戶、遊戲主播等群體來說更是如虎添翼。來自NVIDIA官方的數據顯示,第八代NVENC雙硬體編碼器在AV1的效率上比H.264編碼器的效率提高了40%,這一提升非常明顯。
而除了核心上的升級以外,Ada Lovelace架構核心還大幅度提升了其L2緩存,完成版的Ada Lovelace架構核心(AD102)擁有96MB的L2緩存,大容量的L2緩存帶來了數據命中率的有效提升。在現階段顯存帶寬提升有效的情況下,通過升級更大容量的L2緩存,可以進一步提升數據命中表現,帶來性能方面的升級,根據NVIDIA官方的說法,大容量L2緩存的加入為GPU的一系列操作到帶來了更高的收益,尤其是在光線追蹤等場景下,表現更為明顯。
(二) DLSS 3與NVIDIA Reflex
Ada Lovelace架構的一系列升級還帶來了全新的DLSS 3技術的獨占以及NVIDIA Reflex方面的體驗提升。
DLSS 3包含有DLSS 2(DLSS超解析度技術),以及全新加入的DLSS幀生成技術,這一項DLSS幀生成技術依託於Ada Lovelace架構的獨立光流處理器以及Tensor Core的AI算力。在一項技術在運行過程中,其通過光流處理器所得到的一系列數據後,以光流加速技術(Optical Flow Acceleration,簡稱為OFA)來生成畫面信息,而AI算力則負責來對畫面進行進一步的優化,從而在遊戲中加入了更多的幀畫面,進行幀數的提升。
DLSS 3可直接生成遊戲第1幀3/4的像素以及整個遊戲第2幀,相當於使用1/8的算力,就完成了整個計算過程,而通過這一個流程的循環,可在提升幀數的同時節省資源開銷,進一步帶來更好遊戲體驗。
而在DLSS 3的幀生成技術上,由於可能帶來延遲的增加,因此DLSS 3在使用上也將通過整合NVIDIA Reflex這一技術來降低渲染以及操作的延遲。而根據NVIDIA官方的說法,DLSS 3通過整合NVIDIA Reflex以及一系列的技術,可以使得遊戲體驗擁有媲美甚至是超越原生級的渲染、操作體驗。
(三) 40系顯卡第三彈——RTX4070Ti
(RTX4070Ti顯示核心架構圖,具備60組SM單元)
RTX4070Ti採用的是AD104-400顯示核心,擁有7680個CUDA核心。此外,RTX4070Ti還搭配12GB容量、192bit位寬的GDDR6X顯存。
CUDA核心數量不到RTX4090的一半,並且還是192bit位寬的顯存,這兩點都是近期玩家們熱議的話題。
影馳RTX4070Ti星曜OC的Boost默認設置為2685MHz,相比RTX4070Ti創始人版的2610MHz高出了75MHz。
影馳RTX4070Ti星曜OC顯卡欣賞
影馳RTX4070Ti星曜OC採用了近乎純白色的外觀設計,配合其水晶質感的透明上蓋,在外觀上非常具有個性,帶來了很不錯的視覺觀感。
這款顯卡採用了透明的可拆卸上蓋,其上蓋在四周邊緣和風扇的周圍採用了鑽石切割的外形設計,在視覺上呈現光線折射效果。在上蓋的大部分區域,這款顯卡是採用了平整的處理,方便用戶進行對外觀進行個性化的操作。
這款顯卡採用的透明上蓋可以支持拆卸,拆卸後會展現純白的外殼,用戶可以通過個性化的DIY 設計,打造個人專屬外觀。
這款顯卡在顯卡的頂部配備有logo燈,logo燈支持多種燈效,並且採用了多重反射的處理,打造了極具科技感的燈光效果。
這款顯卡除了頂部的燈光外,還在風扇部位配備了RGB燈光,燈效可透過靜霜扇葉。其風扇支持智能啟停,在風扇轉動時可以帶來更加出色的視覺效果。這款顯卡的燈效也支持到幾大廠商的5V RGB燈光同步,並且還配備有「負能量」檢測系統,在發生故障的時候會有不同的燈光效果出現。
影馳RTX4070Ti星曜OC配備了一體壓鑄的金屬背板。這一塊背板採用了近乎純白的設計,觀感十分不錯。這一塊金屬背板可以對於顯卡起到一定的支撐作用,並且其通過尾部的大面積鏤空設計,進一步輔助熱量有效導出。
影馳RTX4070Ti星曜OC為三槽寬度,配備的輸出接口為3個DP 1.4a以及1個HDMI 2.1。
顯卡供電接口為12VHPWR接口。玩家在裝機時一定要接上這部分的供電線纜。
全新的星卓 III 散熱系統,這一套散熱系統在顯卡的正面是配備了3個直徑102mm的風扇,風扇採用了經過特殊設計的11片靜霜扇葉,可帶來風力和風量上的提升。
這款顯卡的PCB並不長。通過對比明顯能夠看出散熱器和背板比PCB長出很多。
這款顯卡所採用的星卓III散熱系統配備有7根鍍鎳復合熱管,並且通過大面積的均熱板和鰭片來進一步導出熱量。
畢竟是高端顯卡,影馳RTX4070Ti星曜OC的供電設計依舊強悍。GPU左右周圍共設計了16相供電,搭配全封閉式電感、固態電容等高品質元器件,用料值得信賴。
全新的AD104-400顯示核心,晶片面積為294.5平方毫米,看上去尺寸比較小。
顯存是來自美光的GDDR6X,單顆2GB容量。這款顯卡PCB正面共設計有6顆顯存,組建了12GB顯存容量。
這款系列還配備了一根帶有RGB燈光效果的顯卡支架,方便用戶對於顯卡進行支撐。
測試平台介紹
筆者組建了一套性能出色的13代酷睿i5測試平台,用來測試顯卡的性能。為了對比影馳RTX4070Ti星曜OC的性能,筆者此次測試還加入RTX4080以及上一代卡皇RTX3090Ti的成績。
此次測試所選用的這款RTX4080是一款非公版顯卡,其GPU頻率為2205MHz,Boost頻率為2565MHz,顯存頻率為1400MHz(等效22400MHz)。
此次測試所選用的這款RTX3090Ti是一款非公版顯卡,其GPU頻率為1560MHz,Boost頻率為1890MHz,顯存頻率為1313MHz(等效21008MHz)。
英特爾13代酷睿處理器搭配RTX40系列獨立顯卡是支持Resizable BAR技術的。為了充分發揮影馳RTX4070Ti星曜OC顯卡的性能表現,以下測試環節均是在Resizable BAR開啟狀態下進行的。
DLSS 3是RTX40系列顯卡帶來的全新技術,在維持高畫質的情況下也可以實現更為流暢的遊戲表現,這也讓玩家可以更好的享受4K光追遊戲帶來的出色畫質體驗。為了更好的感受RTX40系列顯卡在遊戲方面的升級,我們在測試RTX40系列顯卡時特意選擇了愛攻&保時捷(Porsche Design)聯合設計的PD32M顯示器。
這款顯示器為31.5英寸,採用MIni LED背光技術,擁有1152個獨立分區,擁有1600尼特峰值亮度,8000萬:1動態對比度,並通過HDR1400認證,在畫質上有著更為出色的表現。此外,PD32M擁有4K解析度以及144Hz的刷新率,支持97%DCI-P3色域以及99% Adobe RGB覆蓋,並且擁有HDMI 2.1接口,是一款旗艦級電競顯示器。
俗話說好馬配好鞍,此次測試平台的主板部分,筆者選用的是華碩ROG MAXIMUS Z790 HERO。華碩ROG新一代Z790主板採用了高效整合的供電設計,以及全方位散熱及解決方案,同時還擁有全新的AEMP 2.0、AI智能優化和EZ DIY貼心設計,帶來更強的性能、更智能的優化和更好的裝機體驗。
遊戲性能測試
(一) 3DMark基準測試
讓我們先來瞧瞧影馳RTX4070Ti星曜OC在3DMark基準測試當中的表現。性能到底有多強,大家一看便知。
在3DMark測試項目中,這款RTX4070Ti與上一代卡皇RTX3090Ti互有勝負。
(二) DLSS 3基準測試
3DMark基準測試新增加了DLSS功能測試(DLSS 3)。
根據實測來看,在開啟DLSS 3之後,RTX40系列顯卡實現了巨大的FPS提升。
(三) DLSS 3遊戲實測
目前已有《賽博朋克2077》、《逆水寒》、《瘟疫傳說:安魂曲》、《光明記憶:無線》、《生死輪迴》等熱門遊戲大作支持DLSS 3技術。此次DLSS 3遊戲實測,筆者將利用《賽博朋克2077》、《瘟疫傳說:安魂曲》等4款遊戲進行測試。注意,《賽博朋克2077》的DLSS 3版本目前均處於測試階段,進行測試的話需要下載NVIDIA提供的測試版遊戲。
DLSS 3遊戲測試版——《賽博朋克2077》
DLSS 3遊戲——《瘟疫傳說:安魂曲》
DLSS 3遊戲——《巫師3:狂獵》
DLSS 3遊戲——《傳送門:光追版》
通過上述4款DLSS 3遊戲來看,DLSS 3技術為RTX40系列顯卡帶來的遊戲幀數提升是巨大的。
(四) 其它遊戲實測
接下來,筆者再測試一些非DLSS 3遊戲。
遊戲實測——《地鐵:離去》
遊戲實測——《刺客信條:奧德賽》
遊戲實測——《戰爭機器5》
遊戲實測——《幽靈行動:荒野》
遊戲實測——《古墓麗影:暗影》
遊戲實測——《無主之地3》
非DLSS遊戲中,款RTX4070Ti與上一代卡皇RTX3090Ti依舊互有勝負。
生產力性能測試
(一) AV1硬體加速編解碼測試
為什麼AV1編解碼技術越來越受歡迎?理由很簡單,採用AV1編解碼的視頻能夠以更低的碼率,實現其它主流編解碼視頻相同的畫質。說白了,在視頻畫質相同的情況下,採用AV1編解碼的視頻文件體積會更小,以至於能夠為視頻創作者們節省大量的硬碟空間。
目前萬興喵影、達文西等視頻軟體已可支持AV1硬體加速編/解碼功能。接下來筆者利用達文西這款軟體,將一部12GB容量的4K視頻,利用N卡AV1硬體加速編解碼導出一部MP4視頻。
最終,RTX4070Ti和RTX4080的加速效果都是相當快的。
(二) H.265硬體加速編解碼測試
繼續利用達文西這款軟體,將一部12GB容量的4K視頻,利用H.265編解碼導出一部MP4視頻。此項測試對比了RTX3090Ti的成績。
相比上代卡皇RTX3090Ti,RTX4070Ti和RTX4080的加速效果都是要更快的。
散熱器測試
(註:筆者所處的室溫維持在26℃)
利用FurMark,筆者將對影馳RTX4070Ti星曜OC顯卡進行壓力測試。
通過10分鐘的烤機,默認頻率下滿載時GPU溫度穩定在約64℃,GPU頻率穩定在約2730MHz。散熱器運行靜音效果也不錯。
全文總結
在DLSS 3技術的加持下,RTX4070Ti的遊戲性能是要明顯優於上代卡皇RTX3090Ti的。同時,藉助DLSS 3技術,全新的RTX4070Ti在不少DLSS 3遊戲當中已可實現超過2K 144Hz的性能表現。可以說配合2K 144Hz遊戲顯示器使用,RTX4070Ti已非常合適。
作為本文的主角,影馳RTX4070Ti星曜OC散熱非常給力。同時,這款顯卡的顏值也是相當出眾,白色雅致外觀配色,非常適合搭配白色機箱使用。再加上這款顯卡炫酷的ARGB燈效,堪稱是一款很炫又很給力的遊戲硬裝,相當值得廣大高端玩家們關注。
好了,此次評測就寫到這裡了,希望大家喜歡。