技嘉 GeForce RTX 4070 MASTER顯卡評測:中端顯卡的頂級之作

2023-05-15     太平洋電腦網

原標題:技嘉 GeForce RTX 4070 MASTER顯卡評測:中端顯卡的頂級之作

寫在開頭

RTX 40系顯卡的推出後,強勁的性能、極致的功耗比無疑是給遊戲玩家打了一針強心劑,不過老大哥RTX 4090、RTX 4080甚至RTX 4070 Ti過高的售價讓遊戲玩家望而卻步。為了讓更多玩家用上既有強勁性能又能維持合理價格的顯卡,老黃終於掏出了全新的GeForce RTX 4070顯卡,新顯卡兼具更高的性能、更低的價格,相信會成為更多硬核玩家的首選。

技嘉作為NVIDIA最重要的AIC廠商之一,也在第一時間推出了多款RTX 4070顯卡,它們的配色、設計等各有側重。此次我們收到的是其中的頂級旗艦——技嘉GeForce RTX 4070 MASTER,眾所周知MASTER作為技嘉的旗艦產品,做工、用料等方面都是頂級中的頂級,這次的產品更是一如既往的豪華。閒言少敘,我們一起見證這張頂級用料的RTX 4070顯卡能夠帶來怎樣的表現。

*下文「技嘉 GeForce RTX 4070 MASTER 12GB」簡稱為「技嘉RTX 4070 MASTER」

規格對比

在開始測試前,我們先了解一下技嘉RTX 4070 MASTER的配置,首當其衝的自然是顯卡的「心臟」——AD104核心,在RTX 4070 Ti首發測試時我們知道,那上面搭載的才是完整版的AD104核心,而RTX 4070上的這顆則是閹割版。

從下圖可以看到,完整的AD104核心應該包括5個GPC(圖形處理集群)、30個TPC(紋理處理集群)、60個SM(流式多處理器)以及一個帶有6個32Bit顯存控制器的256Bit顯存帶寬。

而RTX 4070上的這顆AD104核心則只有4個GPC(圖形處理集群),其中1個GPC也是經過閹割的、另外還有23個TPC(紋理處理集群)、46個SM(流式多處理器)以及一個帶有6個32Bit顯存控制器的256Bit顯存帶寬。二級緩存部分也與RTX 4070 Ti有細微差距,RTX 4070 Ti為48MB的二級緩存,而RTX 4070則是36MB,不過相比起前代的RTX 3070或RTX 3070 Ti的4MB二級緩存,可以是降維打擊了。

除此之外,技嘉RTX 4070 MASTER上的這顆AD104核心被命名為AD104-250-A1,TSMC 4N工藝製造,晶片面積為295平方毫米,雖然不及上代的面積大,但因為工藝製程的進步,技嘉RTX 4070 MASTER上的這顆AD104內塞下了更多的電晶體,足足有358億之多,並且頻率上也往前邁進了300MHz以上,可以說是全方位的領先。

其他參數也是堆料十足,5888個CUDA,46個第三代RTX Cores,184個第四代Tensor Cores,並且用上了12GB的GDDR6X顯存,相比上代的提升還是很明顯的,大顯存配合性能上的提升更可以為遊戲以及創作者帶來更好的使用體驗。

外觀賞析

千呼萬喚始出來,技嘉RTX 4070 MASTER的外觀還是家族式的味道,正面用上了磨砂、線條以及切割紋理三種工藝,硬朗的設計風格無時無刻彰顯了這張顯卡的高級感與設計感。

正面最吸睛的莫過於3個108mm 的AORUS鯊魚仿生風扇,左右兩個以逆時針旋轉、中央風扇順時針旋轉,藉此降低三扇擾流,帶給散熱器更多的散熱氣流。黑色一體的設計也讓顯卡顏值別具一格。

值得一提的是新的仿生鯊魚風扇還在扇葉表面進行了創新,如同鯊魚皮膚上盾鱗一樣的紋理設計,不僅外觀顏值更為炫酷,還實現了3dB的噪音下降和30%的風壓提升,這也讓筆者對它的散熱充滿期待。

技嘉RTX 4070 MASTER的背板則是金屬材質,這與大多數顯卡設計一致,不過值得一提的是,銀色的金屬拉絲與灰色的磨砂設計融於一體,中央位置還有一個可發光的「AORUS」品牌印記,質感拉滿。

背板上還有鏤空的鱗片散熱窗口,空氣可以更快速的通過內部,與正面三個強勁的仿生鯊魚散熱風扇配合,助力顯卡高效散熱。

換個角度觀察這張顯卡,頂部是一整排的出風口,橫跨整個顯卡頂部,加速熱量排出。出風口的旁邊則是標誌性的12VHPWR接口,單口即可擁有600W的澎湃動力,應付RTX 4070 MASTER是絕對足夠的。

抽絲剝繭,在這個供電接口的背後還有R22電容坐鎮,為顯卡提供更穩定的電量支持,這也是技嘉RTX 4070 MASTER能夠滿血輸出的重要支持之一。

眼尖的玩家可能發現了,在電源的底下還有雙BIOS的控制開關,並且在背板上印上了OC模式和SILENT模式的標識,用戶一鍵即可切換,隨時感受咆哮的性能與安靜的環境。

除此之外,顯卡在散熱器系統裡面還搭載了經典的「三環燈」RGB彩燈系統以及搭載了印有「AORUS」的燈牌,彩燈系統可以通過燈效軟體可以實現多種同步的燈光效果呈現,玩法十分豐富,打造專屬於你的技嘉顯卡。

而燈牌則支持RGB燈效,能夠與主板上其他的硬體同步燈效,一致的燈效在視覺效果上更加震撼,給這張顯卡的顏值又增添了濃墨重彩的一筆。

當然不止正面能亮,背面一樣有RGB加持,印有「AORUS」的裝飾條在顯卡點亮後也開始閃耀起來,與正面璀璨奪目的RGB燈效交相輝映。

視頻接口方面,技嘉也是毫不吝嗇,給它配備了3個DP1.4a和1個HDMI2.1,支持4屏顯示或最高8K@60Hz的超清輸出。

總的來說,這張技嘉RTX 4070 MASTER顯卡不僅顏值出眾,配置更是「重量級」,中端級的顯卡但卻有著高端顯卡才有的待遇,其他RTX 4070放在它隔壁都略顯遜色,不得不說初上手這張顯卡時,就愛不釋手,這才是頂級非公應有的表現。

顯卡拆解

顯卡拆解也是評測不可或缺的一部分,擰下金屬背板上的多顆螺絲後,PCB就可以跟散熱系統分離了,整體拆解難度不大。從這張圖可以看到技嘉上用到的這個散熱系統堪稱巨大,想必它的散熱效能也是一流的水平。

首先看看PCB的正面,PCB上的接口、供電、核心、顯存,以及輔助供電位置都相當的合理且規正,有大廠出品的質感,內部PCB電路使用了全自動製程技術,精密自動化製程可進一步提高可靠性,並且PCB也支持三防保護,將防護性拉滿了,讓PCB更持久耐用。

PCB的背面主要是一些控制晶片,相比正面要簡潔不少,不過從背面依然可以看到核心上安排了POSCAP(導電聚合物鉭電容),有助於提升顯卡的電氣性能。

PCB上的主角永遠是這顆性能強勁的「心臟」——AD104-250-A1核心,TSMC 4N工藝打造,295mm2的晶片面積內塞下了5888個CUDA 核心,同時內部還有46個第三代RTX Cores,184個第四代Tensor Cores以及36MB的L2緩存,性能強勁不言而喻。

核心的四周就是NVIDIA與美光獨家研製的GDDR6X顯存,足足有6顆,型號是3CU47 D8BZC,單顆顯存容量為2GB,6顆顯存共組成12GB。要知道上代的RTX 3070也只給了8GB,現在給到了12GB,大顯存給你更極致的體驗。

供電規模也是Top的級別,足足有12相,要知道這個配置基本是RTX 4070中的天花板級別了。12相供電中有10相是核心供電,足以支撐AD104核心的強悍性能,剩餘2相則是顯存供電。

而且每相供電都有提供過溫保護設計和負載平衡,再加上長壽命固態電容、合金電感、2oz銅PCB與低電阻式電晶體等耐久用料,提供強勁的顯卡性能和更長的使用壽命。

繼續探索,每相供電均採用獨立的DrMos晶片,型號為SiC653A,每相最大可承載50A的持續電流。

甚至就連顯存供電也用上了SiC653A,與核心供電同等規格,可見堆料之豪華。

PWM供電晶片則被安排在PCB背面,型號為uP9512R,是我們的老熟人了,其可用於管理核心供電。

在不遠處還有一顆uP9529Q晶片,它的作用就是管理顯存供電,而uS5650Q則擔任電壓/電流/功耗監控的工作,同樣是不可或缺的晶片之一。

PCB上還有不少不起眼的晶片,但卻肩負著「重大使命」,其中就有雙BIOS的控制晶片,型號為IS25WP016。

而HT32F52352晶片則是來自合泰,它是顯卡的RGB控制晶片,你所見到的炫酷燈光就是它的功勞。

看完了密密麻麻的PCB電路板,一起見識一下「風之力散熱系統」,感受極致的散熱效能。拆下風扇和散熱器後,可以看到技嘉RTX 4070 MASTER的散熱器本體,這一代的散熱器相當龐大,不僅能夠給GPU散熱,還為顯存、電感以及MOS管等進行散熱。

在顯存和供電部分都配上了高係數的導熱墊輔助散熱,GPU核心也抹上了厚厚的矽脂,顯存位置更是緊貼均熱板,超高的散熱效能助力這一代顯卡強勁的性能釋放。

散熱器本體為兩段式散熱模塊,左邊是龐大的均熱板,右邊是密密麻麻的散熱鰭片。

從側面可以看到兩邊的散熱鰭片均增大了面積,並且採用彎角造型,進一步增大了鰭片與空氣的接觸面積,最大化熱量的快速散出。

更恐怖的是,技嘉RTX 4070 MASTER的散熱系統還配備了9根復合式熱管,超規格的配置讓散熱效能更進一步。

這9根復合式熱管更是貫穿整個散熱器,緊貼均熱板與散熱鰭片,這樣的夾心設計搭配回流焊接工藝加持保證高效導熱。

從這個角度能看到散熱鰭片的厚度同樣驚人,不得不說技嘉在「風之力散熱系統」上下足了血本,因此它的散熱效能無需擔心。

主動散熱部分,散熱器上配備的是3個108mm的仿生鯊魚風扇,經過升級後,啟用雙滾珠軸承且支持3D啟停,因此這三把風扇在提升風流量的同時還能減低聲噪,更高速有效地散熱,輕鬆應對RTX 4070。

最後來一張全家福,技嘉RTX 4070 MASTER的堆料可以用豪華來形容,與老大哥同款的散熱配置,完全有充足的餘量供玩家發揮,這也讓筆者對它的超頻充滿期待。

測試平台介紹

首先介紹一下本次的測試平台,我們用上了評測室的最強硬體,使用的是目前的旗艦—— i9-13900KS處理器,主板為同款的Z790超級雕主板,雙鵰組合才能迸發最強戰力。當然也是給到了頂配,輔以金士頓32GB DDR5-6000高規格內存,確保這張能夠釋放全部性能。

測試平台方面我們已經祭出了目前地表最強的硬體,那拿來襯這張顯卡的顯示器自然也不能弱,用的是技嘉旗下的M28U顯示器。你可不要小看這個顯示器,雖然它外觀上低調內斂,但內在配置堪稱頂級,4K@144Hz的高刷和SS IPS面板,絲般順滑暢享市面上的3A遊戲;3個高色域容積和平均0.52的色准表現驚艷眾人,現在它已經成為筆者日常修圖、看資訊、看視頻的主力顯示器。

新顯卡新電源!介紹一下本次的「硬實力」擔當——技嘉UD1000GM PCIe 5.0電源,基於主動式PFC + 半橋LLC諧振拓撲 + 同步整流 + DC-DC結構打造。額定功率更是達到了1000W,全模組接口設計方便安裝,並且通過了80Plus金牌認證,兼具高性能與高穩定。

當然技嘉UD1000GM PCIe 5.0電源的特色就是提供了原生的+12VHPWR接口,因此只需要使用1個模組接口就能提供600W的輸出功率。用它來帶這張不足300W TDP的技嘉RTX 4070 MASTER可以說是綽綽有餘了。

看完了我們的裝備,就該研究一下這張全新的技嘉RTX 4070 MASTER顯卡了。通過GPU-Z看看顯卡的規格參數,這張顯卡的加速頻率會比公版高一些,達到了驚人的 2595MHz,甚至比不少帶OC後綴的RTX 4070還要激進,可見技嘉對這張RTX 4070 MASTER信心十足。

其他配置方面,該顯卡擁有5888個CUDA單元,12GB GDDR6X顯存,192bit顯存位寬。TGP更加恐怖,足足350W!溫度牆也跟RTX 4080為同一水平線的88℃,橫豎都看出了這張顯卡的不一般,技嘉顯然是給超頻玩家預留了足夠的空間,想讓發燒友在這張中端卡上也能一顯身手。

理論性能測試

作為專業面向顯卡性能測試的軟體,3DMark的測試是有非常標誌性的作用。在3DMark測試中各個細分測試項目裡面,技嘉 RTX 4070 MASTER顯卡的性能表現非常出色,可以全面體現出高頻版本RTX 4070顯卡所具備的性能水平。

特別是加入了公版RTX 2070 Super、RTX 3070Ti和RTX 3070作為參照後,這張新顯卡的優勢盡顯,不論是在常規的顯卡性能測試,還是設計DLSS功能的性能表現,其成績數據體現了要全面優於上一代RTX 30系列,理論性能表現是RTX 3070的1.3倍,約為RTX 3070 Ti的1.2倍。

而在GPGPU理論性能測試方面,擁有Ada Lovalace架構的RTX 40系列顯卡在算力上也有出色的性能表現,尤其是單精度和雙精度浮點運算上,提升幅度是最大的。技嘉RTX 4070 MASTER相比RTX 3070 Ti顯卡有著巨幅提升,領先幅度足足有40%以上,整體性能也是RTX 3070的1.5倍左右。

遊戲性能測試

總算來到遊戲玩家期待已久的遊戲測試環節了,先看看1080P下的成績,技嘉RTX 4070 MASTER一騎絕塵,不少遊戲都超過了150 FPS以上,要知道這還是只是開啟DLSS 2的情況,如果搭配老黃的獨門秘技DLSS 3一起使用,這個成績還將有翻倍的提升。更直觀的對比下,這張新顯卡對比RTX 2070 Super,幀數幾乎是翻倍的提升,即便是面對上一代的RTX 3070或RTX 3070 Ti,在DLSS 2下已經有30+ FPS的差距了。

2K解析度就是技嘉RTX 4070 MASTER的主戰場了,大部分遊戲依舊有120 FPS以上的水平。像優化極佳的《地平線5》,這張顯卡的幀數去到了152 FPS!當然30系的兩款70級顯卡也能玩,不過換裝技嘉RTX 4070 MASTER後你可以體驗2K高幀甚至高刷的遊戲體驗,開啟DLSS 3後,性能差距更甚,這是兩張30系顯卡所無法比擬的。

實測下來,技嘉RTX 4070 MASTER不負2K高幀遊戲顯卡的稱號,尤其是隨著解析度的提升,部分光線追蹤能力要求更高的遊戲提升就越為明顯。整體性能領先上代70級足足有26%以上,即使是面對自家的RTX 4070 Ti也絲毫不虛,性能差距較小,但售價更低,無疑性價比相當突出,可以說是最值得購買的2K遊戲顯卡。

DLSS 3性能測試

DLSS可以說是AI時代最具革命性的突破,隨著DLSS的更新,現在已經發展到了3.0時代。全新的DLSS 3技術不僅可以大幅提升幀率,還可以讓系統延遲大大降低,生成的畫面更是足以媲美甚至超越原始渲染的效果。我們也是準備了一系列的測試驗證DLSS究竟有沒有老黃說得那麼神。

3DMark DLSS 3性能測試

在3DMark的DLSS 3測試中,技嘉RTX 4070 MASTER僅開啟DLSS 2的情況下就已經能夠實現2K@120Hz,4K@60Hz的遊戲體驗了;如果開啟DLSS 3後,2K下幀數能夠上升至130FPS,4K畫質下也能勉強體驗90Hz的高刷效果,這樣的表現完全可以稱它是2K高幀遊戲神卡了。

《微軟模擬飛行》遊戲實測

光測試理論性能肯定是不夠的,現在支持DLSS 3的遊戲已經上升至50款,因此我們也選用了一些熱門遊戲進行詳細測試。在對硬體要求頗高的《微軟模擬飛行》中,技嘉RTX 4070 MASTER開啟DLSS 3後對RTX 3070 Ti簡直是降維打擊,1080P解析度下幾乎是2倍的幀數提升,2K解析度下也比RTX 3070 Ti高出60多 FPS。另外值得稱讚的還有技嘉RTX 4070 MASTER僅用149W的功耗就實現了2倍於RTX 2070 Super的性能!這波Ada Lovelace架構與TSMC 4N工藝功不可沒。

在其他幾款遊戲中也是如此,技嘉RTX 4070 MASTER在開啟DLSS 3後,遊戲幀數相比RTX 3070 Ti都有60%-70%左右的提升,不少項目更是有翻倍的幀數提升,並且功耗都更低,用更低的功耗實現更強的性能,這才是旗艦顯卡的獨到之處。

DLSS 3帶來的另一優勢是由於集成了NVIDIA Reflex,因此開啟DLSS 3之後,將會帶來更低的遊戲延遲,對MOBA、大逃殺或FPS類遊戲玩家來說,其意義也是非常重大的。

1080P解析度DLSS性能測試

例行慣例,先測技嘉RTX 4070 MASTER在1080P下的遊戲表現,實測這張顯卡在開啟DLSS 3後,遊戲性能直接是RTX 2070 Super的2倍有多!不少遊戲直接飆升至200+ FPS以上,面對上代的同門師弟,技嘉RTX 4070 MASTER領先RTX 3070 Ti 70%以上!可以說托DLSS 3的福,遊戲性能有了質的飛躍。

2K解析度DLSS性能測試

作為一張定位2K高幀的遊戲顯卡,那不得來一把2K解析度的遊戲測試,實測下來可以說這張顯卡確實對得起這個名號。在上面的遊戲測試中,技嘉RTX 4070 MASTER僅開啟DLSS 2的情況下,遊戲幀數僅領先上代30系的兩張70級顯卡20 FPS左右,而開啟DLSS 3後,上代顯卡可以說是看不見技嘉RTX 4070 MASTER的車尾燈了,領先幅度來到了驚人的50-60幀以上,如此性能讓它穩居2K高刷遊戲甜品顯卡的寶座。

我們也使用技嘉RTX 4070 MASTER在DLSS 2和DLSS 3兩種模式下測試了多款遊戲,從實測結果來看,DLSS 3確實有點東西,不少遊戲的幀數都有明顯提升,其中不乏一些遊戲有翻倍的性能提升。

當然不得不說的還是1% Low幀的提升,開啟DLSS 3後可以大幅提升1% Low幀,有的玩家可能不懂這其中的意思,換句話說就是有了DLSS 3,你在玩遊戲時能夠更穩定更絲滑,老黃的DLSS 3確實有點東西,不僅實現了性能翻倍,就連遊戲穩定性也能有所提升,確實真香。

4K解析度DLSS性能測試

雖然說這是一張定位2K 100+FPS遊戲級別的顯卡,但技嘉RTX 4070 MASTER仍是具備一定的4K遊戲能力,只要把DLSS 3一開,或者是把遊戲畫質降低一些,遊戲流暢度就直接上來了,跑個60+FPS不成問題。

RTX VSR測試

有些時候你是不是也會有這樣的煩惱,那些480P甚至360P的早期視頻清晰度不夠,看起來不夠清楚?現在這種煩惱將不再困擾你。NVIDIA帶來了視頻版的DLSS 3!正是前不久發布的RTX Video Super Resolution 視頻超解析度技術(RTX VSR),通過AI技術即可提高瀏覽器內的視頻的解析度,展現前所未有的顯示效果。

今天我們也測試了這項劃時代的RTX VSR技術,在RTX 30系和RTX 40系的NVIDIA控制面板中找到視頻圖像設置,手動開啟RTX Video enhancement即可啟用RTX VSR技術,其中分為1-4檔調節,數字越大質量越好。

實測環節,可以看到在開啟RTX VSR技術之後,原視頻里的人物線條由原本的模糊不清變得十分清晰銳利,並且隨著VSR級別的提高,清晰度逐級提升,甚至部分細節已經接近原生1080P了。

在暗部表現同樣如此,原視頻里地板如同劣質貼圖,有VSR加持後每塊磚頭都清晰可見,且立體感滿滿,尤其是旁邊綠色植被的清晰度更高了一個數量級。除此之外,RTX VSR技術的AI算法似乎還能夠通過類似DLSS幀生成的方式計算出物體的遠近關係優化景深效果,這一點同樣能夠使得畫面整體觀感得到提升。

這裡我們也給大家準備了對比視頻,從視頻里就可以看到VSR的效果之明顯,最高級別的VSR 4跟原生480P相比就是一眼的區別,在開啟RTX VSR技術後,部分圖像質量有了顯著提高,不僅鋸齒和噪點幾乎全部消失,顏色過渡也更為平滑,目前VSR能有這種表現堪稱驚艷。

當然你除了在瀏覽器能夠使用這項功能外,本地瀏覽器也能享受黑科技的魅力,VLC是目前首個支持RTX VSR技術的本地播放器,且能夠支持多種視頻格式播放。正式版也隨著RTX 4070的解禁上線了,你里的老視頻也能搖身一變成1080P了!

我們將瀏覽器中的視頻與本地的視頻同時進行RTX VSR 4檔渲染,從畫面上看,右側本地播放器的效果要弱於左側瀏覽器的,瀏覽器上的4檔VSR線條更銳利,畫質也更清晰,不過即使是本地播放器的效果也要遠強於原生480P,筆者猜測可能是目前本地瀏覽器的優化還不到位。

我們也將原生480P與瀏覽器和本地播放器上的VSR渲染視頻進行對比,從視頻畫面中可以看到,本地播放器上4檔VSR渲染過後,文字或線條都相比原生480P有一定提升,至少以前模糊不清的視頻可以看了,不過對比瀏覽器的效果還略有差距,後者的效果已經接近原生1080P了。

有用戶可能擔心功耗的問題,在VSR開啟最高檔4檔的情況下,技嘉RTX 4070 MASTER的功耗僅有24W左右,顯卡利用率也遠沒有網絡上傳得那麼高,在HWINFO64中可以看到顯卡全程利用率不過25%。

總的來說,技嘉RTX 4070 MASTER上的RTX VSR技術將為玩家和視頻觀看者帶來革命性的新體驗!無論是性能上還是技術上的創新,都稱得上是流媒體時代的革命!

創作性能測試

理論與遊戲上的性能提升已經足夠驚艷,在創作生產力上能否再續輝煌?我們選擇PugetBench、PCMark 10、UL Procyon等多款常見的測試軟體,來測試技嘉RTX 4070 MASTER在日常辦公、視頻內容生產方面的表現。

從實測結果中可以看到,PCMark10 Extended測試中,技嘉RTX 4070 MASTER在遊戲這個子項目上對比前代的RTX 3070與RTX 3070 Ti有明顯的優勢,領先幅度高達20%。這也跟上述遊戲性能測試結果相符,想像一下,2K高幀的遊戲體驗,更低的價格就能體驗DLSS 3,這難道不香嗎?

光看PCMark 10還不夠,在達文西測試中,這張技嘉RTX 4070 MASTER一度成為最大黑馬,反殺了自家老大哥RTX 4070 Ti。當然提到達文西測試就不得不提這款顯卡支持AV1編解碼,這是一項新技術,有了AV1的加持後,技嘉RTX 4070 MASTER的性能相比RTX 3070足足提升了38%,換裝新顯卡無疑能夠大幅提升你的工作效率!

再看看專業生產力部分,這裡的提升可以用離譜來形容!單是OC渲染器一項,技嘉RTX 4070 MASTER的渲染性能領先RTX 3070 Ti有50%之多,如果對比同代的RTX 3070,差距將拉大到60%!當然在Blender或V-Ray中,它的表現依舊不凡,整體領先幅度依舊達到了50%以上,說人話就是換裝這張新顯卡,你至少比別人快出一半的渲染時間,效率大幅提升。

NVIDIA編碼器測試

在上面剛提到的AV1編碼,它這不就來了。新的RTX 40系顯卡用上了新的NVIDIA編解碼器,其支持時下熱門的AV1編碼,作為下一代主流的視頻編碼技術有著自己獨特的優勢,更快的編碼速度和更高質量的流媒體傳輸性能,讓越來越多的剪輯軟體和視頻網站青睞於它,像我們熟悉的達文西、剪映、B站等已經支持AV1編解碼,未來AV1將會成為一個新趨勢。

為此我們也專門進行了測試,利用NVIDIA提供的8K片源與工程文件分別測試AV1格式和H.265格式下的編碼時間。並且此次測試還加入了20系與30系的三張卡,可以更直觀的看到啟用AV1編碼後,效率提升的明顯之處。實測同一段素材下,同樣使用H.265編碼,有編碼器的加持下,技嘉RTX 4070 MASTER的效率比RTX 3070快40%以上,如果使用AV1編碼,那效率會比H.264快50%。

值得一提的是AV1編碼不止導出速度更快,它的文件占用空間也比H.265要小,無論是4K解析度還是8K解析度,使用AV1編碼後,文件整體大小能夠降低25%以上。經過對比,AV1編碼的視頻在畫質上與H.265也沒有明顯差距,可以說AV1對戰H.265是全方位的領先,勢必會成為下一個最受歡迎的格式。

AI運算能力測試

AI作為當今備受矚目的創新,它的出現極大提高了無數工作者的效率,像AI作畫、AI生成、AI聊天等產品接踵而至,AI從四面八方滲透進了我們的日常生活。相信已經有不少玩家摩拳擦掌,想要體驗AI的強大之處,奈何自己手上的顯卡性能不足以支撐AI所需的高強度運算,不如看看技嘉RTX 4070 MASTER,畢竟AI可是老黃的又一獨門秘技,換裝這個顯卡或許會有神秘加成。

首先我們對技嘉RTX 4070 MASTER顯卡進行AI運算能力測試,在使用達文西AI ACCELERATED MAGIC MASK測試時,可以看到它的完成時間為14秒,而前代的RTX 3070則是21秒,別小看這幾秒鐘的提升,一旦項目複雜起來,換用新顯卡將大大提升運算時間,助你早人一步完成AI大作。

當然技嘉RTX 4070 MASTER的厲害之處不止在這一個軟體,在另一款AI應用軟體ON1 Resize AI 2023中,使用AI將多張圖片提升200%解析度,此時這款顯卡的速度為10秒一張,而上代的RTX 3070和RTX 3070 Ti均為12秒。而面對RTX 4070 Ti,技嘉RTX 4070 MASTER也不遜色多少,僅僅慢了2秒而已。

最後再看看時下火熱的AI作畫,我們利用NVIDIA提供的描述在Stable Diffusion中生成50張768 x 768的圖片,技嘉RTX 4070 MASTER完成時間為2分11秒,而作為對比,兩張30系70級的顯卡的完成時間均為3分多鐘。並且也得益於技嘉RTX 4070 MASTER的12GB大顯存,可以有效避免AI作畫時可能出現的爆顯存問題。

功耗與發熱

風之力散熱系統的豪華想必大家在上面也見識過了,下面就真刀真槍的試一下這個散熱系統的能力有多強。

在室溫25℃的情況下,使用Furmark單烤15分鐘後,技嘉RTX 4070 MASTER的GPU核心運行在2700MHz以上的高頻,但此時核心溫度僅有53℃,顯存更是僅有48℃,任誰看了都直呼「顯卡感冒了」。並且此時它的功耗和噪音控制也相當優秀,烤機15分鐘,最高功耗僅有215W,上一張做到這個功耗的顯卡是RTX 2070 Super,可以說30系顯卡在技嘉RTX 4070 MASTER面前完全沒有勝算。

你以為這就完了,TSMC 4N工藝與Ada Lovelace架構將給你帶來一點點小小的震撼!利用HWINFO64軟體與FrameView軟體雙重記錄多款顯卡的功耗表現情況,從圖中可以看到技嘉RTX 4070 MASTER整體功耗控制相當出色,在所有測試場景內近乎都是維持在200W左右,用RTX 2070 Super一樣的功耗,完成翻倍甚至3倍的性能提升!

總的來說,技嘉RTX 4070 MASTER憑藉出色的性能表現,極低的功耗完成了對30系顯卡甚至20系顯卡的降維打擊。

超頻能力測試

從上面的GPU-Z中可知,技嘉RTX 4070 MASTER的TDP給到了驚人的350W,顯然這是給超頻黨留了充足的餘量。筆者自然是不能放過這個絕佳的機會,這裡使用技嘉的GCC軟體解鎖顯卡的電壓與溫度限制後,超頻正式開始!

首先當然還是對這張顯卡有個基本的性能了解。技嘉RTX 4070 MASTER在默頻狀態下Time Spy得分18483分,這個成績已經比不少帶OC後綴的RTX 4070還要高了。

緊接著我們小超一下,核心先超頻155MHz,達到了2750MHz,沒想到僅僅超頻這一點頻率後,Time Spy得分就已經18968分,此時技嘉RTX 4070 MASTER在測試中的核心頻率也已經有3000MHz了,相比默頻時最高的2850MHz剛好提升了150MHz左右。

繼續加碼,我最後將技嘉RTX 4070 MASTER的頻率定格在核心2800MHz,相比默頻2595MHz提升了近205MHz。此時在Time Spy測試中,顯卡的核心頻率已經上到了3060MHz,在頻率上甚至比RTX 4070 Ti還要再強一些,當然頻率的提升帶來的是性能的增強,測試總分也來到了19149,相比默頻的18483分,提升近1000分,能力可見一斑。

評測總結

RTX 40系顯卡不得不說給玩家帶來了巨大的驚喜,全新的Ada Lovelace架構、黑科技DLSS 3、RTX VSR等創新技術的出現讓RTX 40系顯卡相比前代有著無可比擬的競爭力。這次推出的新成員——RTX 4070更是一如既往的優秀。新顯卡有著超常的性能、超低的功耗,超越的技術,當然還有超低的價格,總體性價比更是優於上一代的70/80級產品,可以說是遊戲玩家的首選顯卡之一。

高級顯卡最不缺的就是顏值,技嘉GeForce RTX 4070 MASTER也不例外。這張顯卡除了有硬朗、極客的外觀,在小細節上也拿捏住了玩家。顯卡搭載了經典 RGB 炫彩光輪三環燈光,各式各樣的燈光效果,不僅是視覺上的一場盛宴,更是為顯卡顏值增添了獨一無二的的設計。這個獨具一格的設計也讓技嘉GeForce RTX 4070 MASTER成為AORUS鐵粉和DIY玩家的心目之選。

性能方面依舊是這張顯卡最值得說道的地方,首先要點名表揚的就是技嘉 GeForce RTX 4070 MASTER的功耗表現,性能飆升的同時,功耗還維持在RTX 2070 Super的水平,可以說遙遙領先於30系顯卡。再看看它的性能,實測下來完勝RTX 3070 Ti,甚至對比RTX 3080都有不小的優勢。更不要說它還有DLSS 3等黑科技的加持,2K 100FPS+光追流暢遊戲體驗不在話下,總的來說它就是萬元電競主機的首選。

最後再聊聊技嘉 GeForce RTX 4070 MASTER的售價,作為一款定位中端的顯卡,技嘉不僅做出了高端的質感,更帶來了極致的性能。5699元的售價比起自家的老大哥們更具性價比。目前技嘉GeForce RTX 4070 MASTER已經上市開賣,如果你想購買一款性能強勁、顏值在線、溫控到位的顯卡,那麼技嘉GeForce RTX 4070 MASTER就是你的不二之選。

Ada Lovelace架構講解

Turing、Ampere上兩代架構核心均以人物來命名,前者是計算機科學之父——艾倫·麥席森·圖靈;後者則是「電學中的牛頓」——安德烈·瑪麗·安培,電流的國際單位安培就是以其姓氏命名。那Ada Lovelace定非凡人,度娘一下果然,這是 人稱「數字女王」的阿達·洛芙萊斯,編寫了歷史上首款電腦程式,是被世界公認的第一位電腦程式員,果真是一代比一代還要更牛。PS:她的父親是《唐璜》的作者,詩人拜倫。

從Turing架構開始,NVIDIA首次在顯卡中加入了加速光線追蹤的RT Core單元,以及面向AI推理的Tensor Core單元,這革命性的創新使實時光線追蹤成為可能。而Ampere架構則是全面的架構改進,在加入新一代的二代RT Core和三代Tensor Core基礎上,還有著更先進的SM單元設計,這樣顯卡工作效率那是翻倍的提升。而來到Ada Lovelace架構,同時是以效率提升為大前提,自然是引入了最新的第三代 RT Cores與第四代 Tensor Cores單元,同時加入眾多新穎的黑科技,從執行效率來說Ada Lovelace架構是上代Ampere架構的2倍以上,甚至光線追蹤能力更是達到了恐怖的4倍性能。

全新的SM流式多處理器

Ada Lovelace架構中最大的亮點之一:全新的SM流式多處理器,每個SM包含了128個CUDA核心、1個第三代的RT Cores,4個第四代 Tensor Cores(張量核心)、4個Texture Units(紋理單元)、256 KB Register File(寄存器堆),以及128 KB L1 數據緩存/共享內存子系統,於是這一個全新的SM單元有著超過上一代2倍之的性能表現。

過去的Turing架構INT32 計算單元與FP32數量是一致的,而兩者相加才組成了64個CUDA核心。但是Ampere架構開始,左側的計算單元實現了FP32+INT32的計算單元並發執行,也就是說CUDA核心數量翻倍到了128個。

再來看看Ada Lovelace架構的SM,FP32/INT32的計算單元組合,同樣實現了每個SM內含128個CUDA的設計,看似提升不大,但是當你了解到GeForce RTX 4070擁有46個SM,5888個CUDA核心,那你也就應該明白它的著色器能力進一步加強,跟上一代的RTX 3070相比,雖然是同樣的CUDA核心,但得益於新架構的優勢,完全可以說是遙遙領先。

另外緩存方面Ada Lovelace架構也進行了大規格的提升,首先每個SM單元中單獨配上了128 KB的緩存,其次核心的二級緩存進行了重新的設計,使得RTX 4070配備了36MB二級緩存,相比RTX 3070可以說是質的飛躍,足足提升了9倍之多。

技術講解:第三代RTX Cores與第四代Tensor Cores

以為剛才的CUDA數量與超大L2緩存就已經很猛了,實現上Ada Lovelace架構最大的提升還是在第三代 RTX Cores與第四代 Tensor Cores身上。

第三代 RTX Cores

RTX Cores用於光線追蹤加速,第三代 RTX Cores 的有效光線追蹤計算能力達到 191 TFLOPS,是上一代產品 2.8 倍。

在Ampere架構中,第二代RT Cores支持邊界交叉測試(Box Intersection testing)和三角形交叉測試(Triangle Intersection testing),用於加速BVH遍歷和執行射線三角交叉測試計算,雖然光線追蹤處理能力已經比初代的Turing架構核心更高效,但是隨著環境和物體的幾何複雜性持續增加,傳統的處理方式很難再以更高效率、正確反應出的現實世界中的光線,尤其是光的運動準確性。

所以在第三代 RTX Cores增加了兩個重要硬體單元:Opacity Micromap Engine與Displaced Micro-Meshes Engine引擎。Opacity Micromap Engine,主要是用於alpha通道的加速,可以將 alpha 測試幾何體的光線追蹤速度提高2倍。

在傳統光柵渲染中,開發人員使用一些 Alpha 通道的素材來實現更高效的畫面渲染,例如 Alpha 通道的葉子或火焰等複雜形狀的物體。但在光線追蹤時代,這傳統的做法會為光線追蹤帶來不少無效的計算,例如運動性的光線多次通過一塊葉子,光線每擊中一次葉子,都會調用一次著色器來確定如何處理相交,這時就會做成嚴重的執行成本與時間等待成本。

而Opacity Micromap Engine用於直接解析具有非不透明度光線交集的不透明度狀態

三角形。根據Alpha 通道的不透明,透明與未知等三個不同的塊狀態進行處理:透明則直接忽略繼續找下一個,不透明塊則記錄並告知命中,而未知的則交給著色器來確定如何處理,這樣GPU很大部分都不需要進行著色器的調試處理,能夠實現更為高效的性能。

Displaced Micro-Meshes Engine

如果說Opacity Micromap Engine加速的是面處理,那麼Displaced Micro-Meshes Engine就是幾何曲面細節的加速器。如上圖所示,在Ada Lovelace架構中,通過1個基底三角形+位移地圖,就可以創建出一個高度詳細的幾何網格,所需要資源占用比二代RTX Cores更低,效率也更高。

通過NVIDIA給出的創建14:1珊瑚蟹例子來說事,這裡我們需要1.7萬個微網格、160萬個微三角形,在Ada Lovelace架構中BVH創建速度可加快7.6倍,存儲空間縮小8.1倍。Displaced Micro-Meshes Engine起到了關鍵性的作用,其將一個幾何物體根據不同細節分成密度不一的微網絡處理,紅色密度超高,細節處理越為複雜 。相應的低密度微網絡區域則可以釋放更多的資源與存儲空間,這樣Displaced Micro-Meshes Engine就可以幫助BVH加速過程,減少構建時間和存儲成本。

同時Ada Lovelace架構SM中新增了著色器執行重排序(Shader Execution Reordering,SER),這是由於光線追蹤不再只有強光或者陰影渲染處理,未來將會更多的是在光線的運動性,這樣光線就會變得越來越複雜,想要第三代 RTX Cores與第四代 Tensor Cores有著更高的執行效率,那就得為他們來安排一位管家。而著色器執行重排序(SER)就是為了能夠即時重新安排著色器負載來提高執行效率,為光線追蹤提供2倍的加速,也能更好地利用 GPU 資源。不過目前仍未有實例,想實現這個功能,還得遊戲與開發工具的支持才行。

第四代 Tensor Cores

Tensor Cores是專門為執行張量/矩陣運算而設計的專用執行單元,這些運算是深度學習中使用的核心計算功能。第四代Tensor Cores新增FP8引擎,具有高達1.32 petaflops 的張量處理性能,超過上一代的5倍。

技術講解:DLSS 3

或者說第四代Tensor Cores太硬核你不會知道是啥?提升意義在哪?但是Tensor Cores最經典的應用DLSS你肯定會知道,這一次Ada Lovelace架構支持NVIDIA最新的DLSS 3技術。

之前我們也聊過DLSS技術,其設計之初是為了彌補光線追蹤技術後的性能損失,具體的表現為開啟光線追蹤技術後遊戲幀數大幅度的下降,甚至很難保證遊戲流暢的運行。於是DLSS使用低解析度內容作為輸入並運用AI技術輸出高解析度幀,從而提升光線追蹤的性能。

在DLSS 3中包含了三項技術:DLSS幀生成、DLSS超解析度(也稱為DLSS 2)和NVIDIA Reflex。你可以理解為DLSS 3是在DLSS 2的基礎上,新增了DLSS幀生成技術;而後兩技術中,DLSS超解析度只需要GeForce RTX顯卡都能使用上,NVIDIA Reflex則是GeForce 900 系列以後的顯卡都用使用上。

想實現DLSS幀生成可不簡單,這需要配合上Ada Lovelace架構的GeForce RTX 40系列顯卡才行。DLSS幀生成技術原理是:利用AI技術生成更多幀,以此提升性能。DLSS會藉助 GeForce RTX 40系列GPU所搭載的全新光流加速器分析連續幀和運動數據,進而創建其他高質量幀,同時不會影響圖像質量和響應速度。

從Ampere架構開始,NVIDIA顯卡就已經支持了光流加速器,而Ada Lovelace架構的光流加速器升級到了第二代,其提供了高達300 TeraOPS (TOPS) ,比安培架構的初代光流加速器(Optical Flow Acceleration,OFA)快2倍以上。為了實現DLSS幀生成,OFA扮演了重要的角色,其配合上新的運行矢量分析算法在DLSS 3技術框架內實現精確和高性能的幀生成能力。

另外,由於DLSS幀生成是在GPU上作為後處理執行的,那麼即使在遊戲受到CPU性能限制的時候,我們同樣能夠從中獲得更好的遊戲性能提升。尤其是那種物理計算密集型的遊戲或大型場景遊戲,DLSS 2均可以讓GeForce RTX 40系列顯卡以高達兩倍於CPU可計算的性能來渲染遊戲。

最後由於DLSS 3是建立在DLSS 2基礎之上的,遊戲開發者可以在已支持DLSS 2或NVIDIA Streamline的現有遊戲中快速集成該功能,所以DLSS 3已在遊戲生態得到廣泛應用,目前已有超過35款遊戲和應用即將支持該技術。

閱讀小亮點:NVIDIA Reflex

NVIDIA Reflex也是DLSS 3其中的一環,它可以使GPU和CPU同步,確保最佳響應速度和低系統延遲。

想要實現端對端的最低延遲,你需要確保遊戲、顯示器以及滑鼠三者都同時支持並開啟了Reflex 技術。

當GeForce RTX 40系列顯卡和NVIDIA Reflex搭配上後,直接達到1440p解析度360 FPS的體驗,這著實是性能有點強勁了。

在GTC2022大會時已經透露將會還有4 款 1440p 解析度的新型 G-SYNC 電競顯示器將要發布,包括採用mini-LED技術的AOC AG274QGM – AGON PRO Mini LED、MSI MEG 271Q Mini LED 和 ViewSonic XG272G-2K Mini LED三款顯示器刷新率均為300Hz,而最猛的是ASUS ROG Swift 360 Hz PG27AQN ,刷新率直接來到了360Hz。

但唯一一個問題就在於,部分顯示器廠商認為此類產品受眾人群較少,會降低此類顯示器的產能,甚至產品就已經被內部PASS掉,所以1440p 360Hz是很美好,但現實也是相當的骨感。

技術講解:NVIDIA編碼器

GeForce RTX 40系列顯卡還有一個全新的升級,那就是編碼器NVENC。第八代的NVENC編碼器不僅支持H.264與H.265,還支持開放式視頻編碼格式 AV1。

而由於AV1是一種免版稅的視頻編碼格式,上游軟體廠商與下遊戲的配套端都在大力推廣此編碼格式,我們也會看到越來越多的硬體與軟體支持AV1格式,包括剪映專業版、DaVinci Resolve、以及Adobe Premiere Pro較為流行的Voukoder插件均支持,且均可通過編碼預設使用編碼器,這樣我們等待視頻導出的時間縮短將近一半。

不單是視頻製作軟體,AV1格式也將會是主播、遊戲直播UP主們的新寵兒,在保證畫面最高質量的情況下,AV1 編碼器可將效率提高 40%,同時顯卡的占用也更低。包括OBS Studio一代軟體中也會增加AV1格式的支持。另外我們還能通過 GeForce Experience 和 OBS Studio 錄製高達 8K60 的內容,這樣我們做遊戲錄製也會變得更為輕鬆。

包括我們之後測試時使用的遊戲內錄視頻都是支持AV1格式,同時編碼器NVENC在資源占用和適配上做得越來越好。

文章來源: https://twgreatdaily.com/zh-cn/390fe8f933c2c8f944c76c93c4c822a5.html