星曜之光如7而至,影馳GeForce RTX 4070 星曜OC顯卡首發評測

2023-04-14     太平洋電腦網

原標題:星曜之光如7而至,影馳GeForce RTX 4070 星曜OC顯卡首發評測

前言 & 規格對比 & 外觀賞析

   前言

  距離NVIDIA發售RTX 40系顯卡已經過去半年有多了,不知道大家用上新顯卡,體驗DLSS 3帶來的巨大性能提升了嗎?也許不少玩家對高端顯卡的售價猶豫不決,期待一款既有強勁性能又能維持合理價格的顯卡,現在它來了!NVIDIA在昨天終於公布了GeForce RTX 4070顯卡,新顯卡有著媲美RTX 3080的性能,更低的功耗,相信會成為更多硬核玩家的首選。

  而影馳作為NVIDIA的核心AIC合作夥伴之一,也發布了旗下的RTX 4070顯卡,我們這次收到的是影馳GeForce RTX 4070 星曜OC顯卡,這代星曜的設計經過全新升級,更強的散熱系統助力顯卡澎湃釋放,更亮眼的ARGB帶來非凡的視覺體驗,下面就一起看看這代星曜究竟有什麼魔力能夠讓一眾玩家鍾情於它。

  *下文「影馳GeForce RTX 4070 星曜 OC」簡稱為「影馳RTX 4070星曜OC」

   規格對比

  在開始測試前,我們先了解一下影馳RTX 4070星曜OC的配置,首當其衝的自然是顯卡的「心臟」——AD104核心,在RTX 4070 Ti首發測試時我們知道,那上面搭載的才是完整版的AD104核心,而RTX 4070上的這顆則是閹割版。

  從下圖可以看到,完整的AD104核心應該包括5個GPC(圖形處理集群)、30個TPC(紋理處理集群)、60個SM(流式多處理器)以及一個帶有6個32Bit顯存控制器的256Bit顯存帶寬。

  而RTX 4070上的這顆AD104核心則只有4個GPC(圖形處理集群),其中1個GPC也是經過閹割的、另外還有23個TPC(紋理處理集群)、46個SM(流式多處理器)以及一個帶有6個32Bit顯存控制器的256Bit顯存帶寬。二級緩存部分也與RTX 4070 Ti有細微差距,RTX 4070 Ti為48MB的二級緩存,而RTX 4070則是36MB,不過相比起前代的RTX 3070或RTX 3070 Ti的4MB二級緩存,可以是降維打擊了。

  除此之外,影馳RTX 4070星曜OC上的這顆AD104核心被命名為AD104-250-A1,TSMC 4N工藝製造,晶片面積為295平方毫米,雖然不及上代的面積大,但因為工藝製程的進步,影馳RTX 4070星曜OC上的這顆AD104內塞下了更多的電晶體,足足有358億之多,並且頻率上也往前邁進了300MHz以上,可以說是全方位的領先。

  其他參數也是堆料十足,5888個CUDA,46個第三代RTX Cores,184個第四代Tensor Cores,並且用上了12GB的GDDR6X顯存,相比上代的提升還是很明顯的,大顯存配合性能上的提升更可以為遊戲以及創作者帶來更好的使用體驗。

   外觀賞析:影馳 GeForce RTX 4070 星曜 OC

  講完了規格,終於可以一睹顯卡芳容了,有一說一,影馳在設計上是有一手的,單是包裝盒的吸睛程度已經超越一眾競品了。彩色鍍膜工藝讓顯卡時刻光鮮照人,大膽的二次元戰姬形象讓遊戲玩家大飽眼福!

  正面的影馳Logo在彩色鍍膜的映襯下,從各個角度看過去更是熠熠生輝,辨識度拉滿。

  包裝盒上還有另一個值得關注的點,在右上角還特地標註了影馳RTX 4070星曜OC支持三年質保以及個人送保,玩家可以放心購買。

  包裝盒的背面一樣霞光四射,不過上面印的是影馳RTX 4070星曜OC的產品特色,如全新升級的星卓Ⅲ散熱系統、ARGB燈效展示、黑科技DLSS 3以及8K多屏輸出支持等等。

  打開包裝,可以說是應有盡有了,除了顯卡本體外,星曜定製的顯卡支架驚艷亮相,附贈的還有5V ARGB同步線、顯卡支架同步線等,接電感受神光同步的洗禮。

  正面外觀延續了星曜系列一貫的純白設計,整體設計採用鑽石切割工藝,通體透露出寶石般晶瑩的白色,顏值絕對是一眾顯卡中最出眾的存在。

  三把102mm的散熱風扇坐鎮,搭配四周的鑽切外殼,透明的設計在RGB的照耀下帶來絕佳的視覺盛宴,完美詮釋了什麼叫科技美學。

  放大看,每個散熱風扇都有一圈水晶外殼包邊,視覺效果尤為明顯,另外這個透明上蓋是可以卸下的,玩家可以在白色的面板上打造專屬自己的外觀。

  當然DIY可不止在白色面板上塗鴉,影馳也為極客玩家推出了5套官方定製方案的星曜外殼,樣式豐富,顏值驚人,每天換一款,天天用的都是新顯卡!

  這次我們先拿到的是「校園版」的顯卡「皮膚」,一起換上這個新皮膚看看吧。

  換上校園版的皮膚後,影馳RTX 4070星曜OC一下就煥發新機,正面透明的鑽切外殼配合底下櫻花般的紋理,別有一番韻味。不得不說,影馳拿捏玩家確實有一套,光是這個皮膚就讓人慾罷不能。

  背面則是二次元濃度拉滿,正中央則是穿著華麗校服的星曜娘,旁邊巨大的「曜」字與外包裝不謀而合,在鏤空窗口處還有「放肆玩」的Slogan,彰顯了星曜系列一直以來所說的「青春無極限,就要放肆玩」,同時也與校園版的顯卡皮膚十分契合。

  看回純白設計的影馳RTX 4070星曜OC,其背板是高端顯卡常見的金屬背板設計,白色噴塗搭配絲印工藝提升了整體的質感的同時也詮釋了什麼叫做「純白美學」。

  金屬背板的末端是大面積的鏤空,旁邊還有多如繁星的鏤空裝飾,有顏的同時,還能夠增強散熱表現。

  顯卡的頂部則是常規的」GEFORCE RTX」字樣以及一長排的鰭片散熱口,用於加速內部空氣流動,降低核心溫度。

  顯卡供電用的是全新的12VHPWR供電接口,使用一根12VHPWR的電源線就可達到供電需求。相比之前的8Pin接口,安裝確實更加方便快捷。

  如果使用的是ATX2.0標準的電源,那可以使用包裝盒內隨機附贈的雙8Pin轉16Pin的轉接線,也能滿足這張影馳RTX 4070星曜 OC的供電要求。

  視角切到顯卡底部,還可以看到顯卡的PCIe金手指,標準的PCIe 4.0 x 16速率,它可以為顯卡提供更快的傳輸速度。

  最後再介紹一下這張顯卡的視頻輸出接口,影馳給它配備了3個DP1.4a和1個HDMI2.1,支持4屏顯示或最高8K@60Hz的超清輸出。

  並且從這個角度可以看到,影馳RTX 4070星曜OC終於不像其他幾款顯卡一樣,開始「瘦身」了,側面看過去僅有2槽多的厚度,官方數據是56mm厚,終於可以塞進小機箱了。

RGB展示 & 顯卡拆解

   RGB燈效展示:影馳 GeForce RTX 4070 星曜 OC

  看完外觀設計,怎能不見識一下RGB在鑽切外殼下的驚艷效果呢?下面隨筆者的鏡頭一起看看影馳RTX 4070星曜OC那炫酷而又恰如其分的RGB燈效。

  通電點亮後,映入眼帘的便是正中間的信仰Logo「BOOMSTAR」,多層折射鏡面設計,在ARGB燈效下光彩奪目,第一眼就抓住了一眾遊戲發燒友的心。

  星曜定製的顯卡支架也是玩燈的一把好手,用上了同款鑽切鏡面設計,並且還支持RGB同步燈效,一同感受整個機箱都為RGB所照亮。

  頂部的Logo燈牌除了可以展示炫酷的RGB燈效,還自帶檢測功能,黃燈表示顯卡外接供電異常,而紅燈則表示主板異常,玩家排障更直觀。

  要說RGB最出眾的自然是正面的三把散熱風扇,鑽切的稜鏡花邊折射RGB燈光,配合半透明磨砂質感的扇葉,風扇轉動後,五光十色的燈效讓顯卡顏值更進一步,不得不說玩燈還得是你影馳。

  既然是玩燈,那燈效自然是支持自定義的,在官方配套的魔盤Xtreme Tuner控制軟體中,玩家可以對影馳RTX 4070星曜OC上的燈效進行客制化,並且它們也支持與其他硬體同步燈效。

  極客的顏值配上炫彩的RGB燈效,這絕對是白色主題裝機的最佳選擇,即使是對RGB不感冒的用戶看來,也會被它璀璨奪目的RGB燈效所吸引,不得不拜倒在它的顏值下。

   顯卡拆解:影馳 GeForce RTX 4070 星曜 OC

  顯卡拆解是評測不可或缺的一部分,擰下金屬背板上的多顆螺絲後,PCB就可以跟星卓III散熱系統分離了,整體拆解難度不大。

  首先看看影馳RTX 4070星曜 OC的PCB,一眼就能看出此次影馳採用的是自研非公版設計,8層高規格工藝打造,並且在設計上影馳也加入了一些自己的理解和創新,鏤空PCB設計既美觀,又能夠幫助顯卡散熱,展現了一線大廠的設計實力。

  PCB的背面相比正面密密麻麻的排布就顯得整潔許多,背面基本上是各類控制晶片。不過從背面依然可以看到核心上安排了POSCAP(導電聚合物鉭電容),有助於提升顯卡的電氣性能。

  PCB上的主角永遠是這顆性能強勁的「心臟」——AD104-250-A1核心,TSMC 4N工藝打造,295mm2的晶片面積內塞下了5888個CUDA 核心,同時內部還有46個第三代RTX Cores,184個第四代Tensor Cores以及36MB的L2緩存,性能強勁不言而喻。

  核心的四周就是NVIDIA與美光獨家研製的GDDR6X顯存,足足有6顆,型號是3DU47 D8BZC,單顆顯存容量為2GB,6顆顯存共組成12GB。要知道上代的RTX 3070也只給了8GB,現在給到了12GB,加上21Gbps的顯存等效頻率,讓影馳RTX 4070星曜OC有了更多處理複雜項目的能力。

  供電規模在一眾RTX 4070顯卡中也是佼佼者,畢竟要驅動的可是AD104這種高端核心,影馳RTX 4070星曜OC採用11相豪華供電配置,核心供電位於PCB左側。另外在PCB上還可以看到3相顯存供電,位置則安排在PCB右側。

  無論是核心供電還是顯存供電都採用了獨立的DrMos晶片,來自安森美,型號是NCP302150,單顆持續輸出電流為50A,足以帶動AD104與GDDR6X顯存這兩個性能大戶。

  PWM供電晶片則被安排在PCB背面,型號為uP9512R,用於同時管理核心供電金和顯存供電。

  正面的uS5650Q則擔任電壓/電流/功耗監控的工作,是不可或缺的晶片之一。

  而在uS5650Q隔壁的GM009A 93F150晶片則是顯卡的RGB控制晶片,你所見到的炫酷燈光就是它的功勞。

  PCB的底部就是PCIe金手指了,標準的PCIe 4.0 x16速率,使用前務必確保其接入主板上最高速率的PCIe插槽及開啟主板Resizable BAR功能,這樣顯卡才能夠滿血釋放。

  再看看電源接口,最新的12VHPWR,單口就能提供600W的供電能力,用在最高250W的影馳RTX 4070星曜 OC上屬實是有些大材小用了,不過也說明影馳給這款顯卡的堆料相當豪華。

  供電接口的背後還有兩顆LR22電容坐鎮,保障顯卡電源的穩定輸出,隨時讓影馳RTX 4070星曜OC火力全開。

  看完了堆料配置,該看看這款顯卡的散熱如何了,影馳RTX 4070星曜 OC也用上了星卓III散熱系統,這可是自家RTX 4090、RTX 4080的同款,一下子就讓我來精神了,如此高規的散熱系統,那這款顯卡的散熱一定令人期待。

  初見散熱器,其中間就是大面積的均熱板,並且影馳在均熱板上還為顯存、電感、MOS管接觸的地方用上了高係數的導熱墊輔助散熱。

  放大看細節,在均熱板的中央就是AD104核心的位置,這裡也是直觸均熱板設計,並且在二者之間填充了散熱係數極高的矽脂,為的就是快速帶走核心熱量,滿血釋放性能。

  不僅僅正面的均熱板有散熱,金屬背板上同樣安排了導熱墊,配合金屬導熱性強的特性,影馳RTX 4070星曜 OC的散熱效能可以說是拉滿了。

  整個散熱器被分為兩段式設計,大面積的導流型散熱鰭片遍布全身,散熱鰭片之下藏著5根Φ6mm的鍍鎳復合熱管,貫穿整個散熱器,回流焊接工藝加持保證高效導熱。

  要說細節設計還得看影馳,在散熱器的一側,我們還可以看到新增了一個金屬加強件,用於保護鰭片不變形,畢竟前面幾張顯卡的重量大家也是有目共睹了。並且這個設計還能有效帶動熱量傳導至背板,提高散熱性能。

  主動散熱部分用的是3個102mm的風扇,厚度達到了驚人的20mm,並且每把風扇上帶有11片靜霜葉片,升級後的扇葉,可實現更強風壓和更大風量,並且支持智能啟停,保證顯卡隨時全力輸出。

  最後來個全家福,影馳RTX 4070星曜OC的堆料可以用豪華來形容,都知道RTX 4070 Ti用這款散熱系統時已經有出色的溫控,現在RTX 4070也用這款散熱,完全有充足的餘量供玩家發揮,這也讓筆者對它的超頻充滿期待。

測試平台 & 理論與遊戲性能

   測試平台介紹

  相信上面的部分已經讓大家大飽眼福了,那影馳RTX 4070星曜OC的性能表現究竟如何,下面就讓我們一同探索!

  首先介紹一下本次的測試平台,我們用上了評測室的最強硬體,CPU使用的是目前的旗艦——Intel i9-13900KS處理器,主板為影馳Z790 金屬大師,搭配同款的影馳星曜32GB DDR5-6000高規格內存,確保這張顯卡能夠釋放全部性能。

  得益於Ada Lovelace架構的革新和TSMC 4N工藝的加持,影馳RTX 4070星曜OC有著不錯的能耗比,因此我們也給它配備了一款體積小巧、穩定優秀的電源——XPG CORE SHIFT 魔核戰鬥版750W全模組。

  這款電源可以說相當亮眼的,內部用料以及結構都是相當成熟,主動PFC+全橋LLC+Dc-dc+同步整流技術,通過80PLUS 金牌認證,採用電線全模組化,加上小巧的體積,14cm長度設計等,不得不說它就是你RTX 4070的最佳拍檔。

  測試平台方面我們已經祭出了目前地表最強的硬體,那拿來襯這張顯卡的顯示器自然也不能弱,用的依舊是天花板級別的AGON PD32M保時捷聯名款,4K@144Hz的高刷,絲般順滑暢享市面上的3A遊戲。

  測試前還是要驗明正身,在GPU-Z中可以看到影馳 RTX 4070星曜 OC的基礎頻率為1920MHz,Boost頻率為2610MHz,比公版足足多了135MHz!可以期待一下它的性能表現,另外TGP設定卻給到了250W,溫度牆也跟RTX 4080為同一水平線的88℃,看來影馳給極客玩家預留了充足的超頻空間。

   理論性能測試

  實測開始,首先帶大家體驗全世界最好玩的遊戲《3DMark》,從理論性能來看,影馳RTX 4070星曜OC相比上代的RTX 3070 Ti有著更為出色的性能表現,整體性能是後者的1.3倍以上。已經比肩上代的RTX 3080了,不得不說這樣的性能表現,著實讓我有些意外。

  在注重遊戲的Time Spy和Fire Strike測試中,影馳RTX 4070星曜OC也有不俗的表現,兩項成績領先RTX 3070 Ti約20%,這也讓筆者對這張顯卡的實際遊戲表現充滿期待。而在老黃引以為傲的光追跟DLSS上,這款顯卡也取得了長足的進步,PortRoyal項目中突破1w分大關,領先前代的RTX 3070 Ti 約3000分,提升幅度令人驚喜。DLSS項目中,DLSS 2更上一層樓,4K也能穩定60 FPS,還給玩家帶來了驚喜連連的DLSS 3黑科技!

  而在GPGPU理論性能測試方面,擁有Ada Lovalace架構的RTX 40系列顯卡在算力上也有出色的性能表現,尤其是單精度和雙精度浮點運算上,提升幅度是最大的。影馳RTX 4070星曜OC相比RTX 3070 Ti顯卡有著巨幅提升,領先幅度足足有40%以上,整體性能也是RTX 3070的1.5倍左右。

   遊戲性能測試

  理論性能的提升令人眼前一亮,遊戲性能才是眾多遊戲發燒友關注的重點,因此我們選擇了多款遊戲在多種解析度下進行實測,讓你一睹影馳RTX 4070星曜OC在遊戲中的風采。

  首先是常見的1080P解析度,這對於影馳RTX 4070星曜OC來說是小菜一碟,不少遊戲都能穩定運行在150 FPS以上,像《戰爭機器5》這樣優化比較好的遊戲,不開任何DLSS加成,它也能接近200 FPS。相比起20系的RTX 2070 Super,幀數幾乎是翻倍的提升,即便是面對上一代的RTX 3070或RTX 3070 Ti,影馳RTX 4070星曜OC的遊戲性能也是它們的1.3倍左右。

  2K解析度則是影馳RTX 4070星曜OC的主場了,在這個解析度下,一眾遊戲依舊有120 FPS左右的表現,如果你玩的是像《古墓麗影:暗影》這類的老3A大作,優化效果更明顯,這張顯卡能在2K解析度下跑出205 FPS的超高成績,可見RTX 4070的實習非同小可!而一些優化一般的遊戲,影馳RTX 4070星曜OC也有優勢,素有「顯卡離去」之稱的《地鐵:離去》,RTX 2070 Super幾乎是不可玩的狀態,30系的兩張卡也是剛好達到及格線,而影馳的這張卡卻能幾乎維持在90 FPS左右,絲滑體驗不言而喻。

  總的來說,在不開啟DLSS或僅開啟DLSS 2的情況下,影馳RTX 4070星曜OC完全能夠應付2K解析度下的3A大作,不少遊戲表現甚至超出預期,滿足2K高刷玩3A完全不是夢。

DLSS 3性能測試

   DLSS 3性能測試

  要說這一代RTX 40系顯卡最大的升級就是DLSS 3黑科技,DLSS早在RTX 20系顯卡就已經發布了,其主要是讓顯卡在不影響畫面質量的情況下提升遊戲性能,目前DLSS已經更新至3.0版本,相比前代,新增幀生成和NVIDIA Reflex技術,據老黃所說,用上DLSS 3後可以實現遊戲性能的翻倍提升。

  3DMark DLSS 3理論性能測試

  在最新版的3DMark測試軟體中已經加入了DLSS 3相關的測試,有了DLSS 3後,影馳RTX 4070星曜OC如虎添翼,2K解析度下,開關DLSS 3性能差距能夠達到2.5倍以上,幀數穩定在135 FPS以上,但從理論測試來看影馳RTX 4070星曜OC已經能夠很好的滿足2K@120Hz的遊戲需求。

  4K解析度我們也測試了,不得不說老黃的刀法還是相當精準的,影馳RTX 4070星曜OC開關DLSS 3的性能差距足足有4倍之多,但4K解析度下也只是接近90 FPS,因此影馳RTX 4070星曜OC能夠輕度遊玩4K,想要更絲滑的體驗就得選擇更高端的顯卡了。

  《微軟模擬飛行》遊戲實測

  光測試理論性能肯定是不夠的,現在支持DLSS 3的遊戲已經上升至50款,因此我們也選用了一些熱門遊戲盡顯詳細測試。在對硬體要求頗高的《微軟模擬飛行》中,影馳RTX 4070 星曜OC開啟DLSS 3後對RTX 3070 Ti簡直是降維打擊,1080P解析度下幾乎是2倍的幀數提升,2K解析度下也比RTX 3070 Ti高出60多 FPS,更別提RTX 2070 Super了,它還是勉強能玩的水平。另外影馳RTX 4070星曜OC的功耗僅149W,基本上是用RTX 2070 Super的功耗實現了2倍以上的性能!

  在其他幾款遊戲中也是如此,影馳RTX 4070星曜 OC在開啟DLSS 3後,遊戲幀數相比RTX 3070 Ti都有60%-70%左右的提升,不少項目更是有翻倍的幀數提升,並且功耗都更低,用更低的功耗實現更強的性能,這才是玩家所樂見的。

  1080P解析度DLSS性能測試

  在1080P解析度下,影馳RTX 4070星曜OC開啟DLSS 3後,遊戲性能提升非常離譜!性能直接是RTX 2070 Super的2倍有多!大部分遊戲都能穩定在200+ FPS以上,有人可能會問,那跟RTX 3070 Ti相比如何,這張卡的性能在1080P下依舊領先RTX 3070 Ti 70%以上!有這樣的提升幅度,DLSS 3功不可沒。

  2K解析度DLSS性能測試

  2K解析度下,以影馳RTX 4070星曜OC的性能也是毫無壓力,上面測試時不少遊戲開啟DLSS 2時就領先RTX 3070 Ti僅20幀,但開啟DLSS 3後,整個世界都變了!領先幅度來到了驚人的50-60幀以上;毫無疑問的說,影馳RTX 4070星曜OC在2K解析度下的優勢明顯,相比RTX 2070 Super,性能足足是其4倍之多,相比RTX 3070 Ti也絲毫不虛,性能是翻倍的提升。這樣的遊戲性能領先讓它穩居2K高刷遊戲甜品顯卡的寶座。

  我們也使用影馳RTX 4070星曜OC在DLSS 2和DLSS 3兩種模式下測試了多款遊戲,從實測結果來看,DLSS 3確實有點東西,不少遊戲的幀數都有明顯提升,其中不乏一些遊戲有翻倍的性能提升。像《賽博朋克2077》這款遊戲,眾所周知它被譽為「顯卡殺手」,影馳RTX 4070星曜OC在DLSS 2下遊戲幀數為96 FPS,而開啟DLSS 3後,遊戲幀數達到了驚人的144FPS,這已經可以2K@144Hz暢玩電競級的夜之城了!更讓人驚喜的是開啟DLSS 3後,遊戲的1% Low幀也有提升,這也意味著你在玩遊戲時更穩定更絲滑。

  4K解析度DLSS性能測試

  雖然說這是一張定位2K 100+FPS遊戲級別的顯卡,但影馳RTX 4070星曜OC仍是具備一定的4K遊戲能力,只要把DLSS3一開,或者是把遊戲畫質降低一些,遊戲流暢度就直接上來了,跑個60+FPS不成問題。

RTX VSR測試

   RTX VSR測試

  有些時候你是不是也會有這樣的煩惱,那些480P甚至360P的早期視頻清晰度不夠,看起來不夠清楚?現在這種煩惱將不再困擾你。NVIDIA帶來了視頻版的DLSS 3!正是前不久發布的RTX Video Super Resolution 視頻超解析度技術(RTX VSR),通過AI技術即可提高瀏覽器內的視頻的解析度,展現前所未有的顯示效果。

  今天我們也測試了這項劃時代的RTX VSR技術,在RTX 30系和RTX 40系的NVIDIA控制面板中找到視頻圖像設置,手動開啟RTX Video enhancement即可啟用RTX VSR技術,其中分為1-4檔調節,數字越大質量越好。

  實測環節,可以看到在開啟RTX VSR技術之後,原視頻里的人物線條由原本的模糊不清變得十分清晰銳利,並且隨著VSR級別的提高,清晰度逐級提升,甚至部分細節已經接近原生1080P了。

  在暗部表現同樣如此,原視頻里地板如同劣質貼圖,有VSR加持後每塊磚頭都清晰可見,且立體感滿滿,尤其是旁邊綠色植被的清晰度更高了一個數量級。除此之外,RTX VSR技術的AI算法似乎還能夠通過類似DLSS幀生成的方式計算出物體的遠近關係優化景深效果,這一點同樣能夠使得畫面整體觀感得到提升。

  這裡我們也給大家準備了對比視頻,從視頻里就可以看到VSR的效果之明顯,最高級別的VSR 4跟原生480P相比就是一眼的區別,在開啟RTX VSR技術後,部分圖像質量有了顯著提高,不僅鋸齒和噪點幾乎全部消失,顏色過渡也更為平滑,目前VSR能有這種表現堪稱驚艷。

  當然你除了在瀏覽器能夠使用這項功能外,本地瀏覽器也能享受黑科技的魅力,VLC是目前首個支持RTX VSR技術的本地播放器,且能夠支持多種視頻格式播放。正式版也隨著RTX 4070顯卡的解禁上線了,你硬碟里的老視頻也能搖身一變成1080P了!

  我們將瀏覽器中的視頻與本地的視頻同時進行RTX VSR 4檔渲染,從畫面上看,右側本地播放器的效果要弱於左側瀏覽器的,瀏覽器上的4檔VSR線條更銳利,畫質也更清晰,不過即使是本地播放器的效果也要遠強於原生480P,筆者猜測可能是目前本地瀏覽器的優化還不到位。

  我們也將原生480P與瀏覽器和本地播放器上的VSR渲染視頻進行對比,從視頻畫面中可以看到,本地播放器上4檔VSR渲染過後,文字或線條都相比原生480P有一定提升,至少以前模糊不清的視頻可以看了,不過對比瀏覽器的效果還略有差距,後者的效果已經接近原生1080P了。

  有用戶可能擔心功耗的問題,在VSR開啟最高檔4檔的情況下,影馳RTX 4070星曜OC的功耗僅有24W左右,顯卡利用率也遠沒有網絡上傳得那麼高,在HWINFO64中可以看到顯卡全程利用率不過25%。

  總的來說,影馳RTX 4070星曜OC上的RTX VSR技術將為玩家和視頻觀看者帶來革命性的新體驗!無論是性能上還是技術上的創新,都稱得上是流媒體時代的革命!

創作性能 & NVIDIA編碼器專項測試

   創作者性能測試

  測試完遊戲後,少不了的就是生產力性能,生產力分為創作生產力與專業生產力兩部分,這裡我們選擇PugetBench、PCMark 10、Blender等多款常見的測試軟體,來測試影馳RTX 4070 星曜OC在日常辦公、視頻內容生產、專業渲染等方面的性能表現。

  首先我們來看看PCMark10 Extended項目上各顯卡的性能表現如何,可以看到影馳RTX 4070 星曜OC在遊戲這個子項目上與前代的RTX 3070 Ti拉開了差距,並且領先幅度約為20%左右,這與我們上面的遊戲實測相符,與老大哥RTX 4070 Ti相比,性能差距也在10%以內。

  而在UL Procyon與PugetBench測試中,影馳RTX 4070星曜OC不單止超越了前代的RTX 3070 Ti,甚至在部分項目上還反超了大哥RTX 4070 Ti。另外最新的RTX 40系支持AV1的編解碼,在達文西軟體中優勢相當明顯,有了AV1的加持後,影馳RTX 4070星曜OC相比RTX 3070足足領先了38%的性能,這是前代顯卡無論如何也無法逾越的一道鴻溝,畢竟這需要RTX 40系顯卡中的雙NVIDIA編碼器的硬體支持。

  專業性能上,影馳RTX 4070星曜OC的提升更是驚人,在N卡常用的Blender渲染軟體中,影馳RTX 4070星曜OC相比RTX 3070有50%的性能提升,就算是RTX 3070 Ti,它依舊領先45%以上。

  而在以工業軟體為主的SPEC 2020中,影馳RTX 4070星曜OC依舊展現出來強大的實力,相比RTX 2070 Super,性能領先50%有多,相比RTX 3070 Ti領先25%,反應在實際應用中則是同樣的工程文件,使用最新的影馳RTX 4070星曜OC能夠節約四分之一的時間,提升你的工作效率。

  當然這裡面提升最大的還要屬OC渲染器,性能足足是RTX 3070的1.6倍!這明顯是ADA架構革新所帶來的算力提升。想要提升專業性能的用戶不妨考慮一下影馳RTX 4070星曜 OC,相對低的售價但卻帶來強悍的性能表現,不得不說真香!

   NVIDIA編碼器專項測試

  通過上面的測試,我們也知道現在的RTX 40系顯卡不僅有遊戲版DLSS,還有視頻版DLSS,不過你以為RTX 40系顯卡對視頻的提升僅僅如此嗎?其實它還隱藏了一項特殊技能,影馳RTX 4070星曜OC內置了NVIDIA編碼器,它支持時下熱門的AV1編碼,作為下一代主流的視頻編碼技術有著自己獨特的優勢,更快的編碼速度和更高質量的流媒體傳輸性能,讓越來越多的剪輯軟體和視頻網站青睞於它,像我們熟悉的達文西、剪映、B站等已經支持AV1編解碼,未來AV1將會成為一個新趨勢。

  我們使用NVIDIA提供的8K片源與工程文件分別測試AV1格式和H.265格式下的編碼時間。實測同一段素材下,同樣使用H.265編碼,有雙編碼器的加持下,影馳RTX 4070星曜OC的效率比RTX 3070快40%以上,如果使用AV1編碼,那效率會比H.264快50%。

  當然我們上面也提到AV1編碼不止導出速度更快,它的文件占用空間也比H.265要小,無論是4K解析度還是8K解析度,使用AV1編碼後,文件整體大小能夠降低25%以上,並且肉眼下幾乎沒有畫質區別,單憑AV1的這些優點,未來將會是AV1的天下,現在裝備一張影馳RTX 4070星曜OC即可感受最新技術帶來的優勢。

AI運算能力測試 & 功耗

   AI運算能力測試

  接下來的測試更是重量級,最近一段時間,AI繪圖、ChatGPT等AI工具如雨後春筍般冒了出來,老黃甚至在前段時間的GTC大會上重點介紹了AI技術,還指出「現在AI行業已經到達了像iPhone橫空出世時為手機行業帶來的革命性顛覆的時間點。」

  借這個機會,我們也對影馳RTX 4070星曜OC顯卡進行AI運算能力測試,在使用達文西AI ACCELERATED MAGIC MASK測試時,可以看到影馳的完成時間為14秒,而前代的RTX 3070則是21秒,你可能覺得時間差距不大,但項目一旦複雜起來,選用影馳RTX 4070星曜OC會讓你的效率快33%以上。

  再看看最近大火的AI作畫,AI作畫近期取得如此巨大進展的原因個人認為有很大的功勞歸屬於Stable Diffusion的開源。因此我們也用Stable Diffusion生成50張768 x 768的圖片進行測試,從生成時間上就可以看到影馳RTX 4070星曜OC的強勢,前代的RTX 3070 Ti生成50張圖需要接近3分鐘的時間,而影馳只需要2分11秒,相比大哥RTX 4070 Ti也差距不大,僅差20秒,如果是跟RTX 2070 Super相比,影馳的效率已經接近2倍了!

  另外在測試中還有一個值得關注的地方就是顯存占用,基本上RTX 20系跟RTX 30系的幾張顯卡在測試時顯存占用都達到了7.6G以上,雖然影馳RTX 4070星曜OC的顯存占用也有7G以上,不過得益於影馳RTX 4070星曜OC的12GB大顯存,因此在生成速度上有明顯優勢,可見這個軟體還是很吃顯存的,所以大家在玩這個軟體的時候應該是顯卡顯存越高越好,選擇影馳RTX 4070星曜OC就是你高性價比兼高性能的選擇。

   功耗與發熱

  星卓III散熱系統的配置大家都有目共睹,雖然影馳RTX 4070星曜 OC只是一款定位250W,但它的散熱系統跟RTX 4070 Ti幾乎是同一規格的,這也讓我對這款顯卡的功耗和發熱情況充滿好奇。

  在室溫25℃的情況下,使用Furmark單烤15分鐘後,影馳RTX 4070 星曜 OC的GPU核心運行在2700MHz以上的高頻,但此時核心溫度僅有57.8℃,顯存更是僅有50℃出頭,50多℃意味著什麼?意味著它可能比你使用的CPU還要低溫!如果是待機溫度,那這代顯卡的溫度更是驚人,GPU在待機下30℃不大,現在知道星卓III散熱系統的強勢之處了吧。

  真正優秀的還不止於此,採用TSMC 4N工藝後的影馳RTX 4070星曜 OC的功耗和噪音控制也相當優秀,烤機15分鐘,最高功耗僅有215W,這個水平約等於RTX 2070 Super,意思就是影馳RTX 4070星曜OC用相同的規格實現了性能的飛躍!這也是最讓筆者驚喜的地方之一。

  我們還利用HWINFO64軟體與FrameView軟體雙重記錄多款顯卡的功耗表現情況,從圖中可以看到影馳RTX 4070星曜OC整體功耗控制相當出色,在所有測試場景內近乎都是維持在200W左右,用RTX 2070 Super一樣的功耗,但性能卻已經實現全方位的領先!

  不禁感慨老黃的Ada Lovelace架構和TSMC的4N工藝確實有點東西,影馳RTX 4070星曜OC無論是性能表現、溫度控制甚至是能耗比都可以說是N卡的新高度,相比前代的RTX 30系還是初代光追顯卡20系都是一次降維打擊。

超頻潛力 & 評測總結

   超頻能力測試

  前面在GPU-Z中可以看到影馳 RTX 4070星曜 OC的TGP最高去到了250W,這比公版RTX 4070還要高出不少,顯然這是給超頻預留了充足的空間,那筆者自然是不可能錯過這個絕佳的機會,下面一同看看這款顯卡的超頻潛力究竟有多大吧。

  這裡我們使用影馳官方提供的XTREME TUNER魔盤工具對顯卡進行超頻,這款工具不僅可以解鎖GPU核心的電壓限制、功耗限制等,還可以自由調節風扇轉速,實測這款顯卡的散熱配置明顯是超規格的,因此風扇轉速還可以進一步下探,超低的風扇噪音還你舒適的使用體驗。

  先對這張顯卡的基本性能有個基本的了解,默頻狀態下Time Spy得分18671分。

  小試牛刀,核心與顯存均先超頻200MHz,沒想到僅僅超頻200MHz後,Time Spy得分就已經接近2W分大關了,此時影馳RTX 4070星曜OC在測試中的核心頻率就已經有3060MHz了,相比默頻時最高的2865MHz剛好提升了200MHz左右。

  核心頻率加碼到250MHz,顯存頻率也超頻500MHz,此時Time Spy測試得分穩步上升至19649分,核心頻率也再創新高,達到了3105MHz,搭配地表最強的13900KS,影馳RTX 4070星曜OC超頻性能盡顯。

  萬萬沒想到影馳RTX 4070星曜OC的潛力遠不止於此,最後我們將核心和顯存分別提升了250MHz和750MHz,此時在Time Spy測試中,顯卡的核心頻率已經上到了3120MHz,可見它的超頻能力還是相當可觀的。頻率甚至比RTX 4070 Ti還要再強一些,總分也來到了19710,相比默頻的18671分,提升近1000分,能力可見一斑。

   評測總結

  RTX 40系列自發布以來就給廣大用戶帶來不少驚喜,這次更是再添一位大將!全新的Ada Lovelace架構、黑科技DLSS 3、RTX VSR等創新技術的出現讓RTX 40系顯卡相比前代有著無可比擬的競爭力。實測下來也不得不讚嘆老黃真的有點東西,因此GeForce RTX 4070顯卡有著超乎預期的性能表現,不僅專業性能有質的飛躍,遊戲性能也讓人眼前一亮,驚喜連連。

  這次上手體驗影馳 GeForce RTX 4070 星曜 OC,最深刻的印象那一定是它的純白美學與鑽切時尚。作為星曜系列的新選手,延續了自家旗艦的設計水準,白色戰甲配上晶瑩剔透的外殼,精緻亮眼。高度可DIY的特性讓遊戲發燒友可以盡情發揮創意,異想天開,設計獨一無二的星曜顯卡。

  光有驚艷眾人的顏值還不夠,影馳GeForce RTX 4070 星曜 OC的性能才是重頭戲!AD104核心在性能釋放上已經完勝RTX 3080,更別提RTX 3070,性能領先更是接近翻倍,並且功耗保持在RTX 2070 Super的水平!花小錢辦大事的典範了屬於是,這才是高端顯卡應有的表現。玩家最關心的遊戲性能也是當仁不讓,2K解析度下依舊可以保持100 FPS以上的超高幀率,4K下搭配DLSS 3也可一戰。如此性能,是多少玩家心心念念的夢中情卡

  總的來說,影馳 GeForce RTX 4070 星曜 OC更像是集美貌與才華於一身的高端顯卡,如果你注重遊戲性能體驗,想要體驗超頻的樂趣,同時希望兼顧絕美的顏值,那這款顯卡一定是你的不二之選。目前影馳 GeForce RTX 4070 星曜 OC已經上市,售價5299元,性價比真不錯,現在各大‏‏電商平台均已開售‏‏,感興趣的話可以去了解一下。

技術講解:Ada Lovelace架構

   Ada Lovelace架構講解

  Turing、Ampere上兩代架構核心均以人物來命名,前者是計算機科學之父——艾倫·麥席森·圖靈;後者則是「電學中的牛頓」——安德烈·瑪麗·安培,電流的國際單位安培就是以其姓氏命名。那Ada Lovelace定非凡人,度娘一下果然,這是 人稱「數字女王」的阿達·洛芙萊斯,編寫了歷史上首款電腦程式,是被世界公認的第一位電腦程式員,果真是一代比一代還要更牛。PS:她的父親是《唐璜》的作者,詩人拜倫。

  從Turing架構開始,NVIDIA首次在顯卡中加入了加速光線追蹤的RT Core單元,以及面向AI推理的Tensor Core單元,這革命性的創新使實時光線追蹤成為可能。而Ampere架構則是全面的架構改進,在加入新一代的二代RT Core和三代Tensor Core基礎上,還有著更先進的SM單元設計,這樣顯卡工作效率那是翻倍的提升。而來到Ada Lovelace架構,同時是以效率提升為大前提,自然是引入了最新的第三代 RT Cores與第四代 Tensor Cores單元,同時加入眾多新穎的黑科技,從執行效率來說Ada Lovelace架構是上代Ampere架構的2倍以上,甚至光線追蹤能力更是達到了恐怖的4倍性能。

   全新的SM流式多處理器

  Ada Lovelace架構中最大的亮點之一:全新的SM流式多處理器,每個SM包含了128個CUDA核心、1個第三代的RT Cores,4個第四代 Tensor Cores(張量核心)、4個Texture Units(紋理單元)、256 KB Register File(寄存器堆),以及128 KB L1 數據緩存/共享內存子系統,於是這一個全新的SM單元有著超過上一代2倍之的性能表現。

  過去的Turing架構INT32 計算單元與FP32數量是一致的,而兩者相加才組成了64個CUDA核心。但是Ampere架構開始,左側的計算單元實現了FP32+INT32的計算單元並發執行,也就是說CUDA核心數量翻倍到了128個。

  再來看看Ada Lovelace架構的SM,FP32/INT32的計算單元組合,同樣實現了每個SM內含128個CUDA的設計,看似提升不大,但是當你了解到GeForce RTX 4070擁有46個SM,5888個CUDA核心,那你也就應該明白它的著色器能力進一步加強,跟上一代的RTX 3070相比,雖然是同樣的CUDA核心,但得益於新架構的優勢,完全可以說是遙遙領先。

  另外緩存方面Ada Lovelace架構也進行了大規格的提升,首先每個SM單元中單獨配上了128 KB的緩存,其次核心的二級緩存進行進行了重新的設計,使得RTX 4070配備了36MB二級緩存,相比RTX 3070可以說是質的飛躍,足足提升了9倍之多。

   技術講解:第三代 RTX Cores 與 第四代 Tensor Cores

  以為剛才的CUDA數量與超大L2緩存就已經很猛了,實現上Ada Lovelace架構最大的提升還是在第三代 RTX Cores與第四代 Tensor Cores身上。

  第三代 RTX Cores

  RTX Cores用於光線追蹤加速,第三代 RTX Cores 的有效光線追蹤計算能力達到 191 TFLOPS,是上一代產品 2.8 倍。

  在Ampere架構中,第二代RT Cores支持邊界交叉測試(Box Intersection testing)和三角形交叉測試(Triangle Intersection testing),用於加速BVH遍歷和執行射線三角交叉測試計算,雖然光線追蹤處理能力已經比初代的Turing架構核心更高效,但是隨著環境和物體的幾何複雜性持續增加,傳統的處理方式很難再以更高效率、正確反應出的現實世界中的光線,尤其是光的運動準確性。

  所以在第三代 RTX Cores增加了兩個重要硬體單元:Opacity Micromap Engine與Displaced Micro-Meshes Engine引擎。Opacity Micromap Engine,主要是用於alpha通道的加速,可以將 alpha 測試幾何體的光線追蹤速度提高2倍。

  在傳統光柵渲染中,開發人員使用一些 Alpha 通道的素材來實現更高效的畫面渲染,例如 Alpha 通道的葉子或火焰等複雜形狀的物體。但在光線追蹤時代,這傳統的做法會為光線追蹤帶為不少無效的計算,例如運動性的光線多次通過一塊葉子,光線每擊中一次葉子,都會調用一次著色器來確定如何處理相交,這時就會做成嚴重的執行成本與時間等待成本。

  而Opacity Micromap Engine用於直接解析具有非不透明度光線交集的不透明度狀態

  三角形。根據Alpha 通道的不透明,透明與未知等三個不同的塊狀態進行處理:透明則直接忽略繼續找下一個,不透明塊則記錄並告之命中,而未知的則交給著色器來確定如何處理,這樣GPU很大部分都不需要進行著色器的調試處理,能夠實現更為高效的性能。

  Displaced Micro-Meshes Engine

  如果說Opacity Micromap Engine加速的是面處理,那麼Displaced Micro-Meshes Engine就是幾何曲面細節的加速器。如上圖所示,在Ada Lovelace架構中,通過1個基底三角形+位移地圖,就可以創建出一個高度詳細的幾何網格,所需要資源占用比二代RTX Cores更低,效率也更高。

  通過NVIDIA給出的創建14:1珊瑚蟹例子來說事,這裡我們需要需要1.7萬個微網格、160萬個微三角形,在Ada Lovelace架構中BVH創建速度可加快7.6倍,存儲空間縮小8.1倍。Displaced Micro-Meshes Engine起到了關鍵性的作用,其將一個幾何物體根據不同細節分成密度不一的微網絡處理,紅色密度超高,細節處理越為複雜 。相應的低密度微網絡區域則可以釋放更多的資源與存儲空間,這樣Displaced Micro-Meshes Engine就可以幫助BVH加速過程,減少構建時間和存儲成本。

  同時Ada Lovelace架構SM中新增了著色器執行重排序(Shader Execution Reordering,SER),這是由於光線追蹤不再只有強光或者陰影渲染處理,未來將會更多的是在光線的運動性,這樣光線就會變得越來越複雜,想要第三代 RTX Cores與第四代 Tensor Cores有著更高的執行效率,那就得為他們來安排一位管家。而著色器執行重排序(SER)就是為了能夠即時重新安排著色器負載來提高執行效率,為光線追蹤提供2倍的加速,也能更好地利用 GPU 資源。不過目前仍未有實例,想實現這個功能,還得遊戲與開發工具的支持才行。

  第四代 Tensor Cores

  Tensor Cores是專門為執行張量/矩陣運算而設計的專用執行單元,這些運算是深度學習中使用的核心計算功能。第四代Tensor Cores新增FP8引擎,具有高達1.32 petaflops 的張量處理性能,超過上一代的5倍。

技術講解:DLSS 3

   技術講解:DLSS 3

  或者說第四代Tensor Cores太硬核你不會知道是啥?提升意義在哪?但是Tensor Cores最經典的應用DLSS你肯定會知道,這一次Ada Lovelace架構支持NVIDIA最新的DLSS 3技術。

  之前我們也聊過DLSS技術,其設計之初是為了彌補光線追蹤技術後的性能損失,具體的表現為開啟光線追蹤技術後遊戲幀數大幅度的下降,甚至很難保證遊戲流暢的運行。於是DLSS使用低解析度內容作為輸入並運用AI技術輸出高解析度幀,從而提升光線追蹤的性能。

  在DLSS 3中包含了三項技術:DLSS幀生成、DLSS超解析度(也稱為DLSS 2)和NVIDIA Reflex。你可以理解為DLSS 3是在DLSS 2的基礎上,新增了DLSS幀生成技術;而後兩技術中,DLSS超解析度只需要GeForce RTX顯卡都能使用上,NVIDIA Reflex則是GeForce 900 系列以後的顯卡都用使用上。

  想實現DLSS幀生成可不簡單,這需要配合上Ada Lovelace架構的GeForce RTX 40系列顯卡才行。DLSS幀生成技術原理是:利用AI技術生成更多幀,以此提升性能。DLSS會藉助 GeForce RTX 40系列GPU所搭載的全新光流加速器分析連續幀和運動數據,進而創建其他高質量幀,同時不會影響圖像質量和響應速度。

  從Ampere架構開始,NVIDIA顯卡就已經支持了光流加速器,而Ada Lovelace架構的光流加速器升級到了第二代,其提供了高達300 TeraOPS (TOPS) ,比安培架構的初代光流加速器(Optical Flow Acceleration,OFA)快2倍以上。為了實現DLSS幀生成,OFA扮演了重要的角色,其配合上新的運行矢量分析算法在DLSS 3技術框架內實現精確和高性能的幀生成能力。

  另外,由於DLSS幀生成是在GPU上作為後處理執行的,那麼即使在遊戲受到CPU性能限制的時候,我們同樣能夠從中獲得更好的遊戲性能提升。尤其是那種物理計算密集型的遊戲或大型場景遊戲,DLSS 2均可以讓GeForce RTX 40系列顯卡以高達兩倍於CPU可計算的性能來渲染遊戲。

  最後由於DLSS 3是建立在DLSS 2基礎之上的,遊戲開發者可以在已支持DLSS 2或NVIDIA Streamline的現有遊戲中快速集成該功能,所以DLSS 3已在遊戲生態得到廣泛應用,目前已有超過35款遊戲和應用即將支持該技術。

  閱讀小亮點:NVIDIA Reflex

  NVIDIA Reflex也是DLSS 3其中的一環,它可以使GPU和CPU同步,確保最佳響應速度和低系統延遲。

  想要實現端對端的最低延遲,你需要確保遊戲、顯示器以及滑鼠三者都同時支持並開啟了Reflex 技術。

  當GeForce RTX 40系列顯卡和NVIDIA Reflex搭配上後,直接達到1440p解析度360 FPS的體驗,這著實是性能有點強勁了。

  在GTC2022大會時已經透露將會還有4 款 1440p 解析度的新型 G-SYNC 電競顯示器將要發布,包括採用mini-LED技術的AOC AG274QGM – AGON PRO Mini LED、MSI MEG 271Q Mini LED 和 ViewSonic XG272G-2K Mini LED三款顯示器刷新率均為300Hz,而最猛的是ASUS ROG Swift 360 Hz PG27AQN ,刷新率直接來到了360Hz。

  但唯一一個問題就在於,部分顯示器廠商認為此類產品受眾人群較少,會降低此類顯示器的產能,甚至產品就已經被內部PASS掉,所以1440p 360Hz是很美好,但現實也是相當的骨感。

技術講解:NVIDIA編碼器

   技術講解:NVIDIA編碼器

  GeForce RTX 40系列顯卡還有一個全新的升級,那就是編碼器NVENC。第八代的NVENC編碼器不僅支持H.264與H.265,還支持開放式視頻編碼格式 AV1。

  而由於AV1是一種免版稅的視頻編碼格式,上游軟體廠商與下遊戲的配套端都在大力推廣此編碼格式,我們也會看到越來越多的硬體與軟體支持AV1格式,包括剪映專業版、DaVinci Resolve、以及Adobe Premiere Pro較為流行的Voukoder插件均支持,且均可通過編碼預設使用雙編碼器,這樣我們等待視頻導出的時間縮短將近一半。

  不單是視頻製作軟體,AV1格式也將會是主播、遊戲直播UP主們的新寵兒,在保證畫面最高質量的情況下,AV1 編碼器可將效率提高 40%,同時顯卡的占用也更低。包括OBS Studio一代軟體中也會增加AV1格式的支持。另外我們還能通過 GeForce Experience 和 OBS Studio 錄製高達 8K60 的內容,這樣我們做遊戲錄製也會變得更為輕鬆。

  包括我們之後測試時使用的遊戲內錄視頻都是支持AV1格式,同時編碼器NVENC在資源占用和適配上做得越來越好。

文章來源: https://twgreatdaily.com/d4bbc33d705c746c34cdae9d38a3bc7c.html