RTX 40系的中高端顯卡在這半年多的時間裡面已經陸續發布,但對於更廣大的玩家來說或許更加關心的是甜品級的60級別顯卡表現。畢竟根據Steam遊戲平台的統計,目前硬體排行榜前五的顯卡當中有4款都是60級別,而接近80%的玩家都在1080P或更低的解析度下運行遊戲。而剛剛發布的RTX 4060 Ti顯卡起售價也正好是定在了3199元,和上一代同定位產品大致接近,那麼本期我們就來實測看看它的表現。
01/ Ada Lovelace架構與GeForce RTX 4060 Ti 8GB
Ada Lovelace架構
作為RTX 40系列顯卡核心所採用的新一代架構,Ada Lovelace架構Ada Lovelace架構核心配備了全新的第三代RT Core(光線追蹤核心)、第四代Tensor Core(張量核心)以及SM(流式多處理器)。而其SM(流式多處理器)可帶來至多兩倍的性能提升,並且結合全新的TSMC 4N工藝加持,帶來至多兩倍的能效提升。
Ada Lovelace架構核心 SM結構圖
而在光追性能的提升上,Ada Lovelace架構核心於RT Core上引入的兩個全新硬體單元——Opacity Micro-Map引擎和Displaced Micro-Mesh引擎,其可以提升光線追蹤的計算效率,則使得全景光線追蹤得以實現,從而帶來更為逼真的陰影及紋理細節,
第三代RT Core結構示意圖,相比前代,增加了2個功能
Ada Lovelace架構核心配備的第四代Tensor Core則是引入了來自專業級H100數據中心GPU的 FP8 Transformer 引擎,通過引入專業級產品的配置帶來了更加強悍的AI算力。在算力方面的提升不僅是在DLSS 3技術中有所發揮,也可以使得其在AIGC的內容生產上擁有更好的表現。
Ada Lovelace架構核心的升級也帶來了Shader Execution Reordering(SER/著色器執行重排序)技術來更好的對於著色器的工作進行調度排序。在夜間接入這一項功能接口的應用中,可根據使用過程中的不同負載進行執行渲染,將負載較為統一的畫面進行集中處理以提升效率,降低畫面渲染的工作資源開銷。
SER 著色器執行重排序
對於影視需求用戶來說,Ada Lovelace架構核心還配備有全新的第八代NVENC硬體編解碼器,這一全新的第八代NVENC硬體編解碼器在支持傳統的H.265等格式之外,整合了對AV1視頻編碼格式的支持,有效提升了在視頻內容創作方面的生產力表現。
Ada Lovelace架構核心在現階段顯存帶寬提升有限的情況下,大幅度提升了Die上的L2緩存容量,從而帶來數據命中率的有效提升,減少數據頻繁訪問VRAM的次數,為光線追蹤等相關性能場景的表現帶來更高的收益。
DLSS 3
Ada Lovelace架構核心的多方面升級,也讓RTX 40系列顯卡獲得DLSS 3技術的加成。而根據NVIDIA官方的介紹,DLSS 3技術由DLSS 2(DLSS 超解析度技術)+DLSS 幀生成技術+NVIDIA Reflex這三方面所共同組成。
DLSS 3幀生成技術依賴於Ada Lovelace架構核心的獨立光流處理器以及Tensor Core的AI算力,這一項技術在運作過程中,將通過光流處理器所得到的一系列數據,以光流加速技術(Optical Flow Acceleration,簡稱為OFA)以及Tensor Core所提供的AI算力來進演算畫面內容以及進行畫面的優化,從而實現幀數上的提升。
DLSS 3幀生成技術可直接生成遊戲第1幀3/4的像素以及整個遊戲第2幀,相當於使用1/8的算力,就完成了整個計算過程。而通過這一個流程的循環,可在提升幀數的同時節省資源開銷,進一步帶來更好遊戲體驗。
DLSS 3幀生成技術可以極大提升遊戲的幀數表現,但由於可能帶來延遲的增加,因此DLSS 3中幀生成技術的開啟需要整合NVIDIA Reflex這一技術來降低渲染以及操作的延遲,從而帶來幀數更高且流暢性更佳的體驗。根據NVIDIA官方的說法,DLSS 3幀生成技術配合NVIDIA Reflex,可使得遊戲體驗擁有媲美甚至是超越原生級的渲染、操作體驗。
RTX 4060 Ti 8GB
GeForce RTX 4060 Ti採用的是全新一代Ada Lovelace架構核心AD106, 一顆完整的AD106核心擁有完整的3組GPC,每個含有6個TPC,共18組TPC,每組有兩個SM單元,共36組,4608個CUDA單元,擁有一個NVENC和兩個NVDEC。
完整AD 106核心架構切片圖
不過,和完整的AD106核心相比,RTX 4060 Ti少了兩個SM單元,有4352個CUDA單元,而且NVDEC也少一個,與RTX 4070一樣擁有NVENC和NVDEC各一個。
RTX 4060 Ti 8GB 核心架構切片圖
在顯存帶寬方面,我們可以注意到RTX 4060 Ti 8GB配備的是128 Bit的顯存控制器,結合18 Gbps的顯存速率以及8GB的GDDR6顯存容量,總計顯存帶寬為288 GB/s。
從這一顯存帶寬數據來看,其相比較於上一代RTX 3060 Ti的448GB/s顯存帶寬有很大的跌幅。不過英偉達官方的解釋是,由於RTX 4060 Ti 在Die上配備了32MB的大容量L2,相比較於RTX 3060 Ti所配備的4MB L2有著8倍的容量提升。大容量L2的配備使得數據命中率有著大幅度的提升,核心無需頻繁訪問VRAM,從而有效減少了對於顯存帶寬的依賴。
英偉達官方舉例表示RTX 4060 Ti 通過配備32MB的大容量L2,實現了等效554 GB/s的顯存帶寬,而通過32MB大容量L2的配備,即可支持RTX 4060 Ti 在1080P定位下全高畫質+光追的高幀率遊戲體驗。
小容量L2緩存需頻繁調度VRAM
大容量L2緩存可減少調度VRAM的次數
我們本次測試的影馳 GeForce RTX 4060 Ti 8GB星曜OC的Boost頻率提升到了2685MHz,相比較於公版RTX 4060 Ti的2535 MHz更高,可以在性能方面帶來一定提升。
02/ 外觀拆解
外觀方面,40系影馳星曜顯卡主打純白美學與ARGB炫光設計,外殼採用鑽石風切割設計覆蓋,下放則是的純白色的一體金屬裝甲。影馳 GeForce RTX 4060 Ti 8GB星曜OC顯卡三圍尺寸為含擋板為327*147*48mm,相比同系的RTX 4070體積要更小一些。
顯卡採用的新一代星卓 III 散熱系統,配備 3 個特製直徑 92mm、厚度 20mm 的高規格風扇,每個風扇擁有 11 片透明的靜霜扇葉,可實現更強風力和更大風量,並支持智能啟停。
純白色的金屬背板有將近一半的區域採用了鏤空設計,氣流可以直接穿透顯卡,大大提升了散熱效率。
顯卡供電接口採用了傳統的單8 Pin設計,除了安裝更加方便以外,對純白主題裝機來說,舊款電源的白模組線可以之間連接,免去轉接到新接口也會讓機箱更加整潔。
顯卡側板提供3個DP1.4a和1個HDMI 2.1接口,整卡厚度約占2.5槽。
隨顯卡附贈了星曜專屬的ARGB燈光支架,可以實現與顯卡的燈光同步。
燈效也是星曜系列的設計亮點之一,顯卡頂部信仰 LOGO 燈營造出千層鏡光效,搭配三個透明 ARGB 扇葉,酷炫兼具未來科技感,電競氛圍感全線拉滿。
星曜系列的透明上蓋一直是採用了易於拆卸的設計,可以支持個性 DIY塗裝定製且不影響售後質保,玩家可以更加自由地打造個人專屬外觀。
進一步拆開散熱模組我們還能看到星卓 III 散熱系統包含的三根6mm 鍍鎳復合熱管、大面積高效能均熱板和鰭片,結合回流焊接工藝,帶來更強的散熱性能。
在PCB的部分,影馳 GeForce RTX 4060 Ti 8GB星曜OC採用了8+1相的強化供電設計,規格高於公版的5+1相。
位於正中間的,自然是AD106-350-A1核心,核心周圍有四顆三星的GDDR6顯存,單顆容量2GB、位寬32bit,合計8GB、位寬128bit。
03/ 基準測試
為了更好的模擬日常用戶的配置情況,筆者將以影馳 GeForce RTX 4060 Ti 8GB星曜OC與英特爾13代酷睿i5-13600K為基礎,搭建相對應的測試平台,具體配置可看下方圖表。
=
通過GPU-Z查看相關的信息,我們可以看到影馳 GeForce RTX 4060 Ti 8GB星曜OC的相關信息,其Boost頻率為2685MHz,TGP為160W,MAX 功耗可手動解鎖至 200W以獲得更高的手動超頻空間。
在3D Mark的理論測試中,影馳 GeForce RTX 4060 Ti 8GB星曜OC相比較於上一代的甜點級產品RTX 3060 Ti綜合下來擁有13%左右的理論性能提升。而得益於RTX 4060 Ti顯卡在核心方面針對光追性能的提升,我們也可以看到,影馳 GeForce RTX 4060 Ti 8GB星曜OC在代表光追測試的Port Royal項目上擁有15%的得分差距。
04/ 遊戲性能測試
在測試的四款3A遊戲中,影馳 GeForce RTX 4060 Ti 8GB星曜OC除了在《戰爭機器5》這一款遊戲中相比較於上一代RTX 3060 Ti基本持平以外,在其他的遊戲中都能有10%左右的性能領先,可實現流暢的畫面運行。
當然,對於RTX 40系列顯卡來說,更為顯著的優勢會體現在支持DLSS 3幀生成的遊戲上。影馳GeForce RTX 4060 Ti 8GB星曜OC可憑藉核心內置的光流加速器以及更強的AI算力,來對遊戲畫面進行演算,提升遊戲幀率表現。
隨著英偉達越來越多的遊戲開發者進行合作,後續推出的遊戲中會有越來越多產品支持DLSS 3。而目前,已經有包括《F1 22》、《賽博朋克 2077》、《巫師三 重製版》等一系列遊戲加入了DLSS 3的支持,即將推出的《魔戒:咕嚕》這一指環王IP的遊戲也會有DLSS 3的加入。
通過以下三款光追遊戲的實測對比我們也可以看到,影馳 GeForce RTX 4060 Ti 8GB星曜OC在開啟DLSS 3後,對比只能開啟到DLSS 2的RTX 3060 Ti來說,幀率領先的幅度可以擴大到40%以上,甚至部分光追遊戲在2K解析度下也能獲得超過60幀的平均幀。
有朋友可能會對DLSS 3是否會對遊戲畫面以及遊戲延遲產生劣化影響,因此筆者也是對其進行了實際的測試。
在同樣的遊戲畫面中通過OSB截取開啟DLSS 3和關閉DLSS的畫面可以看到,開啟DLSS 3模式的畫質(下圖左半部分),比原生解析度(下圖右半部分)甚至擁有更為銳利的畫面表現。因此玩家基本上無需擔心開啟DLSS 3後會有遊戲畫面劣化的問題。
而在遊戲的延遲方面,我們可以看到影馳 GeForce RTX 4060 Ti 8GB星曜OC在開啟了DLSS 3之後,遊戲不僅是在幀數方面有所提升,並且也可以因為NVIDIA Reflex的介入以及平均幀數的提升,帶來更低的遊戲延遲。
筆者也在遊戲過程中記錄了RTX 3060 Ti以及影馳 GeForce RTX 4060 Ti 8GB星曜OC的平均功耗情況。可以看到,同樣為「甜點」級別顯卡的情況下,RTX 4060 Ti在遊戲過程中所需的功耗相比較於上一代產品有大幅度降低,結合上面我們實測的幀數來看,能耗比有了很大的提升。
05/ 生產力測試
首先在視頻創作方面,在對同一段10分鐘的1080P素材導出為H.265格式時,影馳 GeForce RTX 4060 Ti 8GB星曜 OC相比較於RTX 3060 Ti已經是快出了不少。而當進行視頻轉碼為AV1格式時,由於RTX 3060 Ti並不支持到AV1格式的編解碼,所以只能依賴於CPU進行軟體編解碼,效率大幅度下降。影馳 GeForce RTX 4060 Ti 8GB星曜OC相比較於來說有了近10倍的效率提升。
在渲染能力方面,筆者採用到了V-Ray5 BenchMark 以及Blender BenchMark來對RTX 3060 Ti以及影馳 GeForce RTX 4060 Ti 8GB星曜OC進行相關的對比。從兩個項目的測試可以看到影馳 GeForce RTX 4060 Ti 8GB星曜OC的相當明顯,相比較於RTX 3060 Ti擁有更好的表現。
在集成了眾多工業軟體基準測試的SPECviewperf2020中, RTX 4060 Ti也是形成了對於RTX 3060 Ti的全方位提升,對於有相關需求的用戶來說更加適合購買。
近期基於AIGC的生成式AI應用也是非常的火熱,筆者進行了相同生成條件下的Stable Diffusion繪圖測試。在同樣的條件設置下,影馳 GeForce RTX 4060 Ti 8GB星曜OC生成20張圖片的耗時為194秒,而RTX 3060 Ti耗時為222秒。綜合換算下來,影馳 GeForce RTX 4060 Ti 8GB星曜OC每分鐘可生成 6.185張圖片,RTX 3060ti 每分鐘可生成5.405張圖片。RTX 4060 Ti整體擁有14%的算力提升。
另外,英偉達在近期推出了一項重磅更新——RTX Video Super Resolution,這一項功能翻譯過來就是視頻超解析度技術,簡稱VSR。它可以允許用戶在播放視頻時,以GPU配備的Tensor Core以及強悍的AI算力來進行內容的計算,從而提升畫面解析度,帶來至多4K解析度視頻輸出,為用戶帶來視頻觀感的提升。
在這裡我們也通過截取同一幀畫面,通過英偉達ICAT進行畫面對比,方便各位感受到VSR 帶來的畫面效果提升。可以看到,通過開啟VSR進行增強後,畫面的細節有了明顯的改善,並且畫面的噪點有了明顯的降低。
左480P原生畫面,右 480P RTX VSR 4X畫面
左480P原生畫面,右 480P RTX VSR 4X畫面
在本地端的VLC播放上,筆者選取了720P的《少女與戰車》播放,通過播放內容的對比我們可以看到,在VLC播放時開啟VSR功能後,畫面的噪點被進行了明顯的壓制,並且畫面的線條整體更為銳利清晰,對於觀感加成不少。
左720P原生畫面,右 720P RTX VSR 4X畫面
左720P原生畫面,右 720P VSR 4X畫面
從畫面的對比上,我們可以看到VSR功能帶來了更好的畫面觀感,對於用戶的體驗是有明顯的加分的。而有朋友會好奇,開啟VSR後GPU會進行相關的內容計算,這部分計算會不會帶來更高的功耗?因此我們也是針對這一問題進行了功耗測試。
在4K解析度螢幕下通過網頁端播放1080P《某科學的超電磁炮》時,RTX 4060 Ti 8GB在不同的VSR檔位設置中的功耗區間如下:
在4K解析度螢幕下通過本地VLC播放器播放720P《少女與戰車》時,RTX 4060 Ti 8GB在不同VSR檔位設置中的功耗區間如下:
從功耗來看,RTX 4060 Ti 8GB在開啟VSR功能後,其功耗的增長並不大,但是卻可以帶來更好的畫面觀感,因此推薦用戶開啟這一項功能。
06/ 散熱測試
在室溫24±1℃,採用開放式測試台的情況下,筆者對於影馳 GeForce RTX 4060 Ti 8GB星曜OC進行了散熱方面的測試。
在使用FurMark烤機測試30分鐘後,影馳 GeForce RTX 4060 Ti 8GB星曜OC的溫度穩定在58℃左右、顯卡風扇轉速為1553轉、功耗約160W,低溫而安靜。
07/ 總結
在光線追蹤遊戲對配置要求越來越高的當下,影馳Ge ForceRTX 4060 Ti星曜 OC作為新一代的甜品級顯卡,通過DLSS 3技術為1080P遊戲玩家帶來了全高光追畫質過百幀級的高幀流暢體驗,甚至在部分2K光追遊戲當中也有了一戰之力,對比RTX 3060 Ti的提升還是非常明顯的。同時,AV1編碼功能的加入也為遊戲主播及創作者帶來了更高效的選擇。此外,它超低的功耗以及傳統的8 Pin供電接口也為舊機升級的用戶帶來了不少的便利。