在合作五年時間後,三星與AMD的緣分似乎要走到盡頭了。日前有爆料信息顯示,三星方面正在自研GPU、或將會放棄與AMD共同開發的Xclipse GPU方案,預計在2026年推出的Exynos系列新款SoC上將會拋棄AMD、改用自研GPU架構。
三星在移動端放棄AMD的RDNA GPU圖形IP,轉而再次開啟自研GPU其實並不讓人感到意外。自2019年三星與AMD達成合作協議算起,在這五年時間裡基於RDNA GPU圖形IP打造的SoC廣為人知的其實只有兩款,分別是2022年春季亮相的Exynos 2200和2024年的Exynos 2400,Exynos 2300則是由於三星自己GAA工藝的問題胎死腹中。然而遺憾的是,雙方合作僅有的這些成果實際表現只能用差強人意來形容。
採用當時最新4nm製程,首次支持移動端光線追蹤技術的Exynos 2200,可以說是完美詮釋了高開低走,其最初曝光時跑分成績直接碾壓蘋果的A14,甚至追上了桌面端的M1。可是如此誇張的跑分背後,卻是三星將Exynos 2200基於RDNA打造的Xclipse GPU頻率設置為1.9GHz,結果導致了無法解決的發熱問題,以至於後續不得不將GPU頻率從1.9GHz下調到1.69GHz、再降到1.49GHz,最後更是只能穩定在1.29GHz。
待到跳票多次的Exynos 2200與Galaxy S22系列一同亮相時,有好事者對比了Exynos 2200與同期高通驍龍8 Gen1的實際表現。結果在3DMark Wild Life的測試中,Exynos 2200的成績比驍龍8 Gen1低了30%,GFXBench曼哈頓離屏測試的成績也比後者低了24%。
到了兩年後的Exynos 2400上,這一情況也並未發生根本性的改變。在一系列的性能基準測試中,這款SoC落後於同時代的驍龍8 Gen3達到了10-15%。
更為致命的是,三星押注的「移動光追」概念至今仍沒有收到手機遊戲開發者的青睞。在與AMD達成合作後,移動光追技術就被三星視為是新Exynos平台的一大亮點。事實上,Exynos 2400唯一對比驍龍8 Gen3取得優勢的項目就是光線追蹤,前者在3DMark Solar Bay光線追蹤基準測試中的性能表現更強、且功耗卻低於後者20.5%。然而遺憾的是,對於移動光追遊戲開發者卻並不感冒。
過去數年,除了《逆水寒手游》,整個業界的重點項目幾乎沒有哪一款會拿移動光追說事。而網易則一向是將《逆水寒手游》作為各種新技術的試驗田,不僅僅是移動光追,諸如元宇宙、AIGC也都曾經出現在這款遊戲中。由此可見,移動光追並未如桌面端的光追一般,在業界以及玩家群體中獲得太多的影響力。
而開發者對於移動光追這個概念興趣缺缺的原因其實也很簡單,因為其既花錢、還很難作為一個吸引玩家的賣點。事實上,光線追蹤的目的是模擬現實世界中水面倒影、物體表面的光線反射等細節,進而讓遊戲畫面更加真實。
但真正在遊戲中,玩家的視線往往都集中在自己控制的人物和敵方角色,以及地圖、血量等信息上。桌面端顯示設備的尺寸更大,因此玩家的視野更為寬闊,此時人眼動態捕捉能力有限的這個問題並不突出。可手機受到螢幕尺寸的限制,無論MMORPG、FPS,還是MOBA,玩家控制的角色往往都會占據畫面的主體,這就導致了移動光追帶來的畫面細節提升,在玩家動態處理信息的過程中很容易被忽略。
換句話來說,移動光追帶來的擬真感只能在靜態畫面上被感知,一旦畫面動起來,玩家根本就體驗不了光追所帶來的沉浸感。反映在開發者層面,用更漫長的渲染管線和更高的性能開支,卻只能換取聊勝於無的畫面效果提升顯然性價比不高,這也正是移動光追的命門。
那麼問題就來了,三星和AMD強強聯手搞出來的移動端GPU性能卻不盡如人意呢?根源其實出在AMD貢獻的RDNA 2上。這個架構固然讓Exynos 2200/2400獲得了光線追蹤(RT)和可變速率著色(VRS)等高級圖形功能,但RDNA 2作為一個原本應用在桌面端GPU的架構,它被設計是應用在PC、筆記本電腦和遊戲主機上的,在移動端可以說是水土不服,畢竟它所使用的IMR渲染管線並不那麼適合移動端。
所謂渲染管線,就是CPU傳送給GPU一堆數據,GPU經過一系列處理最後渲染得出一副二維圖像,而無數二維圖像就共同構成了我們所看到的畫面。桌面端GPU使用的IMR每一次渲染API的調用,都是按照管線的順序處理每個圖元,會直接繪製圖形對象。所以IMR在每一次物體顏色和深度的渲染中,都要讀寫Frame Buffer(幀緩衝)和Depth Buffer (深度緩衝)。
IMR的優勢就是渲染管線沒有中斷,因此有利於提高GPU的最大吞吐量、最大化地使用GPU性能,但代價就是需要巨大的內存帶寬,而這一點在桌面端是使用L1、L2緩存的優化來解決。可遺憾的是,由於移動端GPU的體型和功耗限制,IMR長期以來是不被應用的,移動端GPU使用更多的是TBR (Tile-Based Rendering)渲染管線,其特點是就減少帶寬開銷,將幀緩衝分割為一小塊一小塊、然後逐塊進行渲染,繪製完畢再將繪製寫入到內存的幀緩衝中。
在Exynos 2200/2400之前,上一次在移動端GPU上使用IMR還是Tegra X1的Maxwell,當時英偉達為了使用IMR,直接就將升級的重點放在了內存帶寬上,其理論峰值內存帶寬從Tegra K1的14.9 GB/s升至25.6 GB/s。但以Exynos 2200為例,即使它使用了帶寬可達51.2GB/s的LPDDR5-6400內存,但這款SoC的FP32浮點算力來到了1TFLOPS的水平,正好是Tegra X1的一倍。
Exynos 2200面臨的問題其實與當年的Tegra X1大同小異,實際情況也確實如此,那就是同樣都有超高的發熱量。在內存技術沒有革命性的進展之前,將桌面端GPU直接移植到移動端,在有限的晶片面積下還要兼顧CPU的性能和發熱,簡直就是在螺螄殼裡做道場。
顯然並不是每一次彎道超車都能成功,所以在繼續與AMD的合作對於Exynos而言已經沒有太大意義的情況下,三星顯然還不如以此為基礎來打造自研GPU。