讓普通電腦擁有96核心、192線程!新一代AMD銳龍線程撕裂者處理器技術性能解密

2023-10-20     微型計算機雜誌

原標題:讓普通電腦擁有96核心、192線程!新一代AMD銳龍線程撕裂者處理器技術性能解密

對追求超高性能或者對內存、擴展性能等特性有需求的工作站用戶或專業用戶而言,AMD的銳龍線程撕裂者系列處理器基本上是目前市場上唯一的選擇,畢竟對手的HEDT平台自酷睿i9-10980XE、X299平台後就很長時間再無更新,至強處理器的核心數量也有明顯不足。而在2022年3月,AMD發布的銳龍線程撕裂者Pro 5000WX系列處理器中,AMD就將單個插槽的處理器核心數量提升到了64核、128線程,把專業平台的性能推向了一個高峰。

AMD特別邀請《微型計算機》記者前往AMD美國奧斯汀總部發布了新一代銳龍線程撕裂者處理器,AMD奧斯汀總部離奧斯汀主城其實還有相當一段距離,上圖中,遠處的大廈輪廓就是奧斯汀主城區。「7171 Southwest Parkway, Austin, Texas 78735」就是AMD奧斯汀總部的地址。

在一年後的2023年10月,憑藉著強大的創新與執行力,銳龍線程撕裂者Pro 5000WX系列的「接班人」按時到位。AMD特別邀請《微型計算機》記者前往AMD美國奧斯汀總部發布了其新一代AMD銳龍線程撕裂者Pro 7000WX系列、銳龍線程撕裂者7000系列處理器,以及新的Radeon Pro系列專業顯卡,其AMD銳龍線程撕裂者處理器的最高單插槽處理器核心數量攀升至驚人的96核心、192線程。那麼,全新的銳龍線程撕裂系列處理器有哪些型號和新的技術特性、新的Radeon Pro系列又有怎樣的獨特之處呢?今天本文就和大家一起來解讀AMD線程撕裂者和Radeon Pro全新產品的配置、架構和相關性能信息。

AMD奧斯汀總部園區、辦公大樓一覽

在處理器發展歷史上,AMD對Chiplet架構的應用絕對是值得重點銘記的經典技術應用案例。AMD通過Chiplet技術和處理器架構更新,極大地提高了單插槽處理器核心數量上限。除了針對企業級用戶的EPYC處理器外,藉由強大的架構、技術優勢,AMD在2017年推出了首代銳龍線程撕裂者Ryzen Threadripper處理器,一上市就憑藉強大的規格和極高的性能得到了工作站和專業用戶的青睞。隨後AMD又推出了多代線程撕裂者產品,無一不是占據了當時的處理器性能之王寶座。從市場角度來看,銳龍線程撕裂者整個產品線很好地填補了從HEDT平台到企業級平台之間的鴻溝,讓工作站與專業用戶也能夠以較低的成本享受到企業級產品的技術,實現了從消費級到企業級產品的平滑過渡。

時間來到了2023年,AMD當前在市場上最重要的產品是以Zen 4架構為核心的銳龍系列處理器,以及EPYC 9004系列企業級產品。在銳龍線程撕裂者這條產品線上,AMD依舊依靠的是Zen 3架構的線程撕裂者5000系列。時不我待,終於在2023年10月中旬,AMD發布了全新的線程撕裂者系列,包括銳龍線程撕裂者Pro 7000 WX以及銳龍線程撕裂者7000系列。除此之外,AMD還發布了新的Radeon Pro W7900和Radeon Pro W7800,我們一起來了解一下這些產品的情況吧。

AMD的銳龍線程撕裂者系列產品目前分為Pro系列和普通系列。其中Pro系列面向的是工作站用戶,普通系列面向的是頂級專業用戶。AMD目前在售的銳龍線程撕裂者產品是5000WX系列。AMD給出的數據顯示,上一代銳龍線程撕裂者Pro 5995WX這樣的64核心處理器,面對競爭對手的英特爾至強W9-3495X 56核心處理器就存在最多37%~28%的性能優勢。

對Pro系列的用戶來說,他們對性能等需求非常巨大,進行的也是科學計算、建築設計、模擬處理以及AI訓練等工作,因此普通消費級產品的性能難以滿足他們的需求,而真正的企業級產品配置和購買又過於麻煩。並且,整個工作站市場還在不斷增長。

AMD給出的例子顯示,虛擬產品、汽車仿真、老化基礎設施改進模擬以及AI行業,在2023年到2032年的10年內,將擁有至少10%的增長率,諸如AI的年化復合增長速度可以達到19%,容量日漸增加,市場前景還是非常巨大的。AMD還給出一個數據,那就是工作站設備的性能從2017年到2023年增長了11倍,市場產品也覆蓋了從台式機到筆記本電腦的各種形態,使用這種產品的企業也包含了包括阿斯頓馬丁、EA、EPIC、FOX Sports等諸多不同行業和類型在內的企業。

鑒於此,雖然目前AMD的產品相對於競爭對手還有一定優勢,但是考慮到市場增長速度以及用戶需求,AMD還是決定發布全新一代Zen 4架構的線程撕裂者新品。

最高96核心:AMD銳龍線程撕裂者Pro 7000WX/7000系列登場

對AMD來說,銳龍線程撕裂者系列處理器的問題不在於市場競爭力或者性能不足,而在於如何超越自己的前代產品。在這一點上,AMD給出了線程撕裂者Pro 7000WX系列的三個重要特點。

一是新的產品將最高擁有96個Zen 4內核,支持最多192個線程,這是目前x86處理器所能提供的單插槽內擁有最多數量核心的產品,配合高頻率,將帶來史無前例的超高性能。

二是新的產品將帶來最多128個PCIe 5.0通道,利用PCIe 5.0極高的帶寬和超多的通道數量,能夠帶來極強的擴展性能。

三是提供了極高的安全特性和管理能力,能夠為專業用戶帶來更好的管理特性和更出色的數據安全保護。

在更具體的一些性能指標上面,AMD給出了銳龍線程撕裂者Pro 7000WX對比前代產品在技術上的提升,包括整體架構從之前的Zen 3提升到Zen 4,IPC得以大幅度提升(後文還有詳細解讀),L3緩存數量提升至384MB,核心數量從前代64顆提升至最多96顆,線程數量也相應提升至192線程。頻率方面是本次線程撕裂者Pro 7000WX的亮點,提升至最高5.3GHz,對如此核心規模的處理器來說,依然能達到5GHz以上的超高頻率是非常難能可貴的,很多最高頻率在5.0GHz以上的處理器,一般產品核心數量要少得多。另外還有整體互聯規格從之前的PCIe 4.0提升至PCIe 5.0,帶來了互聯性能的翻倍提升等。

本次AMD推出了6款銳龍線程撕裂者Pro 7000WX處理器產品,其中最高端的產品是7995WX,96核心192線程,最高頻率5.1GHz,基準頻率2.5GHz,TDP 350W,其餘還推出了64核心、32核心、24核心、16核心和12核心的產品。除了96核心的7995WX外,其餘的產品核心數量完美對位上代產品。但是值得注意的是,整體Boost頻率都超越了5GHz,32核心以及以下產品的Boost頻率甚至達到了5.3GHz。相比之下,上代產品的最高頻率為4.5GHz,比新一代產品低了不少,相對應的上代產品TDP只有280W,新一代產品的功耗有所增加,達到了350W。

AMD副總裁兼客戶渠道業務總經理David McAfee先生在會上發布了銳龍線程撕裂者Pro 7000WX/7000系列處理器

在這裡需要注意的是7955WX和7945WX兩款產品,這兩款產品的核心數量為16個、12個,相比消費級桌面版本的銳龍系列處理器在核心數量上並沒有顯著優勢,頻率也更低一些,看起來似乎性能方面優勢不夠。不過線程撕裂者的特點在於極高的擴展性,最重要的就是128個PCIe通道,可以轉接為任意想要的接口,相比之下消費級產品在這方面就顯得乏善可陳了。

有關這一點,AMD也特別予以強調。AMD指出,針對AI計算等現在流行的計算需求而言,PCIe通道的規格和數量是非常重要的,比如AI計算需要更多的GPU,這些GPU又需要更多的PCIe插槽,因此128個PCIe插槽將帶來極大的擴展性。另外,新的線程撕裂者處理器利用更多的PCIe擴展帶寬,在雲計算、AI邊緣計算方面也將有不錯的表現。

最後再來看看安全性方面的內容。作為Pro系列產品,銳龍線程撕裂者Pro 7000WX系列在安全性能方面表現顯然不是普通消費級產品可以媲美的。AMD為這款產品首先是提供了專業級別的安全功能,以及安全管理工具等。針對企業級用戶,銳龍線程撕裂者Pro 7000WX將獲得18~24個月的安全支持,這也是消費級產品沒有的特性。

在介紹完了有關銳龍線程撕裂者Pro 7000WX相關的信息後,我們再來看看有關線程撕裂者7000系列的相關內容。AMD認為,雖然線程撕裂者Pro 7000WX系列非常強大,但是還是有部分用戶不需要那麼強大的擴展能力或安全功能,比如線程撕裂者Pro 7000WX搭配WRX90主板晶片組組成的PRO平台,提供的8通道DDR5內存、128個PCIe 5.0通道以及安全管理特性等,因此,AMD也推出了不支持上述功能的銳龍線程撕裂者7000系列。

銳龍線程撕裂者7000系列將搭配TRX50主板晶片組組成新的HEDT平台。這個新的平台支持4通道DDR5內存,擁有最高48個PCIe 5.0通道,但不再支持Pro級別安全設定。從實際需求角度來說,HEDT平台的用戶往往在數據安全和企業級部署方面沒有那麼敏感,同時在內存帶寬、設備擴展需求上也沒那麼強烈,減少這些配置反而可以起到降低成本、提高產品市場接受度的目的,AMD在線程撕裂者7000系列上這樣做也是合理的。

銳龍線程撕裂者7000系列由3款處理器組成,分別是銳龍線程撕裂者7980X、7970X以及7960X,最大核心數量也僅有64核心、32核心和24核心,最高頻率為5.1GHz、5.3GHz和5.3GHz,TDP功耗值全部都為350W。至於之前人們探討的線程撕裂者16核心的版本則不太可能推出,因為對專業用戶來說,如果想選擇16核心的處理器,銳龍9 7950X系列就是不錯的選擇。

當然,如果有HEDT用戶特別喜歡超多核心處理器,AMD也特別提到,AMD TRX50系列晶片組也是支持線程撕裂者Pro 7000WX系列處理器的,因此玩家也可以購買諸如銳龍線程撕裂者Pro 7995WX處理器搭配TRX50晶片組,實現HEDT平台的96核心192線程,這可能是目前市場上能夠實現的單插槽性能最強的x86平台了。不過AMD沒有提及線程撕裂者Pro系列處理器在TRX50晶片組的平台上使用後,Pro系列的安全特性等究竟是否可以開啟,目前來看大機率也是直接關閉的,其他的包括內存通道、PCIe通道等,應該也不可能擁有Pro系列的規格了。接下來讓我們繼續深入了解,來看看線程撕裂者7000全系列究竟為什麼這麼強。

全新架構搭配超多核心:解密線程撕裂者7000全系列強大之因

說起線程撕裂者7000全系列為什麼如此強悍,AMD給出了三個原因:首先是強悍的Zen 4架構,其次是全面強化的SoC體系,最後則是極高的能效比。我們先來一個個解讀。

Zen 4:13% IPC提升帶來強大單線程性能

說起Zen 4架構我們都不陌生了。這個架構從2022年發布開始,就貫穿了AMD的消費級、企業級產品,無論是桌面的銳龍7000系列,還是企業級的EPYC 9004系列,以及今天我們要介紹的線程撕裂者7000全系列,都是基於Zen 4架構擴展而來的產品。

AMD的Zen 4架構是基於Zen 3架構改進設計而來。在Zen 4架構設計上,AMD的希望實現更高的性能、更低的延遲和更好的能效比。其中性能的提升來自於頻率和IPC的提升;更低的延遲主要是提升了緩存的性能並且對整個架構的平均延遲進行了降低;能效比方面則通過新的設計、新的工藝以及將移動端的一些技術移植在桌面端而來,降低了整個CPU的動態功耗。

具體到架構來看的話,新的Zen 4架構在分支預測、Op緩存、指令排序相關窗口、整數或浮點寄存器、每核心更深的緩衝區、後端讀取和加載等方面進行了優化,另外還加入了AVX-512指令集以及重新調整的每核心1MB、8-way L2緩存。

前端方面,分支預測部分被大幅度加強。AMD目前使用了一個更強有力的分支預測單元,每周期可以執行2次分支預測,此外,L1 分支目標緩衝區的容量提升了50%,來到了1.5K條目,L2分支目標緩衝區目前來到了更大的7K。在微指令融合為宏操作方面,Zen 4現在每周期可以執行9次操作。Zen 4還擁有更大的op緩存、更大的指令回寫隊列等,這些增大都能夠在很大程度上提升處理器的前端性能。

執行單元部分,Zen 4沒有帶來有關執行單元數量的提升,而是持續增大重排緩衝區(25%至320條目),增加了浮點/整數寄存器的體積,整數從192增加至224,浮點從160增加至192,核心緩衝區更深了,來到了320條目。執行單元方面依舊是每周期10個INT和6個FP。

後端的讀取和加載部分,Zen 4現在擁有更大的讀取排序單元,更少的緩存埠衝突以及增大了50%的L2 DTLB。另外依舊擁有每周期3個內存操作,最多每周期3個讀取和2個寫入等。

緩存方面最明顯的改變是每個核心的L2緩存翻倍到了1MB,這樣可以降低CPU核心的未命中率並增加命中率,同時也降低了從L3以及內存讀取數據的幾率。但是由於L2緩存增大,因此延遲也相應提升,L2目前的延遲增加到了最多14個周期,L3延遲提升至最多50個周期。L3緩存方面Zen 4繼承了Zen 3的改進,那就是每個CCD中的8個CPU核心共享32MB L3緩存,L3相對L2採用了包含式設計,也就是說L3中擁有L2的數據標籤,這樣一來可以更好地探測數據存儲情況並快速查找信息。

在指令集方面,Zen 4實現了對AVX 512指令集的支持。Zen 4採用了2個AVX 256來合併執行一個AVX 512,而英特爾採用了獨立的AVX512 SIMD核心。AMD的設計可以節省電晶體資源,並且在很大程度上不需要降低頻率來運行AVX 512,但是當同時執行AVX2和AVX512的時候,則必須完成一個後再執行另一個。AMD表示,自己的AVX-512比之前的Zen架構多核心執行FP32的工作效能提升了30%。此外,現在Zen 4也可以實現對BF16數據格式的支持了,這是AI計算中新興起的一種重要數據格式。

AMD還給出了有關Zen 4和Zen 3架構的性能改進情況。總的來看,Zen 4架構相對Zen 3架構,帶來了大約13%的IPC提升。其中貢獻最大的是前端的改進,其次是存儲和加載部分,第三是分支預測部分,執行部分和L2部分的改進帶來的性能增幅則相對較小。

全新的SoC架構:支持最多8通道DDR5和128通道PCIe 5.0

對AMD來說,Zen 4架構固然強大,但是要如何使用、組織如此強大的CPU微架構也是一個不小的難題,這就涉及到了整個處理器的SoC系統架構。AMD對銳龍線程撕裂者7000全系列的SoC系統架構也給予了詳細解析,我們一起來看看。

擁有96顆核心的AMD銳龍線程撕裂者Pro 7995WX處理器,內部由12個CCD、中間的1顆IOD晶片組成。

首先來看整個銳龍線程撕裂者7000全系列的宏觀結構圖,從圖中可知,完整版本的線程撕裂者7000將具有12個CCD,每個CCD有8顆CPU核心,12個CCD總計96顆CPU核心。所有CPU核心和外界數據的溝通交換都通過中央的IOD完成。IOD中布局了PCIe 5.0控制器、DDR5內存控制器、第三代Infinity Fabric以及安全處理器等。值得注意的是CCD的布局,12個CCD被平均分布在IOD左右,每側6個,同時單側的6個CCD也是上下各三個分布。

內部只有8個CCD的線程撕裂者7980X與擁有12個CCD的銳龍線程撕裂者Pro 7995WX

值得注意的是,目前給出的銳龍線程撕裂者宏觀架構圖對應的是Pro系列,一共12個CCD,而HEDT平台的銳龍線程撕裂者7000系列由於最多只有64個CPU核心,因此只布局了8個CCD。另外,對那些核心數量低於96個的線程撕裂者Pro系列處理器來說,比如64個核心的Pro 7985WX,應該也是只有8個CCD啟用,並且這8個CCD應該是更靠近IOD核心的,遠端的部分則由一個單純的矽片進行占位。AMD在EPYC處理器上有類似的方案,也就是不一定都採用有功能的CCD,或者乾脆就是矽片。至於不讓其空置的原因,AMD解釋最主要原因是整個處理器PCB面積太大,需要受力平衡。

接下來再來看看有關內存方面的設計。銳龍線程撕裂者Pro 7000WX系列處理器支持最多8個DDR5 5200內存通道,其峰值帶寬為266GB/s(8chx8Bx5.2GTs),支持RDIMM,最大支持2TB內存等。

AMD在這裡特別提到了內存的配置問題。在使用銳龍線程撕裂者Pro 7000WX系列處理器的情況下,內存被配置為2通道、4通道、6通道或者8通道。其中,系統默認的狀態被稱為NPS1,也就是8通道狀態,用戶可以選擇NPS2(4通道),或者NPS4(2通道)等不同的狀態。AMD認為給與用戶更多選擇,是權衡了延遲、帶寬等多項因素的結果,用戶可以更具自己的情況進行內存方面的配置。

在IOD和CCD的連接方面,Zen 4 CCD通過GMI3連結IOD。AMD的上一代線程撕裂者採用的是GMI2總線,其IO單元內部有8個GMI2總線埠,因此總計能支持8個CCD單元連接,每個CCD則擁有2個GMI總線,可以根據需要進行配置。在銳龍線程撕裂者Pro 7000WX系列處理器上,每個Zen 4架構的CCD還是具有2個GMI3總線,但是IO單元的GMI3總線埠數量則升級到了12個,因此可以最多連接12個CCD,也就是我們前文看到的12x8=96核心。

帶寬和功耗方面,每個GMI3總線每周期可以實現32Bit的數據讀取和16Bit的數據寫入,消耗的能量是2pj/bit。帶寬方面最高可以達到36Gbps,和FCLK的頻率比值是20:1,最高可達1.8GHz。AMD宣稱,GMI3的吞吐能力最高可達GMI2的2倍。

最後再來看看銳龍線程撕裂者Pro 7000WX系列處理器的IO配置方案。我們多次提到,本次最新的處理器最多可以提供128個PCIe 5.0通道,AMD還給了用戶自由配置的方案,比如可以選擇x16的配置,或者2個x8配置,或者4個x4、8個x2或者乾脆16個x1,其中x1配置也可以轉為其它接口使用,比如16個SATA接口等。不過每個高帶寬PCIe通道最多只可以容納9個設備,包含8個x1和1個x8配置。AMD還提到,目前新的產品所能提供的帶寬拜PCIe 5.0所賜,比前代銳龍線程撕裂者高了90%以上。

在整體平台功能方面,AMD給出了銳龍線程撕裂者Pro 7000WX系列處理器搭配WRX90系列晶片組的整體搭配圖。可以看到,CPU端可以提供的對外連接資源包括:

6個PCIe 5.0 x16通道

1個PCIe 5.0 x8通道

4個USB 3.2 Gen 2接口

4個SATA接口

HD Audio通道

2個由PCIe 5.0 x4通道轉換的M.2 2280 SSD插槽

1個由PCIe 5.0 x4通道轉換的M.2 2280 SSD或者SATA通道

1個由PCIe 5.0 x4通道轉換的MCIO插槽

2個由PCIe 3.0 x4通道轉換的M.2 2280 SSD插槽

同時,WRX90晶片組可以提供的對外連接資源包括:

1個由PCIe 4.0 x1通道轉換的2.5G網絡埠

1個由PCIe 4.0 x4通道轉換的10G網絡埠

1個USB 2.0 DASH header

1個未使用的PCIe 4.0 x4通道

1個由PCIe 4.0 x2通道轉換的M.2 2230埠,可以用於WLAN或者藍牙

2個USB 2.0 Header

4個SATA埠

2個USB 3.2 Gen 2 10Gbps埠

1個USB 3.2 Gen 2x2 20Gbps Type-C埠

2個USB 3.2 接口

2個USB 2.0

另外,根據AMD給出的銳龍線程撕裂者7000全系列平台示意圖來看,銳龍線程撕裂者Pro 7000WX系列擁有最多12個CCD、8個DDR5通道和128個PCIe 5.0,對應的是啟用了所有的內存控制器、所有的GMI3總線以及所有的SERDES單元。相應的銳龍線程撕裂者7000系列則只有8個CCD、4個DDR5通道和48個PCIe 5.0,對應的是只啟用了4個DDR5內存控制器、GMI3連接也由於CCD變少而關閉了4個,另外2個SERDES單元對應的連接也直接關閉了不少,以降低PCIe 5.0總線數量。從這一點來看,銳龍線程撕裂者7000全系列產品使用的都是一樣的IOD單元,只是通過屏蔽改變了部分功能。

最後再來看看有關能耗比方面的優勢。AMD給出的信息包括,新的產品支持cTDP模式,也就是用戶可以在BIOS中調節功耗;採用了動態鏈路寬度管理以及提高性能功耗比;在關鍵部位使用了動態電源管理,比如LCLK,FCLK,SOCCLK DPM等,還支持深度睡眠等功能;最後還支持了微軟的S3深度睡眠功能。

在上述功能的加持以及整體架構設計、全新的工藝製程一整套解決方案的輔助下,AMD的數據顯示銳龍線程撕裂者Pro 7995WX對比英特爾至強X9-3495X,單核心功耗最多降低了73%,渲染速度提升了最多2倍,能耗比最多提升了2.2倍,是目前能耗比最高的處理器產品之一。

性能大爆發:無敵最寂寞

銳龍線程撕裂者系列從處理器作為目前核心數量最多、功能特色最複雜的產品,其整體性能表現不但依靠於處理器本身的硬體架構,還在很大程度上依賴AMD和行業軟體對CPU的優化,尤其是如何使用如此多的CPU核心以及CPU內部各種功能如何更好的配合行業軟體發展等。好在現在的線程撕裂者系列處理器已經並非初代產品的吳下阿蒙狀態,由於其產業地位和強勢的性能表現,AMD和整個產業界逐漸形成了相互優化和相互匹配的正向循環。

AMD提出,為了更好地利用銳龍線程撕裂者7000全系列處理器的性能,他們提出了4個方面的性能優化,包括高效率利用所有的處理器核心、高效率利用Zen 4的架構和新增的指令集,高效率利用SoC架構以及針對AVX512的相關優化等。我們一個個來看。

首先是高效率利用所有的CPU核心。AMD提到很多應用計算資源耗費非常嚴重,可能需要數小時、數天才能計算完成,這就要求這類應用能夠很好的針對處理器的優化,尤其是需要具有極高的並行性,比如3D渲染可以很好地分配在每一個CPU核心上進行,從而充分使用處理器的性能。不過,一些應用存在並行性方面的瓶頸或者問題,比如Silhouette Edge這類可以並行化但是尚未很好並行化的應用、H.264的編碼這種具有結構序列化瓶頸的並行算法以及Adobe After Effects這種粗粒度並行化應用等,都需要雙方配合做出很好的優化才能更高效率的執行,AMD也為其做出了相當多的努力。

AMD舉了一個充分優化性能的例子,比如在CAD中,一些設計多邊形邊緣和網格模型的問題,傳統計算採用單線程算法,速度很慢。AMD通過多線程優化,使用96核心的線程撕裂者處理器,在500萬個面和700萬個邊緣的CAD模型計算中,最多實現了35倍的性能提升。

第二是有關Zen 4架構的相關優化。AMD目前帶來了名為AOCL(AMD Optimizing CPU Libraries)的CPU優化庫,擁有12個工業標準的數學庫相關優化,能夠使得科學計算和高性能計算在銳龍線程撕裂者處理器上擁有最好的性能表現。具體的庫包括線性代數、密集矩陣計算、傅立葉變換、偽隨機數生成、安全加密、無損壓縮、緩存拓撲等等。

對於這一部分優化,AMD舉了2個案例,首先是電磁仿真軟體。ANSYS HFSS是一個常用的電磁仿真軟體,具體的軟體的內容我們就不多介紹了。通過AMD優化並採用AOCL庫後,這款軟體的在多種計算方面的性能得到了提升,最高可達51%。

另外,在有限元求解中,利用AOCL優化後,運行性能最高提升了2.8倍,大幅度縮短了求解時間。

第三再來看看有關SoC層級的優化。這部分內容主要是要求軟體能夠很好地使用緩存、內存子系統等,以避免數據不斷的遷移所造成延遲和性能損失,另外很好的使用AVX 512也能夠充分發揮系統性能。AMD進一步解釋道,銳龍線程撕裂者擁有極高的L3緩存容量,每個CCD擁有32MB L3緩存, L3緩存總容量最高可達384MB,如果可以很好地使用所有緩存,尤其是利用AMD提供的三種線程綁定策略,應用程式將通過緩存容量獲得顯著的性能提升。

AMD舉例說,在SOLDWORKS Plastics 2023 SP1軟體中,由於更好地利用了AMD處理器的優勢,因此整體性能提升了13%。

在Ansys Fluent中,如果使用AMD的線程固定技術並劃分更多緩存給軟體使用的話,最多可以帶來12%的性能提升。

在內存優化方面,AMD還提到了一種特殊的優化方式。目前銳龍線程撕裂者的IOD會自動配置內存通道,默認為8通道,這樣的配置會為單個線程提供最高的帶寬和最低的延遲。當有多個線程的應用程式運行在不同的核心上時,用戶也可以手動指定不同的內存控制器針對不同的核心或者線程,這將使得這些線程獲得更低的延遲(雖然損失部分內存帶寬)。

AMD的數據顯示,諸如Ansys CFX這樣的軟體可以在將內存設置為NPS4雙通道模式後,可以獲得性能提升,最多達8%。

最後一個部分則是AVX-512的優化。目前AMD Zen 4架構和線程撕裂者7000全系列都能夠提供針對AVX-512的支持。用戶只要在軟體中使用AVX-512並啟用相關標識,處理器就會調用AVX-512單元進行計算,提供強大的並行浮點處理能力。

在了解完有關線程撕裂者7000全系列的所有信息後,我們來看看這兩個系列處理器的性能情況。

首先是對比自家的上代旗艦產品:64核心的銳龍線程撕裂者Pro 5995WX,可見同為64核心的新一代銳龍線程撕裂者Pro 7985WX性能領先至少12%,最多實現了43%的性能提升。

在工作站相關性能方面,AMD銳龍線程撕裂者7000全系列處理器都能夠通過架構更新、核心數量提升、內存帶寬提升以及平台特性提升等為包括軟體和科學、媒體和娛樂、設計和製造、建築和工程等不同行業的不同應用帶來顯著的性能提升。

AMD使用線程撕裂者Pro 7995WX和7985WX對比了英特爾至強w9-3495X處理器,在不同的應用中,AMD的新產品最多可以帶來相比競爭對手產品至少38%、至多223%的性能提升,AMD特別提到,無論是單線程還是多線程應用,銳龍線程撕裂者Pro 7000WX系列都擁有顯著的性能優勢。

在軟體和科學方面,AMD解釋道,目前行業趨勢就是對AI部署和軟體開發的需求增加,並且極大的地用了多線程能力,AI和ML都能夠在多GPU上加速,用於訓練的資料庫也可能由於個人隱私等原因較為敏感。針對這些因素,AMD銳龍線程撕裂者Pro處理器能夠支持超多線程並行處理,支持更大的內存容量以及內存帶寬,支持更多的GPU並行,同時Pro級別的安全管理功能也有助於避免數據泄露。

在這方面,AMD依舊沒有使用最頂級的96核心處理器,而是採用了64核心的7985WX對陣至強w9-3495X 56核心,測試顯示AMD在Chromium中勝出28%,在Unreal Engine中大勝50%。

媒體和娛樂方面的情況也是類似的,比如對虛擬生產的需求、對仿真工具的使用需求以及開發工具對多線程的需求等,都帶來了針對CPU多線程能力、核心數量、並行能力以及擴展性的要求。

這個時候AMD採用的了96核心的銳龍線程撕裂者Pro 7995WX對比56核心的至強w9-3495X,至少獲得了9%的領先幅度,最多在Chaos V-Ray這樣的光線追蹤渲染中勝出了223%。

設計和製造方面,主要是設計市場在不斷擴大,CAD的使用也在逐步增多,因此更多線程、更快仿真以及多任務、高頻率的處理器就可以更為領先,AMD也恰逢其會,完全滿足市場需求。

實際測試情況也是這樣,在核心數量更少的情況下,32核心的AMD銳龍線程撕裂者也較36核心的英特爾至強W0-3475X帶來了大約25%~45%的性能勝出幅度。

與此類似的還有在建築、工程中,對算力、多核心、存儲容量和安全性的要求一直在提升, AMD銳龍線程撕裂者Pro完美契合了市場的發展趨勢和需求。

性能方面32核心的7975WX對比36核心的3475X,勝出了20%~52%不等,值得注意的是,這是AMD核心數量少於競爭對手產品、反而勝利的測試,這顯示出AMD產品也擁有更強悍的單線程性能,並不只是依靠核心數量的優勢取勝。

在加速方面,AMD還提到了CPU針對GPU在圖形和計算方面的加速。AMD的CPU相比競爭對手產品,在Autodesk Maya以及GPU計算方面,都有顯著的性能優勢,這是AMD整體平台優勢的體現。

AMD給出了六款銳龍線程撕裂者Pro處理器的性能提升幅度參考值。從這些數據可以看出,在圖形渲染、Keyshot光線追蹤、Ansys mechanical機械分析軟體中,頂級的7995WX可以調用所有96顆核心,相對其他產品擁有明顯優勢。而在其他測試中,核心數不多不少,工作頻率高的7985WX、7975WX擁有不錯的表現。這顯示了全新架構、超多核心以及更高頻率的AMD銳龍線程撕裂者Pro 7000WX系列所擁有的顯著優勢。

對工作站用戶而言,軟體的兼容和優化也是很重要的一個方面,AMD這一次乾脆列出了所有認證和優化過的軟體列表,以方便用戶查閱。可以看出,AMD線程撕裂者Pro 7000WX已經通過超過70%行業軟體的認證和優化,能夠為用戶帶來更為卓越的使用體驗。

最後再來看看有關銳龍線程撕裂者7000系列處理器的性能預覽情況。

AMD利用銳龍線程撕裂者7000系列最高端的64核心7980X對比了英特爾至強W9-3495X,在幾乎所有的測試項目中,線程撕裂者7980X都輕鬆勝出對比產品至少4%,至多94%,顯示出銳龍線程撕裂者7980X強悍的性能實力。

另外針對前代產品,AMD也給出了性能對比。在核心架構更新、頻率更高且支持更多新特性的情況下,銳龍線程撕裂者7980X輕鬆戰勝了前代5995WX,至少12%、至多46%的性能提升令人驚訝。如果你還持有前代產品的話,不妨更新至新一代銳龍線程撕裂者7000系列,應該會有顯著的性能提升體驗。

總的來說,藉助於全新的 Zen 4架構,更大規模的SoC系統以及更高的頻率等,AMD銳龍線程撕裂者7000全系列處理器都獲得了相比上代產品更強的性能,和競爭對手的產品相比,在目前的數據看來幾乎不存在什麼劣勢,只有贏多一些和少一些的差別。AMD在銳龍線程撕裂者系列上表現出來的技術實力以及最終的產品性能不但都達到了預期,甚至不少還數倍領先,的確令人一見傾心。

AMD銳龍線程撕裂者Pro 7000 WX以及線程撕裂者7000系列實物展示

在本次發布會現場,AMD還在其美國奧斯汀總部展出了銳龍線程撕裂者Pro 7000 WX以及銳龍線程撕裂者7000系列處理器,以及多台採用該處理器的DIY平台、OEM整機系統。

AMD銳龍線程撕裂者Pro 7995WX、AMD銳龍線程撕裂者Pro 7985WX、銳龍線程撕裂者7980X處理器,它們都採用sTR5封裝,與基於Zen 4核心的EPYC 處理器類似,採用接近正方形的外觀設計,相比以往的銳龍線程撕裂者處理器面積更大。

《微型計算機》記者在現場手持擁有8CCD的銳龍線程撕裂者7000系列處理器,靠後的則是旗艦:AMD銳龍線程撕裂者Pro 7995WX。

AMD展出的基於銳龍線程撕裂者Pro 7000 WX以及銳龍線程撕裂者7000系列處理器、TRX50主板搭建的DIY平台,可以看到不論是普通的風冷還是水冷、液氮極限散熱,都可以駕馭這兩類處理器。

為什麼要用液氮展示?因為包括AMD銳龍線程撕裂者Pro 7995WX在內的處理器都具有超頻能力,用戶甚至只需要在RYZEN MASTER軟體中打開PBO精準加速技術,就能對處理器超頻,獲得更高的性能。

讓很多用戶都希望獲得,在一塊主板上就能實現96核心、192線程的AMD銳龍線程撕裂者Pro 7995WX處理器CPU-Z截圖。

DELL Precision 7875工作站

在發布現場,AMD與整機廠商還帶來了採用銳龍線程撕裂者Pro 7000WX系列處理器的工作站整機,如這台DELL Precision 7875工作站,其最大特色是擁有不錯的散熱與供電設計,可以支持350W級的AMD銳龍線程撕裂者Pro 7995WX旗艦處理器,可支持使用兩塊300W級別的專業顯卡,支持PCIe 5.0 SSD。

DELL Precision 7875工作站技術規格,最高可支持2TB內存,支持PCIe 5.0。

其內部配備了兩塊Radeon PRO專業顯卡

這款工作站採用了優秀的散熱設計。如它使用了碩大的6銅管直觸式處理器散熱器,內置多個散熱風扇。包括機箱背板幫助處理器、硬碟散熱的兩個風扇,主板中部安裝的幫助內存散熱的DDR風扇。

DELL Precision 7875在內部配備了多個風扇

機箱前置面板配備了兩個用於安裝M.2 NVMESSD或SATA硬碟的FlexBay

DELL Precision 7875工作站強大的散熱設計,可以保證AMD銳龍線程撕裂者Pro 7995WX旗艦處理器的96顆核心以100%的滿載狀態穩定工作。

HP Z6 G5 A工作站

HP Z6 G5 A工作站的主要技術特性,支持96核心處理器、3塊獨立顯卡、8通道1TB內存。

HP Z6 G5 A工作站主要面向三個應用領域,媒體與娛樂、數據科學、產品研發,具體來說就是視覺特效製作、合成,動畫製作、渲染,AI模型訓練、數據分析、數據預處理,高級3D建模、生成式設計,數字孿生、計算機輔助工程等應用領域。

惠普在現場則帶來了Z6 G5 A工作站,其特性仍是最高可使用96核心、192現場的銳龍線程撕裂者Pro 7995WX旗艦處理器,支持連接3塊獨立顯卡,支持8通道內存,可使用1TB內存。

這款工作站的特點也是設計了多具風扇,並通過增加的空氣進氣口,以及超過20個溫度傳感器,有效控制整機內部的溫度。

進一步拆解後,可以看到HP Z6 G5 A工作站為銳龍線程撕裂者Pro 7995WX旗艦處理器採用的還是傳統的塔式風冷散熱器,但通過有效的風道設計,多具外部風扇的輔助,可以有效控制處理器溫度。

HP Z6 G5 A工作站提供了多個擴展接口,包括1個前置USB 3.2 Gen 2x2 20Gbps接口,4個前置可熱插拔的NVMe設備倉、6個USB 3.2 Gen 1 5Gbps後置接口。

HP Z6 G5 A工作站結構與擴展能力示意圖

同樣,銳龍線程撕裂者Pro 7995WX旗艦處理器的96顆核心也能在HP Z6 G5 A工作站上以100%的滿載狀態穩定工作。

HP Z6 G5 A工作站配備了8通道DDR5 5200內存,其內存速率比其他採用DDR5 4800內存的工作站都要高一些,具備更好的內存性能。

最大48GB顯存:全新Radeon Pro W7000系列登場

AMD本次發布的Pro系列產品不光只有CPU端的銳龍線程撕裂者Pro 7000WX系列,在GPU端,AMD也帶來了Radeon Pro W7000多款專業顯卡,我們一起來看一下。

Radeon Pro W7000系列的產品特性在於整體性能更高,單位價格性能也更為卓越,並且享受AMD Pro級別的專業驅動加成,在功能特性方面更是全球首款支持80Gb/s的DisplayPort 2.1埠的產品。

從市場端來看的話,AMD調研數據顯示,目前用戶在工作站方面最大的用途是占比43%的設計和CAD市場,另外則是18%的媒體和娛樂市場,其餘的包括軟體、金融、數據科學、醫療保健等等都低於10%。

因此,AMD的工作站系列GPU就更為注重媒體和娛樂、設計和製造以及建築、工程的CAD方面的內容。

另外,在價格方面,目前市場占比最大的是350美元以下的入門級市場以及350~950美元的中端市場,至於950~1500美元的高端市場以及1500美元以上的頂級市場占比較少。AMD將通過不同產品的配比,實現對市場所有價格區間的全覆蓋。

相對應的,AMD在高端市場方面布局了Radeon Pro W7900和Radeon Pro W7800兩款產品,其中前者擁有48GB、384bit顯存,96個CU和64TFLOPS算力,支持DP2.1和AV1編解碼,TDP功耗控制在295W;後者則擁有32GB 256bit顯存,70個CU和45TFLOPS算力,支持DP2.1和AV1編解碼,TDP功耗控制在260W。這兩款產品都採用了AMD最新的NAVI 31晶片和RDNA 3架構,整體性能和規格表現還是非常不錯的。

AMD的性能數據顯示,相比上代產品也就是W6800,新的W7900擁有1.5倍顯存容量、3倍的數據輸出能力(DP2.1)以及1.5倍以上的性能。其中,更大的顯存可以容納更大的3D模型,在多任務中表現更好同時也能夠處理更大的RAW格式的媒體資源。另外更高的性能帶來了各項計算效率的提升,對DP2.1的支持帶來了更好的顏色、更高清晰度視頻畫面的支持。

針對新的DP 2.1,AMD特別提到其支持的UHBR 20,帶來了高達77.4Gb/s的數據帶寬,同時向下兼容UHBR 10。更高的帶寬將帶來更高解析度支持、更多位數色彩深度支持以及更高的刷新率支持等,這對媒體工作人員來說是非常有意義的。

具體到性能對比方面,AMD使用W7900對比了英偉達的RTX 6000Ada和RTX A6000。從對比數據來看,雖然在絕對性能方面,W7900的性能相比RTX 6000Ada低了大約7%,但是價格還不到RTX 6000Ada的一半,可謂性價比絕對爆表,當然,W7900甚至W7800在性能對比數據中都比RTX A6000更高,同時價格也要更便宜一些,更為值得選擇。

除了兩款定位高端的產品外,AMD還有Radeon Pro W7600和W7500兩款定位中低端的產品。這兩款產品都擁有8GB顯存,CU單元分別是32和28個,算力方面則分別為20TFLOPS和12TFLOPS,支持AV1編解碼,埠方面同樣支持DP2.1,功耗最低甚至來到了70W。在和上代產品的對比中,W7500略低於W6600大約20%,但是W7600顯著勝出W6600大約19%,形成了比較好的高低搭配。

由於多款產品存在,AMD目前能夠針對高端、中端和低端市場形成完整布局。在專業顯卡的御用測試:SPECviewperf測試中,入門級市場的W6400相比英偉達的T600、T400表現出了極高的性能優勢。中端市場的W7500、W7600也能夠完勝對手的T1000和A2000。高端和頂級市場方面,W7800和W7900帶來了更好的性價比,同時性能展示出了針對同價位產品的優勢。至此,AMD在專業級GPU上形成了完整的競爭布局。

在發布會的最後,AMD還預告了一款全新產品的信息,也就是Radeon Pro W7700,這款產品將卡位W7800和W7600中間,依靠更高的性價比給競爭對手帶來更大的壓力,我們也期待這款產品儘早發布上市。

超越自己,再攀性能高峰

至此,本文針對AMD銳龍線程撕裂者Pro 7000WX/7000系列處理器以及Radeon Pro GPU的介紹就告一段落了。從這些處理器的技術規格、特性以及所展示出來的性能來看,至少在目前的市場上,這兩大類處理器都擁有極強的競爭力。工作站方面,憑藉96核心、64核心設計,AMD銳龍線程撕裂者Pro 7995WX、7985WX的多線程性能在市場上幾乎沒有同類可以與之競爭。在HEDT高性能平台上,同樣對手早也沒有產品可以應對,而AMD不僅能讓普通電腦的處理器核心數量提升到64核心,更能藉助TRX50主板的「超能力」,讓普通電腦也能使用PRO 7995WX這類頂級工作站處理器,將處理器核心數提升到96核心、192線程。而且它們還均擁有PBO精準性能提升技術,並支持手動超頻,對於沒有搭建伺服器條件,但需要強悍處理器性能的用戶來說,AMD銳龍線程撕裂者Pro 7000WX/7000系列處理器的確就是市場上僅有的選擇。

不僅如此,在之前相對弱勢的軟體和生態環境方面,AMD也取得了極為顯著的進展,通過軟體廠商的優化可以釋放出銳龍線程撕裂者更多的性能,開始形成了自己正向循環、不斷向好的產業生態體系。總的來說,由於暫時沒有競爭對手帶來的壓力,AMD現在需要做的只有不斷超越自己,才能不斷攀上一個又一個性能高峰,為用戶帶來更強、更快、更卓越的產品使用體驗。

文章來源: https://twgreatdaily.com/zh-mo/7653e94de5b6d982441bd968a7ebd484.html