Coretx-X3和Mali-G715來了!前瞻ARM下一代核心IP

2022-06-29     電腦愛好者

原標題:Coretx-X3和Mali-G715來了!前瞻ARM下一代核心IP

點擊上方 電腦愛好者關注我們

ARM每年都會更新一次核心IP(公版架構),比如去年發布的Cortex-X2、Cortex-A710和Cortex-A510 Refresh(下文簡稱TCS 21),就因為改用面向下一個10年的ARMv9-A指令集而廣受關注。

可惜,首發這三個核心IP的高通新驍龍Gen1卻因採用三星4nm工藝,在功耗和發熱方面的表現很差。直到聯發科天機9000,以及改用台積電4nm工藝的驍龍8+的發布,才挽回了一點點口碑。

日前,ARM正式發布了2022年度的核心IP——Cortex-X3、Cortex-A715和Cortex-A510 Refresh(下文簡稱TCS 22),它們同樣基於ARMv9-A指令集打造,主打(可選)更多的核心數量、更高的性能(峰值性能提升25%)和更低的功耗(能效提升20%)。此外,Mali GPU也進行了同步更新,下一代Mali-G715和Mali-G615 GPU已經蓄勢待發。

更多的核心數量和變化

ARM為TCS 22,也就是Cortex-X3、Cortex-A715和Cortex-A510 Refresh準備了優化的DynamIQ技術以及全新的動態共享單元DSU-110,最多可以實現8(X3)+4(A715)+0(A510 Refresh)共計12核心設計,滿足頂級遊戲手機、平板電腦甚至PC對性能的苛刻要求。此外,還能實現1+4+4和2+2+4等核心組合。

DSU-110在微體系結構方面沒有顯著變化,ARM對其的調整主要是為額外的內核做好設計準備,對依賴內核數量的區域進行了更新,方案商可以根據需求,選擇塞進更多的Cortex-X3實現更高性能,或是僅保留Cortex-A510實現更小的功耗。

TCS 22還通過對全新IP、Cortex-M85等組件的支持以及軟體優化,在AI機器學習領域實現了顯著的提升,在各項測試中都有著30%~43%的增長。

TCS 22在安全性方面引入了對非對稱MTE(內存標記擴展)的支持,屬於去年TCS 21首發對稱MTE的擴展。記憶體區域和相關指標會標記為相同的標籤,並由CPU檢查是否相符。如果存在差異,則CPU會停止處理。對於不對稱MTE,CPU可以在裝載命令期間更新觸發器,而在內存命令期間異步更新內存區域。

ARM還帶來了增強的安全功能,禁止對用戶模式下較低特權區域進行內核級訪問,旨在防止用戶模式攻擊(例如通過欺詐內核進行攻擊)。

TCS 22中使用的CoreLink CI-700相干互連技術和CoreLink NI-700片上網絡互連技術沒有什麼變化,但針對台積電和三星最新的4nm、5nm工藝進行了特殊的優化,支持連接Cortex-M85,用於嵌入式解決方案,如智能揚聲器或作為全天候處理器,使用DSP和機器學習功能來處理智慧型手機上的語音命令。此外,ARM還未開發者提供了方便的開發平台及工具VFP,可以更好地仿真測試等等。

CPU性能的變化

作為新一代的超級大核,Cortex-X3將解碼器每周期指令從5個提升到6個,亂序執行窗口從288提升到320個,整數ALU單元從4個提升到6個,L2緩存容量從512KB提升到1MB,L3緩存容量可達8MB。在性能方面,對比當前最新Android旗艦智慧型手機提升了25%,單核心效能較之英特爾最新的酷睿i7處理器(i7-1260P,28W)還要快34%。

當然,這些比較存在很多限制條件,體現的也是基準測試中的部分項目。從ARM公布的IPC性能提升數據來看,Cortex-X3實際的IPC提升為11%,這個還是相對靠譜的。

作為新一代的大核,Cortex-A715此次不再追求更高的性能,而是主打更好的能效。從ARM公布的數據來看,Cortex-A715相較於上代Cortex-A710,能在相同性能下節省20%的能耗,或是可以在相同功耗下提升5%的性能。

作為新一代的小核,Cortex-A510 Refresh依舊注重更好的能效,和上代產品相比在相同性能時可以減少5%左右的能耗。

需要注意的是,在TCS 21時代,只有Cortex-A710同時支持Aarch32和Aarch64,運行老舊32位應用時存在功耗高的問題。在TCS 22時代,Cortex-A715不再支持Aarch32,而是讓Cortex-A510 Refresh可以兼容Aarch32,但僅限特定的選擇中。根據金標聯盟最新發布的時間表,從今年12月起主流應用商店就將全面過渡到64位應用,遊戲更新也不再允許單獨更新32位包,估計到了TCS 23時代,ARM將在核心IP層面徹底放棄Aarch32。

GPU性能的變化

ARM同步發布的Immortalis-G715、Mali-G715和Mali-G615也值得引起我們關注,它們均支持VR,旗艦型號還能在智慧型手機、平板電腦和ARM筆記本電腦身上實現硬體光線追蹤。

Immortalis-G715、Mali-G715和Mali-G615都採用第四代Valhall體系結構,它們之間的差異只是著色器的配置和計算單元數量不同。其中Immortalis-G715定位旗艦,也是家族唯一硬體支持光線追蹤技術的GPU IP,最多可以搭配16個RTU,可選10~16個計算單元。

Mali-G715和Immortalis-G715的差別是不含RTU,可選7~9個計算單元。Mali-G615的計算單元數量下降到1~6個,性能墊底。

根據ARM的官方數據顯示,TCS 22(1+3+4+Mali-G715)的遊戲性能較之上代可以提升28%,值得期待。

據悉,TCS 22最快在2022年底就能商業化,首發Cortex-X3、Cortex-A715和Cortex-A510 Refresh這些CPU IP的晶片應該就是高通驍龍Gen2了,不知道這款未來的旗艦能否藉助新工藝和新IP摘掉「火爐」之名?

了這篇文章,大家還會點擊:

文章來源: https://twgreatdaily.com/zh-hk/ea0d6d9a6f1c7ce026eb8ae12b7180dd.html