得益於智慧型手機和嵌入式應用的蓬勃發展,Arm在過去十年里成為了晶片領域的絕對贏家。尤其是在智慧型手機領域,Arm提供的內核幾乎被每一款手機的晶片所採用。而Arm在這個過程中沒也沒有掉鏈子,針對市場需求推出了相應的產品。
然而,Arm其實在過去十年里並沒有安於現狀,他們不僅僅只是圍繞著當前的「甜點」做疊代。與此同時,Arm還在面向未來做更深遠的布局,基礎設施就是他們其中的一個目標。
Arm基礎設施事業部高級副總裁兼總經理 Chris Bergey在日前的一場媒體會上告訴記者,Arm在相關業務已經深耕了十年。而Neoverse就是他們交出的一份「答卷」。
面向基礎設施的Neoverse系列
談到Arm,大多數人應該都會聽過其Arm Cortex-M系列和Arm Cortex-A系列,正是這兩系列的產品幫助公司在過去十幾年飛速成長。而上文談到的Neoverse則是Arm最近正在大張旗鼓推崇的一個東西。在很多分析師看來,英偉達收購Arm公司,正是看中Arm在這方面的潛力。
眾所周知,因為人工智慧、5G和大數據的崛起,市場上湧現了各種各樣的新興應用,這就給擁有高性能和低功耗的Arm內核帶來了機會,這正是Neoverse誕生的原因。
資料顯示,Arm公司最早是在 Arm Techcon 2018上首次披露Neoverse路線圖,根據Arm公司的專家當年在博客中強調,Arm Neoverse為萬億聯網設備描繪了安全、高性能、靈活的從雲到邊緣計算的願景。Arm甚至表示,如果沒有公司正在引導的變革,現有的基礎設施將在即將來臨的數據洪流中逐漸腐朽和消亡。
按照Arm的說法,這主要是因為業界過去幾乎把所有數據都發送到由單一、過時、通用的計算架構驅動的遠程伺服器,而今這樣的時代已經一去不復返。相反,計算必須通過演化,在最佳節點實現分布式處理,並提供連接端邊雲的異構計算,從而使正確的資源可以在正確的節點分層。
Chris Bergey在媒體會上則告訴記者,按照他們的規劃,這個全新系列將會面向四個市場。分別是超大型計算&雲計算、HPC、5G和基礎設施邊緣。
根據Arm最初的規劃,Neoverse品牌當時的平台產品代號Cosmos,基於16nm工藝,CPU核心是A72和A75,下一代將是2019年推出的Ares平台,製程工藝升級到7nm,2020年則會升級到Zeus平台,使用7nm EUV工藝,而2021年則是面向5nm工藝的Poseidon平台。如圖所示,Arm為每一代平台規劃了30%左右的性能提升。
如下圖所示,Arm最初為其Neoverse帶來了E系列和N系列兩款產品。但到了2020年9月,Arm不僅展示了先前稱為Zeus的CPU微體系結構,而且還展示了Neoverse N系列以外的全新產品類別:推出新的Neoverse V系列和Neoverse V1(Zeus),以及以Neoverse N2(Perseus)形式出現的新路線圖。
值得一提的是,N2的代號在之前的規劃在之前並沒有看到,而從相關資料顯示,Neoverse V1形式的Zeus微體系結構實質上類似於Arm在移動領域的Cortex-X1 CPU:專注於最大性能,而對功耗和面積的關注較少。
在去年十月發布的時候,Arm並沒有介紹關於這兩個新產品的更多細節。而在日前的媒體會上,Arm終於揭開了他們的神秘面紗。
N2和V1性能的全面躍升
在上文中我們談到,2019年推出的Neoverse N1 是Arm這個系列新命名的第一款產品。相關報道指出,該產品的設計很大程度上類似於 Arm 面向消費級市場的 Cortex-A76 微體系架構:其具有 4 層訪存 / 解碼器,流水線深度僅 11 級,並且能夠在必要時減少至 9 級。
此外,Neoverse N1 設計為在相對較高的頻率下運行,以提供最大的單線程性能,且具有不同於尋常的 1MB L2 緩存體系結構(緩存本身不該算是體系結構的一部分)和其它一些增強功能。有廠商(如亞馬遜)基於此設計出了備受歡迎的產品。
來到Neoverse N2,據介紹,這是一款基於Arm全新的V9架構設計的產品,同時也是第一個基於Armv9架構的平台。與N1相比,Neoverse N2在保持相同水平的功率和面積效率的基礎上,單線程性能提升了40%。
Arm方面進一步指出,Neoverse N2 具備良好的可擴展性,可以橫跨從高吞吐量計算到功率與尺寸受限的邊緣和5G應用場景,並在這些應用中帶來優於N1的表現,例如,在雲端上提升 1.3 倍的NGINX,在 5G 和邊緣應用上提升 1.2 倍的DPDK 數據包處理。
Arm方面同時還表示,Neoverse N2平台提供了優異的單線程性能和業界領先且能為用戶減少TCO的每瓦性能表現。同時,作為第一個具備SVE2功能的平台,Neoverse N2可為雲到邊緣的性能效率帶來巨大的提升。在諸如機器學習、數位訊號處理、多媒體和5G等廣泛應用場景中,SVE2除了帶來大幅性能提升外,還帶來了SVE 具備的編程簡易性及可移植性等優勢。
「N2效率配置使我們能夠在單插槽線程上具有更大的競爭力,同時提供專屬的內核,而非共享線程。隨著我們越來越靠近邊緣,問題的性質悄然發生變化」, Chris Bergey強調。
來到V1方面,按照Arm的說法,這將是一款帶動高性能計算變革的產品。
資料顯示,與N1相比,Neoverse V1帶來了 50%的性能提升、1.8倍的矢量工作負載優化、以及4倍的機器學習工作負載優化,同時,Neoverse V1也是Arm強調性能優先的新型計算系列的第一個平台。Neoverse N1使晶片合作夥伴能靈活地為高度依賴CPU性能和帶寬的應用構建計算能力,並為其提供 SoC 設計的靈活性。
秉持性能至上的思維,Neoverse V1 的設計理念創造了Arm迄今為止設計過的最寬微架構,以便容納更多運行中的指令,支持高性能和百萬兆級計算等市場應用。Neoverse V1寬而深的架構,加上 SVE功能將使其在單核性能和通過SVE延長代碼存活期等方面占據領先優勢,並為晶片設計人員提供可實現的靈活性。
Chris Bergey告訴記者,SVE 為Arm開發者提供了一套全新的矢量編程和數據操作工具,解決Arm現有的 SIMD 指令集 NEON 難以對某些代碼進行矢量化處理的問題。據介紹,SV 可以直接取用相同的代碼,並很好地對其進行自動矢量化,相比於NEON,可提速將近 3.5 倍的處理速度。
「由於 SVE 與矢量長度無關,因此相同的代碼可以不加修改地在 V1 上運行。如果在 V1 上加倍 SVE 矢量的寬度,則對應的處理速度也幾乎提速一倍。SVE同時也為 HPC 提供了一種新的高性能且對開發者友好的編程功能」,Chris Bergey接著說。
在介紹V1和N2的同時,Chris Bergey還著重介紹了公司新推出的Arm Neoverse CMN-700 。作為業界最先進的 mesh 互連技術,CMN-700能充分發揮 Neoverse V1 和 N2 平台的性能與每瓦性能優勢。Chris Bergey也強調,構建基於 V1 和 N2 高性能 SoC 的關鍵要素就是 Arm CMN-700 Mesh 互連技術。
據介紹,基於CMN-600的成功基礎,CMN-700在每個矢量上進一步提升了性能——從內核的數量、緩存的大小,到附加內存及 IO 設備的數量和類型。它所支持的高帶寬 DDR5 和 HBM 內存,正是實現於 V1 HPC 平台的關鍵。
據Chris Bergey介紹,CMN-700 的一個關注重點是對多晶片功能的助益,以便為數據中心資源池化的增長提供更多的定製選項;同時,CMN-700 中還增加了 CXL 功能,可為內存擴展和智能一致性加速器,構建主機或端點設備;多晶片功能的另一項重要升級是,針對傳統多插槽設計和新的晶片集或多晶片集成提高性能和優化功能;多晶片集成將為突破傳統的矽掩模版限制提供新的機遇,並為緊密耦合的異構計算提供更大的靈活性。
正是得益於這些設計,CMN-700 賦能了多晶片、內存擴展和加速器的下一代應用場景實現。
攜手生態夥伴走向新未來
在過去談Arm在基礎設施,尤其是他們伺服器晶片的時候。大家第一個想提出的問題,就是如何解決軟體乃至生態的問題。但在Arm看來,這不再是困擾。
首先在晶片方面,Amazon、Ampere Computing、Sipearl、ETRI和Marvell等企業參與,基於Arm Neoverse設計晶片,讓終端開發者有了晶片選擇。與此同時,Arm與生態鏈上各個環節建立了合作,讓這一切成為可能。
Chris Bergey表示,此前,Arm從來沒有在這類的 IP 實現上投入過如此多的資源。但現在,公司與領先的晶圓代工廠深入合作,在多個先進的工藝節點上開發出了性能和功耗優化的POP IP。
而隨著 「Project Cassini 」 和 「Arm SystemReady」 的啟動,Arm的標準和認證項目計劃正持續推進,並逐步擴展到基礎設施和物聯網邊緣。公司在平台標準化方面取得了長足的進展。這就意味著在廣泛的 Arm 合作夥伴晶片和設備,可以 「直接運行」 更多現成的標準作業系統雲原生軟體生態系統可以越來越順暢地將其堆棧集成到 Arm 平台上 而客戶也能更加順利地從雲端到邊緣部署中受益。
正式在多方的聯合推動下,基於Arm Neoverse設計的晶片正在走向多個領域。
據了解,印度電子信息技術部(MeitY)已宣布將加入法國晶片公司 SiPearl 和韓國電子通信研究所( ETRI)的行列,採用Neoverse V1驅動國家級百萬兆級高性能計算項目;甲骨文也計劃在Oracle雲基礎設施上採用Ampere Altra CPU,為各種工作負載提供最佳的性價比;由Arm技術驅動的AWS Graviton2通過穩定的增長與區域擴展,正持續快速地擴張其EC2的覆蓋;阿里雲在即將上線的基於Arm架構ECS 實例上完成了測試,結果顯示在 SPECjbb的測試數據中獲得了驚艷的表現,且基於Arm架構運行的 DragonWell JDK 性能提高了 50%;騰訊在硬體測試和軟體支持方面持續投入,使其在雲應用上能採用 Arm Neoverse 技術。
「展望下一個計算時代,我們想要改變行業對部署基礎設施的思維。每一個創新者都不應該被要求在性能與能耗之間進行抉擇, Neoverse 平台提供了兩者兼得的最佳解決方案,促使從雲到邊緣的廣泛應用能夠實現。」Chris Bergey說。
*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。
今天是《半導體行業觀察》為您分享的第2662內容,歡迎關注。
實時 專業 原創 深度