國產CPU里程碑!龍芯最強處理器、自研GPGPU來了,披露Tock「三劍客」

2023-11-28     芯東西

原標題:國產CPU里程碑!龍芯最強處理器、自研GPGPU來了,披露Tock「三劍客」

芯東西(公眾號:aichip001)

作者 | 程茜

編輯 | Panken

芯東西11月28日報道,今日,國產CPU企業龍芯中科自主研發的新一代CPU 3A6000發布,這也是我國國產CPU領域的最新里程碑成果。

龍芯3A6000採用龍芯自主指令系統龍架構(LoongArch),是龍芯第四代64位高性能微架構LA664的首款產品,且主要IP核均自主研發,採用成熟工藝生產,主頻達到2.5GHz,支持多線程技術,全晶片共8個邏輯內核。

該CPU採用全自研高性能DDR4接口,訪存效率超過80%,動態頻率電壓調節能效提升,相比於上一代龍芯3A5000,相同頻率下整數通用性能提升60%以上,多核性能翻番。

龍芯中科技術股份有限公司董事長鬍偉武稱,3A6000的性能已經達到十代酷睿四核處理器水平

他談道,龍芯中科要構建獨立於x86和Arm的第三套新型信息技術體系和產業生態

在第三季度業績說明會上,胡偉武還提到:「我們正在努力提高每GHz性能接近或達到蘋果CPU的水平。」他還透露,「3B6000將爭取每GHz的性能再提高20%-30%,在此基礎上用先進工藝提高主頻。」

龍芯中科技術股份有限公司董事長鬍偉武

同時,龍芯中科推出了印表機主控晶片龍芯2P0500,這是國內首款基於自主指令系統的印表機主控晶片。

一、將自主化優勢轉化成技術優勢,性能追上十代酷睿四核處理器

當下全球的信息產業構建在西方主導的x86體系之上。胡偉武談道,2021年我國矽上工業企業利潤率為6.8%,其中電子工業利潤率為5.9%。2021年我國電子工業的利潤總額為8283億元,蘋果一個公司就達到946億美元。

胡偉武談道,CPU和作業系統是信息產業的底座,但還有更底層的根技術被卡脖子,比如指令系統、晶片生產工藝和設備材料等。

國內很多CPU都是基於Arm,作業系統都是基於安卓等,胡偉武認為,我們要將自主經營到底,把底層的根技術做起來,不依賴國外授權和供應鏈,只依賴人力資源和礦產資源。

因此,龍芯中科要構建獨立於x86和Arm的第三套新型信息技術體系和產業生態,其自研的指令集架構龍架構就是第三套體系的基礎。

龍芯中科有三大系列CPU產品,龍芯3號CPU系列是面向桌面、伺服器應用,龍芯2號SOC系,面向工控和終端應用,龍芯1號面向的是嵌入式專門應用。

胡偉武稱,龍芯的主要IP核均自主研發,目前龍芯的軟硬IP核數量已經有上百種。下圖中,龍芯3A6000結構圖中4個方塊就是4個核,標紅的就是3A6000用到的IP。其中,PCIe的IP為自主研發,可以做得很小並且成本更低,這也是自己做IP的好處。

3A6000有4個物理核和8個邏輯核,主頻2.0GHz到2.5GHz,還有片內集成安全可信模塊,支持安全啟動和國密算法。

首先,3A6000採用龍芯第四代64位高性能微架構LA664,這一架構有兩個特點,首先是大幅提升性能,其次是實現了同時多線程技術。胡偉武透露,龍芯的晶片是一個套殼加Tock+Tick,基於第二代GS464E,3A3000性能提升1.6倍。

龍芯3號系列晶片按照Tick-Tock路線發展,Tick指的是工藝節點的增強,Tock指的是微體系結構的增強。

第三代架構是GS464V、LA464,與3A3000相比,3A4000工藝沒變,通過結構優化性能提高了兩倍,3A5000採用更先進工藝性能提升了1.5倍。

3A6000採用的是第四代架構,使得CPU在相同工藝下性能比上一代產品大幅提高。根據電子四院的報告,3A6000單線程通用處理性能提升60%,多進程通用處理性能提升100%。

定點單線程的性能分數是43分,CPU 2017的單線程性能是5分。

CPU執行指令的過程中,由於指令供給不及時等,存在空閒指令。同時多線程就使得CPU核心「一心二用」,也就是在單位時間內執行多個線程的更多指令,3A6000性能在相同工藝下相比上一代產品大幅提高。

3A6000的性能達到十代酷睿四核處理器水平,2.5GHz的龍芯3A6000和3.6GHz的酷睿i3比較數據如下:

胡偉武稱,龍芯中科走出了一條基於成熟工藝,通過設計優化提高性能的道路,標誌著在弱一點的工藝條件下,與英特爾、AMD等的產品性能可比。下一步龍芯中科將繼續基於成熟製程研發,達到英特爾先進工藝的性能。

2013年,胡偉武就在反思,中國CPU和國外先進水平的主要性能差距在什麼地方?是通用處理能力不行、還是專業處理能力不行?是單核性能不足還是核數不夠?是設計能力不行還是工藝不行?

他認為,剛剛提到的43分,就相當於3A6000「研究生畢業」。並且當時龍芯3A1000主頻差距在2-3倍,每GHz性能差距為4-6倍。

目前,龍芯中科已經完成了通用處理性能技術補課,十代酷睿是2020年的產品,胡偉武稱,現在很多人電腦上還用的是八代、九代酷睿,今年龍芯中科推出的3A6000已經達到市場主流水準。

龍芯中科已經完成龍芯3C6000設計,龍芯3C6000採用單矽片16核32線程,通用處理性能成倍提升,內存採用DDR4-3200×4,訪存帶寬比上一代3C5000成倍提高。

此外,3C6000通過龍鏈技術實現了片間互聯,實現LS3D6000雙矽片32核64線程、LS3E6000四矽片64核128線程,支持GPGPU、各類加速器擴展。

胡偉武認為,龍架構指令系統是龍芯的一個貢獻,片間互聯就是龍芯的第二個貢獻,未來,龍芯中科都會開放。

龍芯中科突破片間高速互聯技術,對標的是nVLink、CXL,這也是破解Chiplet技術的關鍵。片間互聯可以大幅降低延遲提高帶寬效率。

在GPGPU方面,龍芯第二代自研圖形處理器LG200有圖形加速、科學計算加速、AI加速三個功能,右邊是GPGPU的結構圖。

龍芯中科將基於2K3000的GPGPU技術及3C6000的龍鏈技術,研製專用GPGPU晶片

胡偉武認為,由本次發布的桌面處理器龍芯3A6000、在研伺服器處理器龍芯3C6000和移動桌面終端處理器2K3000構成的龍芯「三劍客」已具有一定開放市場競爭力。

二、自主化優勢轉化為軟體生態優勢,三大階段完成生態建設

指令系統是軟體生態的基礎,2020年,龍芯中科推出龍芯指令系統結構LoongArch,簡稱龍架構或LA架構,完成了自主智慧財產權評估。

胡偉武透露,構建龍架構軟體生態分三個階段。

首先是夯實基礎,龍芯中科的架構已經得到國際開源軟體認可,開發者可以完全基於龍架構的國際開源軟體直接構建出完整的作業系統。其次,該框架得到了國內作業系統和基礎應用的認可和支持,目前支持統信、麒麟、歐拉、龍蜥、開源鴻蒙等作業系統,支持WPS、微信、QQ、釘釘、騰訊會議、美團等應用。

第二要克服Linux生態碎片化的特點,實現不同分支及版本的應用兼容。龍芯平台支持不同版本不同分支,如麒麟的應用在統信上可以跑,統信的應用在麒麟生態上也可以跑。

龍芯中科已經升級完成,目前正在做廣泛兼容,在龍架構上運行x86、Windows應用,但不能運行Windows,還有運行安卓應用。

第三是自主應用。胡偉武稱,龍芯中科要推出自主編程框架,就像安卓、iOS等一樣有自己的應用平台。

在廣泛兼容方面,通過二進位方案運行x86應用,龍芯中科要架起兩座橋,一個是把x86的指令翻譯成龍架構指令,一個是把Windows接口翻譯成Linux接口。

龍架構的一大優勢就是可以自由加指令,將不侵權的功能類似的指令加進去,翻譯時就相當於英文翻中文。

印表機驅動是Linux的一大難題,多數印表機只有Windows驅動,沒有Linux驅動。現在龍芯架構可以支持95%以上的印表機。

通過二進位翻譯運行x86應用,龍芯生態可以運行絕大多數x86和Linux應用,用戶體驗流暢,對於x86/Windows應用可以大量運行。龍芯下一代處理器將完善對二進位翻譯的支持,如x87的80位浮點指令。

三、構建獨立於x86和Arm之外的生態體系3A6000性能達到市場主流產品水平,龍芯架構的基礎軟體生態基本建成,龍芯中科要構建獨立於x86和Arm體系的自主信息技術體系。

為了加強生態體系建設,龍芯中科要與合作夥伴共建。首先解決做龍架構晶片企業少的問題,龍芯中科將CPU IP核開放授權,且不收版稅。未來,龍架構指令系統也會開放授權。

胡偉武演講前面提到一個問題,龍芯CPU最自主所以性能低生態差?他的答案是,龍芯CPU最自主,所以性能最高。原因在於自主研發的CPU沒有天花板,產品可以在市場實踐中不斷疊代,3A6000就是個例子。

他補充說,龍芯CPU軟體生態最好,理由是自主生態只能靠自己建,靠跟著走沒有前途。

因此,龍芯中科要將自主化的優勢轉化為性能和生態優勢,與x86和Arm體系三足鼎立,形成新型信息技術體系和軟體生態。

結語:自研CPU任重道遠

以通用CPU、GPU為代表的計算晶片是算力的基石,是計算系統和信息基礎設施的核心,當下核心技術受制於人是我國產業發展最大的隱患。近年來,以龍芯中科為代表的企業推動核心技術突破,使得國產晶片性能持續提升,供應鏈的可持續性、生態完備性上也取得進步。

此次,龍芯中科正式發布龍架構,並開放了IP授權,同時,國產作業系統、應用軟體的協同發展,將加速國產CPU生態建設。

面對新一輪科技革命和產業革命加速演進,以龍芯中心為代表的國產玩家正在通過自主研發、創新突破一步步探索晶片研發的天花板,推動國產CPU性能和成熟度不斷提升。

文章來源: https://twgreatdaily.com/dbf743d75ece2c761d97008bad0edd19.html