完全自主!龍芯3A6000性能追平10代酷睿!核心IP及龍架構開放授權

2023-11-28     芯智訊

原標題:完全自主!龍芯3A6000性能追平10代酷睿!核心IP及龍架構開放授權

11月28日,2023龍芯產品發布暨用戶大會在國家會議中心如約啟幕。大會以「到中流擊水」為主題,現場發布新一代通用處理器龍芯3A6000、印表機主控晶片龍芯2P0500重磅成果,並對外公布龍芯處理器核IP及龍芯自主指令系統架構授權計劃。龍芯合作夥伴、權威媒體、專家學者、主管部門領導等4000餘人齊聚大會,共同見證龍芯新產品發布,共謀高水平科技自立自強。

一、打造主流通用CPU晶片:龍芯3A6000已達10代酷睿四核水平

據介紹,龍芯3A6000處理器採用龍芯自主指令系統龍架構(LoongArch),是龍芯第四代微架構的首款產品,主頻達到2.5GHz,集成4個最新研發的高性能LA664處理器核(6發射雙線程),支持同時多線程技術(SMT2),全晶片共8個邏輯核。集成安全可信模塊,可提供安全啟動方案和國密(SM2、SM3、SM4等)應用支持。

龍芯中科董事長鬍偉武強調,龍芯3A6000支持的同時多線程技術(SMT2)是主流桌面/伺服器CPU的標配技術,其可以使得CPU核心在同一時刻運行多個線程,補齊了龍芯CPU原有的短板。

根據中國電子技術標準化研究院賽西實驗室測試結果,龍芯3A6000在2.5GHz頻率下,SPEC CPU 2006 base單線程定/浮點分值分別達到43.1/54.6分,多進程定/浮點分值分別達到155/140分;SPEC CPU 2017 base單線程(rate1)定/浮點分值分別達到5.05/7.78分,單進程多線程(speed)定/浮點分值分別達到6.66/18.1分,多進程(rate8)定/浮點分值分別達到21.3/21.0分;Stream實測帶寬超過42GB/s;Unixbench實測超7400分。與上一代的龍芯3A5000相比,單線程通用處理性能提升了60%,多進程通用處理器性能提升了100%。

綜合相關測試結果,龍芯3A6000處理器總體性能與Intel公司2020年上市的英特爾第10代酷睿四核處理器相當。

需要指出的是,對於CPU來說,提升性能主要是兩條路,一個是提升主頻,一個是優化內核設計。但是由於目前國內先進位程工藝發展受限,龍芯3A6000依然是基於成熟工藝打造的,其性能的提升主要是通過設計優化來提升性能。所以我們可以看到,3A6000性能相比上一代3A5000大幅提升的同時,主頻依然保持在2.5GHz。如果後續龍芯能夠用上國產先進位程工藝,那麼其主頻無疑將會得到進一步的提升,同時疊加設計的進一步優化,將有望進一步縮小與英特爾、AMD等先進工藝CPU的性能。

胡偉武表示:「隨著達到市場主流產品水平的龍芯3A6000的正式發布,龍芯終於完成了通用處理器性能『補課』。龍芯3A6000走出了一條基於成熟工藝,通過設計優化提升性能的道路,自主研發CPU的性能完全可以趕上並超過國際主流產品水平。」

二、CPU主要IP核均自主研發:性能沒有天花板!

作為一款國產通過CPU來說,龍芯3A6000的自主可控程度也是目前國產CPU當中最高的。

早在2020年,龍芯中科基於二十年的CPU研製和生態建設積累推出了自研的龍架構(LoongArch),包括基礎架構部分和向量指令、虛擬化、二進位翻譯等擴展部分,近2000條指令。更為關鍵的是,全新的龍架構已不再包含MIPS指令系統。龍芯表示,LoongArch架構具有完全自主、技術先進、兼容生態三方面特點。

對於龍芯來說,圍繞自研的LoongArch指令集架構,不僅推出了自研的CPU的內核,其內部集成的GPU內核、加減密IP、高速傳輸接口IP、存儲接口IP、音視頻接口IP、UART等其他接口IP,以及各種規格的寄存器堆、PLL、DDR3/4-PHY、HT-PHY等硬核IP也全都是自研的。

龍芯中科副總裁張戈在會後接受芯智訊專訪時進一步指出:「隨著CPU功能和性能越來越強,很多時候不單單是要解決處理器內核的問題,還會涉及到很多的配套的外圍關鍵IP。龍芯團隊經過十多年的積累,不僅僅是擁有指令集、CPU IP方面的研發能力,還包括了2D/3D GPU以及未來GPGPU、AI加速等方面的能力。此外,在CPU與外界通信還需要大量的高速接口IP、數字模擬轉換接口IP等等。這些都是我們團隊自行研發完成的,而國內其他CPU設計廠商大部分都是購買了第三方的IP。」

三、桌面/伺服器/移動終端全面覆蓋

除了龍芯3A6000之外,龍芯中科還公布了同樣基於其第四代「LA664」CPU內核的伺服器CPU產品3C/D/E6000和移動終端CPU產品2K3000。

據介紹,龍芯3C6000目前已經設計完成,其單矽片16核32線程(LA664),通用處理性能得到了成倍提升。同時配備的DDR4-3200x4接口使得訪存帶寬比上一代3C5000成倍提高;PCle4×64的IO性能比上一代3C5000成數量級提高。龍芯3C6000還支持高性能國密標準加解密算法(SM4帶寬>30Gbps)。

另外,為了提升晶片間的互聯性能,龍芯中科還推出了自研的龍鏈技術( Loongson Coherent Link),對標nVlink、CXL等目前主流的片間互聯技術,可以實現比PCIe等I/O總線更為高速、低延遲的片間互連。這也為龍芯後續的CPU與CPU互聯、CPU與GPGPU互聯、GPGPU和GPGPU互聯提供高速緩存一致性協議傳輸。

得益於龍鏈技術的加持,使得LS3D6000雙矽片32核64線程、LS3E6000四矽片64核128線程得以快速實現,同時支持GPUGPU、各類加速器擴展。

此外,龍芯面向筆記本/雲終端的八核單矽片SoC——龍芯2K3000也已經完成了前端設計。其集成了8個自研的LA364處理器內核,單核性能接近3A5000,還集成了自研的LG200 GPGPU內核。

據介紹,龍芯的GPGPU內核LG200 可以支持圖形加速、科學計算加速、AI加速等功能。具體來說,升級了圖形渲染功能(OpenGL4.0),支持通用計算(支持OpenCL3.0),支持INT8張量計算加速部件。同時擁有增強架構伸縮能力,單節點性能達256GFlops-1TFlops。

值得一提的是,自今年以來,隨著生成式AI的火爆,英特爾、高通、聯發科等晶片大廠也紛紛推動生成式AI進入終端側,都推出了支持端側生成式AI大模型運行的晶片。英特爾和高通還積極推動傳統PC轉向AI PC。顯然,這對於龍芯中科來說,也是一個機遇。

張戈告訴芯智訊:「AI PC是一個趨勢,龍芯接下來也將會把對於8bit、16bit的加速的模塊給做到下一代的筆記本CPU當中。我們認為,其實這種端側AI本身的晶片門檻並不高,我們之所以現在沒有去做,也是因為這並不是我們主要投入精力的部分。像寒武紀的團隊,原來原來龍芯曾是一個大團隊,他們的創始人還是胡偉武老師的學生,所以這方面,其實我們應該說掌握起來難度並不大。」

四、2P0500印表機主控晶片

在本次大會上,龍芯中科還推出了一款適用於單/多功能印表機的主控SoC晶片——龍芯2P0500。

據介紹,該晶片採用異構大小核結構,集成DDR3內存、GMAC、OTG等多種功能模塊,具有列印數據接收、解析和處理,列印引擎控制,掃描時序控制,數據掃描,圖像處理,馬達控制等功能,單晶片即可滿足列印、掃描、複印等多種典型應用需求。龍芯中科基於龍芯2P0500推出印表機、掃描儀、複印機等多種解決方案,並與國內多個主流印表機整機廠家合作,完成列印、掃描、複印等多種應用適配。

大會現場,長城信息股份有限公司、中船漢光科技股份有限公司、上海漢圖科技有限公司、西安電子科技大學、恆科科技產業有限公司、寧波華高信息科技有限公司、雲南南天電子信息產業股份有限公司、北京辰光融信技術有限公司、北京高德品創科技有限公司、天津光電通信技術有限公司、浙江滄田智能信息科技有限公司、大連中盈科技股份有限公司共12家印表機廠商與龍芯中科簽訂協議,共建國產印表機新生態。

五、已建成與X86/Arm並列的基礎軟體體系

作為一個發展至今才短短三年時間的LoongArch體系,在軟體生態方面相比已有20年以上歷史x86、Arm生態來說,無疑是非常薄弱的。因此,龍芯通過積極通過自研關鍵軟體(比如瀏覽器等)以及與第三方軟體廠商合作的同時,也積極通過擁抱開源軟體生態來進行破局,並迅速建起了完整的LoongArch開源生態體系。

在作業系統方面,統信、麒麟等國產作業系統企業在持續兼容的基礎上,均對龍芯3A6000新特性進行全面支持。

在軟體方面,龍芯3A6000還完善了對軟硬協同的二進位翻譯的支持,可提高了龍架構的二進位翻譯效率,運行更多種類的跨平台應用,滿足各類大型複雜桌面應用場景。

龍芯中科董事長鬍偉武在《將自主進行到底》主題報告中指出,我國信息產業的根本出路在於構建獨立於X86和Arm體系之外的自主生態體系。

胡偉武在介紹基於龍芯自主指令系統龍架構的軟體生態時認為,龍架構已建成與X86、Arm並列的Linux基礎軟體體系,得到與指令系統相關的主要國際軟體開源社區的支持,得到國內統信、麒麟、歐拉、龍蜥、開源鴻蒙等作業系統,以及WPS、微信、QQ、釘釘、騰訊會議等基礎應用的支持。

龍芯中科負責基礎軟體研發的副總裁高翔在介紹龍架構的開源軟體工作時表示,龍架構已得到國際開源軟體社區的廣泛支持,成為與X86、ARM並列的開源軟體世界頂層指令集架構。Linux內核、GCC編譯工具鏈、LLVM編譯器、Go語言、Rust語言、QEMU系統、V8 JavaScript引擎、.NET編程框架、FFmpeg音視頻編解碼加速庫等大量重要的開源軟體社區都已經以較高級別和較完善的程度實現對龍架構的支持。

基於這些開源軟體社區發布的軟體版本,可以直接構建龍架構的作業系統發行版。龍芯中科秉持開放、合作的開源生態建設理念,累計向近200個國際開源軟體項目社區貢獻超百萬行源碼。大量國內外開發者也加入龍架構的開源生態建設中,為開源社區龍架構版本開發做出重要貢獻。龍架構的基礎軟體發展已經深度融入國際開源軟體生態體系。

胡偉武表示:「隨著龍芯3A6000的性能達到市場主流產品水平,基於龍架構的基礎軟體生態的基本建成,龍芯也將開啟生態建設新征程——構建獨立於X86體系和Arm體系的自主信息技術體系。」

五、CPU內核IP及龍架構指令系統開放授權,拓展硬體生態

胡偉武在大會報告中指出,在政策性市場帶動下,基於龍架構的自主體系基本形成,但各環節仍比較薄弱。一枝獨秀不是春、百花齊放春滿園,龍芯中科將秉承共建、共商、共享的理念,與合作夥伴共建龍架構生態。為此,龍芯中科宣布將龍芯CPU核心IP及龍架構指令系統開放授權給合作夥伴,支持合作夥伴研製基於龍芯CPU核心IP及龍架構指令系統的SoC晶片產品。

具體來說,目前龍芯CPU內核IP擁有五款,包括LA132、LA264、LA364、LA464、LA664。龍芯中科處理器核首席架構師汪文祥表示,這些龍芯自研的系列化CPU核心,產品的性能指標達到同類型產品市場主流水平,可以滿足信息化處理、網絡安全、工業控制、邊緣計算、物聯網等應用的SOC晶片研製需求。

本次對外開放授權的是對標Arm Cortex-M4的LA132、對標Coretx-A55的LA264、對標Coretx-A75的LA364。

在本次大會上,蘇州雄立科技有限公司、大唐可再生能源試驗研究院有限公司、得一微電子股份有限公司、山東領能電子科技有限公司、三峽智控科技有限公司、國家超級計算無錫中心、北京得瑞領新科技有限公司、北京科技大學工業網際網路研究院、西安微電子技術研究所、北方自動控制技術研究所共10家企業與龍芯中科正式簽署合作協議,將使用基於龍架構的CPU核設計超算晶片、專用控制晶片、存儲控制晶片等多種SoC晶片。龍芯聯合多家晶片合作夥伴共建的龍架構軟硬體生態正在蓬勃發展,形成「眾木成林」的態勢。

此外,胡偉武還在大會上透露,未來龍架構指令系統也將考慮開放授權。但是,鑒於目前開源指令集過度開放所帶來的生態碎片化、軟體不兼容等問題,龍芯也正在起草技術規範協議,並公開徵求意見。只要簽署該技術協議,即可獲得永久授權。

在大會現場,作為全球頭部的主板品牌,華碩負責人也宣布將結合華碩在主板設計和CPU超頻上的豐富經驗,推出基於龍芯3A6000晶片的主板產品。同時,該負責人還透露,已經驗證了將龍芯3A6000超頻到3GHz。

龍芯還攜手50多家合作夥伴舉辦了基於龍芯3A6000處理器的整機產品發布儀式。同方計算機、航天七〇六、聯想開天、超越科技、升騰資訊、攀升、國光信息、北方自控、視睿、海爾雷神、寶德網安、百信、黃河信產、大眾電子、方正數碼、西計、北聯國芯、航天龍夢、卓怡恆通、雲涌科技、上海華碩、上海六聯、智微智能、高能計算機、騰凌科技、百代存儲、天安星控、派若樂、龍邁科技、眾達、盛博科技、崑山嘉提、江蘇嘉擎、集和誠、迅為電子、馭芯科技、深中微、航普電子、華龍訊達、道蒞智遠、吉斯凱達、配天技術、智流形機器人、松科智能、電科網安、高鴻信安、天融信、銨泰克、寬域、木鏈科技、全訊匯聚、長焜科技等50餘家合作夥伴發布基於龍芯3A6000的桌面計算機、筆記本、板卡、存儲產品、網絡安全設備、工業控制計算機等產品。

六、全面展示,煥發「芯」活力

在大會展區,近60家龍芯合作夥伴展出數百款基於龍芯CPU的解決方案,涵蓋信息化辦公、工業控制、智能製造、智能家居、數字五金等多個場景。

在遊戲體驗區,搭載龍芯3A6000處理器的電腦支持暢玩雲·原神、古墓麗影等大型3D遊戲,在辦公體驗區除可使用QQ、微信、釘釘等常用辦公軟體外,中望CAD、雲桌面、WPS、數字孿生開發引擎軟體等行業應用也能流暢地運行在龍芯電腦上,現場嘉賓無不感嘆「龍芯電腦更好用了!」。五金電子區、工業自動化控制區、教育體驗區等特色體驗區也為現場嘉賓帶來「沉浸式」感受。

小結:

龍芯此次發布的桌面處理器龍芯3A6000在性能上已經到了英特爾10代酷睿四核水平,這也代表了這款晶片將可以進入更為廣闊的主流市場,而非龍芯原有的信創市場。後續的伺服器處理器龍芯3C6000和移動桌面終端處理器2K3000也有望進入主流市場,與英特爾和AMD進行競爭。

胡偉武也表示,由本次發布的桌面處理器龍芯3A6000、在研伺服器處理器龍芯3C6000和移動桌面終端處理器2K3000構成的龍芯「三劍客」已具有一定開放市場競爭力。

此外,圍繞自研的龍架構,龍芯也迅速建起了完整的LoongArch開源生態體系,這也有利於龍芯CPU在公開市場的開拓。而龍芯對於自研CPU內核IP及未來龍指令集的開放授權,也將進一步加速龍芯軟硬體生態的壯大。

「龍芯CPU是目前最自主的,所以沒有『卡脖子』風險,也沒有『天花板』的壓制,可以在市場實踐中不斷疊代。當然,這也帶來一些難題,比如自主生態智能靠自己來建設,不能跟著走。但這也可能會成為我們未來的優勢。我相信龍芯CPU能夠把自主化的優勢轉化為性能和生態優勢,構建與X86體系和Arm體系『三足鼎立』的新型信息技術和軟體生態!」龍芯中科董事長鬍偉武非常有信心的說道。

編輯:芯智訊-浪客劍

文章來源: https://twgreatdaily.com/zh-cn/f8eec61cddf1435ef6fccf5ded1218b6.html