大模型亂斗,AI晶片狂歡

2023-07-07     芯東西

原標題:大模型亂斗,AI晶片狂歡

芯東西(公眾號:aichip001)

作者 | ZeR0

編輯 | 漠影

大模型正吞噬一切,算力尤甚。

芯東西7月7日上海報道,在正在舉辦的第六屆世界人工智慧大會(WAIC)上,瀚博半導體、崑崙芯科技、天數智芯、Graphcore、燧原科技、登臨科技、愛芯元智、沐曦、海飛科、墨芯人工智慧、知存科技、後摩智能、珠海芯動力、復旦微電、憶芯科技、富瀚微、西安紫光國芯等晶片企業參展。多數均為AI晶片創企。

如今AI算力資源緊張已經不是什麼秘密,隨著相關算力基礎設施建設進程提速,AI晶片創企的受關注度正水漲船高。這在此次展會上可見一斑,幾乎每家AI晶片展台都人潮洶湧。

從展品可以看到,大多數參展的晶片企業都在積極適應大模型熱潮帶來的市場需求變化,不僅展出更具針對性的硬體產品,還展示了更加廣泛的行業應用Demo,多數展位都有AI大模型或AIGC(AI內容生成)應用的演示專區。

瀚博半導體AI大模型演示展台

當然,這一風向並不令人意外。連權威AI基準測試MLPerf最近都新增了大語言模型和推薦算法兩項新的基準測試,足見跑AI大模型的速度已被視作衡量晶片性能的重要指標。得益於此,今年AI晶片展區明顯要比往年更加熱鬧。

隨著更多國內AI晶片成功流片與量產,AI晶片企業們比拼的賽點,已經從單純的性能指標轉向進入真實應用場景落地的較量。

一、拼榮譽:兩款AI晶片關聯產品獲得世界人工智慧大會最高獎

從獲獎情況來看,燧原科技面向AIGC模型訓練的液冷集群、Graphcore IPU產品C600、崑崙芯模型端到端解決方案產品、海飛科Compass C10通用GPU加速卡-高性價比AIGC部署、高通第二代驍龍8移動平台的AI引擎,這5個由晶片企業參評的項目都入圍了今年世界人工智慧大會2023 SAIL獎TOP30榜單

SAIL是世界人工智慧大會評選的最高獎項,設置有SAIL大獎以及SAIL之星,並形成年度榜單,今年首次設置200萬元獎金池。

最終大獎的結果在昨天開幕式上揭曉。

高通第二代驍龍8移動平台的AI引擎獲得2023 SAIL獎,憑藉行業內率先支持終端側生成式AI用例、協同雲端一起打造適應大模型時代的混合AI架構等戰績,拿大獎實屬當之無愧。

高通獲頒SAIL獎

超10億參數Stable Diffusion模型能夠在搭載第二代驍龍8移動平台的安卓手機上運行,實現15秒內20步推理。

燧原科技面向AIGC模型訓練的液冷集群雲燧智算集群摘得了「SAIL之星」獎。該集群採用的燧原科技邃思晶片曾獲2022年吳文俊人工智慧專項獎晶片項目一等獎。

燧原科技的一系列裡程碑式產品

雲燧智算集群產品已在國家級重點實驗室之江落地千卡規模訓練集群,提供超過100P的先進AI算力,能高效支撐融媒體、文本生成PPT、跨模態圖像生成等AIGC應用以及多種AI4S科學計算應用的開發和前沿探索。

二、拼資歷:崑崙芯十年磨一劍,國內首批通用GPU晶片走向增收

展出一系列硬體產品實物已經是各家晶片展台的標配,多數企業都是「全家福」上陣,把主打產品全部擺出來供觀眾參觀了解。

從資歷來看,崑崙芯科技雖然2021年才從百度集團獨立出來,但若論團隊的「年紀」,當屬國內AI晶片產業界的老大哥。

自2011年起,崑崙芯團隊便基於真實AI場景需求研究AI計算加速,2017年正式提出自研XPU架構,並基於該架構打造兩代雲端AI晶片,相繼推出多款AI加速卡及AI加速器組產品。

崑崙芯歷代AI晶片及AI加速卡

在此次WAIC上,針對不同參數級別的崑崙芯第二代系列產品矩陣首次亮相,包括3款崑崙芯AI加速卡R100、RG800、R200-8F。其大模型端到端解決方案更是繼正式發布後首次參展,該方案在能源行業、文心一格、智源研究院等多個場景均有應用落地。

其中,R200-8F面向百億以下參數量級,性能可達到主流GPU 1.2倍且價格更有優勢;R480-X8加速器組針對百億到千億參數量級,大內存和晶片互聯的技術使其性能達到同類型GPU的1.3+倍;千億參數,可採用崑崙芯R480-X8集群,實現多機多卡分布式推理。

天數智芯自稱是國內首家真正量產的通用GPU企業,從2018年開始設計通用GPU天垓100至今,已有兩款產品成功進入量產階段。據悉,截至2022年底,天數智芯累計訂單接近6億元,去年全年收入大約2.5億元

天數智芯通用GPU產品展台

另一家國內通用GPU領軍企業登臨科技自認是國內首家完全憑藉自主創新,實現規模化商業落地的通用GPU企業,通過GPU+架構創新,解決了通用性和高效率的雙重難題。經過大量客戶產品化驗證,針對AI計算,GPU+比現有主流GPU在性能及能效上有顯著提升。

首款基於登臨GPU+的AI加速器Goldwasser(高凜)2021年量產投入市場,2022年銷售過萬片,應用場景覆蓋網際網路、智慧城市、電力、能源、金融等領域。高凜二代產品在2022年流片, 在2023年實現量產。根據現有客戶測試結果,二代產品針對基於Transformer類型的模型提供3-5倍的性能提升,能夠大幅降低類ChatGPT及生成式AI應用的硬體成本。

今日上午,登臨科技還宣布了一個好消息:獲得中國網際網路投資基金獨家投資。

登臨科技Goldwasser(高凜)六大亮點

三、拼硬體:先進位程扎堆,解鎖千億大模型部署

在WAIC展會上,我們看到很多晶片展品都用上7nm及更先進的製程工藝。瀚博半導體全功能GPU晶片SG100、天數智芯通用GPU推理產品智愷100、崑崙芯科技的2代AI晶片、Graphcore Bow IPU處理器等均採用7nm工藝。此次沒有參展WAIC的壁仞科技首款通用GPU晶片BR100同樣採用7nm工藝。

兩家GPU創企瀚博半導體、珠海芯動力均在WAIC期間發布晶片新品。

其中,瀚博半導體發布其全功能GPU SG100晶片,並推出了6款新品,包括分別針對雲遊戲、雲桌面、工作站提供算力支持的南禺系列GPU加速卡VG1600、VG1800、VG14,以及大型語言模型AI加速卡VA1L、AIGC大模型一體機、VA12高性能生成式AI加速卡

瀚博SG100晶片簡介

VA1L具備200TOPS INT8/72TFLOPS FP16算力,並支持ChatGPT、LLaMA、Stable Diffusion等主流AIGC模型。其AIGC大模型一體機共使用8張VA1L加速卡,支持512GB顯存,進而支持1750億參數的大模型。VA12作為250W板卡,是VA1和VA10的升級版,有512TOPS INT8/160TFLOPS FP16算力,能夠更高效地支持文生圖模型Stable Diffusion。

珠海芯動力發布首款基於可重構架構的GPGPU晶片RPP-R8。該公司在2017年成功研發出可重構並行處理器(RPP)架構,能夠對AI推理的性能進行深度優化。以RPP架構為基礎、面向邊緣市場設計的第一代晶片RPP-R8已經一次性流片成功,芯動力成為GPGPU領域的新成員。

芯動力「六邊形戰士」處理器RPP

據悉,RPP-R8晶片是一款通用型GP-GPU晶片,每顆晶片內含有1024個計算核,相比傳統GPU架構在同樣的算力占用更小的晶片面積,實現了低功耗和高能效的有效平衡。RPP-R8除了具備專用晶片所沒有的通用編程性,面積效率比可達到同類產品的7~10倍,能效比也超過3倍,可滿足高效並行計算及AI計算應用。

珠海芯動力RPP-R8晶片

其它參展晶片中,天數智芯2018年設計的通用GPU的天垓100加速卡目前已經跑通清華ChatGLM、LLaMA、智源研究院Aquila等大模型。今年6月,天數智芯宣布天垓100率先完成百億級參數大模型訓練。

崑崙芯2代AI晶片是國內首款採用GDDR6顯存的通用AI晶片,已經在金融、工業、交通、教育等領域廣泛部署。崑崙芯在軟體層面提供了豐富的雲原生插件,幫助用戶快速完成和大模型平台的適配。其產品矩陣適配文心一言、ChatGLM、GPT、OPT等主流行業大模型,並提供豐富的軟體SDK,幫助用戶快速完成適配和實時自定義的開發。

海飛科稱其第一代通用GPU晶片Compass C10是業界首個顯存高達128GB的GPU晶片,達到了算力和存儲容量的優化平衡,實現單卡、多卡分布式部署千億大模型。海飛科展台演示有在其產品上跑Stable Diffusion、ChatGLM OPT等模型。

海飛科Compass C10計算卡

沐曦展示了其AI推理GPU曦思系列、通用計算GPU曦雲系列、圖形處理GPU曦彩系列晶片。其中,曦思N100是沐曦面向人工智慧推理場景推出的一款高效能GPU產品,單卡算力達160TOPS (INT8)和80TFLOPS (FP16),已實現規模量產,並與多家重點客戶及合作夥伴共同打造應用解決方案和生態聯盟。

曦思MXN100晶片

曦雲C500是沐曦面向AI訓練及通用計算的旗艦產品,提供強大高精度及多精度混合算力,配備大規格高帶寬顯存,片間互聯MetaXLink無縫連結多GPU系統,能滿足大模型推理和訓練需求。曦雲MXC500晶片已於2023年6月13日完成基礎測試,預計將於今年年底實現量產。

曦雲MXC500晶片

墨芯Antoum晶片是全球唯一擁有高稀疏率的AI晶片,採用12nm製程。憑藉軟硬協同的稀疏計算技術,搭載Antoum晶片的墨芯AI計算卡在權威AI基準測試MLPerf今年4月公布的結果中取得ResNet-50單卡、多卡的性能第一。墨芯AI計算平台可支持BLOOM、OPT、GPT-J、LLaMA、Stable Diffusion等主流大模型。

墨芯AI計算平台

英國AI晶片獨角獸Graphcore(擬未)展出了入圍SAIL獎TOP30榜單的雲端高端推訓一體加速卡C600,以及世界首款3D Wafer-on-Wafer處理器Bow IPU和基於4個Bow IPU構建的Bow-2000。

Bow-2000可提供高達1.4PFLOPS的AI計算能力,並實現顯著的電源效率提升。其C600 IPU處理器PCIe卡在此基礎上增加了用於低精度和混合精度AI的FP8,主打推理,兼做訓練,在搜索和推薦等業務上更具優勢。

Graphcore在支持大模型方面一直很積極,目前已部署在其IPU上的包括ChatGLM-6B、GPT2-XL、GPT-J、Stable Diffusion、Dolly 2.0等。Graphcore現場演示了在其IPU上運行中英雙語模型ChatGLM-6B和開源文生圖模型Stable Diffusion。

ChatGLM-6B模型在IPU上運行秒出多行回復

算能展出了第四代邊雲大算力AI晶片算豐BM1684X,以及首款基於RISC-V指令集架構的64核伺服器CPU晶片算豐SG2042。每台基於SG2042的伺服器會配置1張萬兆光纖網卡,並根據硬碟配置選配RAID卡,使整個系統的操作起來與x86系統一樣方便。

算豐RISC-V SG2042伺服器簡介

聚焦於計算+感知應用的愛芯元智,在WAIC上重點展示了第三代高算力、高能效比SoC晶片AX650N和M55、M76系列智能駕駛晶片。

AX650N現已適配ViT/DeiT、Swin/SwinV2、DETR等Transformer模型,在DINOv2達到30幀以上的運行結果。Transformer網絡SwinT在AX650N平台上實現了361FPS的高性能、80.45%的高精度、199FPS/W的低功耗以及原版模型且PTQ量化的極易部署能力。

愛芯元智邊、端側Transformer大模型展台

四、拼落地:滿場大模型運行Demo,大曬應用案例與生態朋友圈

除了一如既往地展示晶片、加速卡、系統集群和軟硬體解決方案外,瀚博半導體、天數智芯、燧原科技、登臨科技、算能、海飛科等AI晶片創企均現場展出了用自家產品運行大語言模型、AI繪畫、文生PPT等AIGC交互演示。

天數智芯智愷100支持各類算法模型和大語言模型,能夠支持AIGC內容生成類大模型推理;燧原科技的雲端訓練晶片邃思2.0能廣泛支持大模型訓練。雲天勵飛展出的兩款Edge10大算力晶片均可高效支持大模型運算。

天數智芯大模型能力

燧原科技7月5日剛推出的新品燧原曜圖(Enflame LumiCanvas)文生圖MaaS平台服務產品在展會現場受到很多關注。這是燧原繼3月宣布升級企業戰略「以全棧軟硬體和集群產品為數字底座,結合MaaS的業務模式,全面打造AIGC時代的基礎設施」後的首款新品。

這也是燧原在AIGC戰略布局的第一步,後續燧原還將繼續推出其它MaaS服務。

燧原曜圖文生圖MaaS平台服務產品

燧原曜圖以燧原科技邃思系列晶片為算力支撐,由首都在線提供計算服務,集成了圖像預處理、姿態建模、外部模型一鍵導入等能力,能夠大批量生成圖像,通過軟硬一體方案降低大規模AIGC應用的工程難度與算力成本。

這個企業級文生圖應用支持以Excel形式批量導入prompt,單次最高可支持千條prompt導入,並針對視覺創作領域專業術語海量且繁複的問題,為用戶提供prompt詞典、大師經典作品prompt模板沉澱、逆向prompt等在內的全面Prompt工具體系。

除了燧原曜圖外,燧原還展出了有多個可交互設施的AIGC交互演示體驗區,包括ChatBCG(文生PPT)、LLaMA(聊天機器人)、由清華ChatGLM和Stable Diffusion組成的能回復文字和圖片的ChatBot(聊天機器人)等。

燧原AIGC交互演示展區

墨芯人工智慧在WAIC期間發布了大模型算力方案的最新成果,展示1760億參數的大語言模型BLOOM在墨芯AI計算平台的推理引擎支持下,能夠快速、流暢地回答各類問題,並完成詩歌創作、文案撰寫等多項語言生成任務。在1300億參數ChatGLM大模型上,8張墨芯S30計算卡吞吐達432token/s,性能超過主流GPU。

天數智芯亦展出了豐富的應用演示,包括大模型微調、大模型推理、代碼生成、AI繪畫、內容審查、虛擬數字人、隱私計算、風電場巡檢、智慧語義、人臉比對、智算中心、3D建模、科學計算、智能OCR、目標檢測/缺陷檢測、智慧零售等,充分展示了其GPU產品的通用性。

天數智芯合作夥伴

登臨科技設置了大模型、創新應用、AIDC、創新硬體四大主題展區,和合作夥伴一起展出了數十種產品方案,包括大模型、步態識別、數字孿生、無人機、智慧金融、智慧電力、智慧能源、智慧園區、車路協同、智慧社區、智慧交通等,並展示了其生態朋友圈。

登臨瀚海生態合作夥伴

燧原科技也曬出了生態合作夥伴。

燧原科技生態合作夥伴

雖然崑崙芯並未在展台設置關於AIGC應用的互動演示,但百度文心大模型早已是崑崙芯的金字招牌。

值得一提的是,百度並沒有因為崑崙芯是自家孩子而排斥其他AI晶片企業。百度展台上有一張標註飛槳在WAIC上的硬體夥伴們展位的地圖,愛芯元智、登臨科技、沐曦、崑崙芯、海飛科、墨芯人工智慧、算能、燧原科技、瀚博半導體、天數智芯、Graphcore均在其中。

百度飛槳和硬體夥伴在WAIC

結語:上海近年已有30多款AI晶片點亮

除了上述已宣布支持大模型加速的AI晶片創企外,知存科技、後摩智能、復旦微電、富瀚微、西安紫光國芯等晶片企業也參展WAIC。

其中,知存科技和後摩智能是存算一體AI晶片的玩家代表。知存科技展出的WTM2101晶片於去年成功量產並商用,AI算力相較NPU、DSP、MCU計算平台提高了10-200倍,功耗僅在5uA到3mA之間。

後摩智能則聚焦於智能駕駛,展出了首款存算一體智駕晶片後摩鴻途H30晶片及相關產品。基於後摩鴻途H30已成功運行常用的經典計算機視覺網絡和多種自動駕駛先進網絡,包括當前業內最受關注的BEV網絡模型及廣泛應用於高階輔助駕駛領域的PointPillar網絡模型。

後摩鴻途H30晶片

國內FPGA龍頭復旦微電重點展示了基於自研FPAI(可重構人工智慧)晶片的一站式AI解決方案。憶芯科技展出了企業級SSD晶片等多種解決方案。西安紫光國芯則展出了世界領先的嵌入式DRAM(SeDRAM)、高帶寬高性能板卡解決方案HBX-G500等科技創新成果。

目前,上海集聚了全國最多的智能晶片創新企業,近年已有30多款AI訓練晶片、AI推理晶片、車載晶片點亮,這些積累為通用大模型發展和落地普及打下了算力基礎。

文章來源: https://twgreatdaily.com/zh-mo/d90f3e4bedfa02420c83ddbd04f7cfe7.html