芯東西(公眾號:aichip001)
作者 | 程茜
編輯 | Panken
蟄伏六年後,這家清華系AI晶片創企終於開始在國產GPGPU江湖高頻出場。
今年4月,國內首款基於可重構架構的GPGPU晶片RPP-R8亮相,現已小規模量產。其背後的珠海GPU晶片創企芯動力,就此浮出水面。
芯動力GPGPU晶片RPP-R8
芯動力創始人、CEO李原是一位晶片連續創業者。他1989年本科畢業於清華大學物理系,隨後任職於英特爾、德州儀器等晶片巨頭。在英特爾任職期間,他曾開發至強CPU伺服器系統,擁有從產品定義、量產到商用的全鏈條經驗。
從德州儀器辭職後,李原2008年在美國加州創立IPG Communications,承接通訊基站大型晶片設計項目。IPG獨創的Turbo解碼器被英特爾應用於其至強處理器。這家公司後來被美國老牌通信晶片商敏訊科技(MindSpeed)收購,敏訊科技的無線業務又在2013年被英特爾收購。
就在英偉達提出GPGPU新概念的前後腳,李原也開始琢磨類似的思路,即如何在發揮GPU並行計算能力和通用性優勢的同時,通過引入其他類架構的長處,研發出能更好平衡性能、功耗、成本、延遲、部署速度的硬體。從2011年到2016年,經過長達六年的摸索,他們團隊獨創了一個將NPU的高效率與GPU的高通用性相結合的創新架構——可重構並行處理器架構(RPP)。
他為何早早選擇進入GPGPU賽道創業?又如何組建團隊,將芯動力RPP架構從圖紙中的創新設想,變成了在實際應用場景中發揮價值的硬體?在這外部環境複雜多變的五年之間,他對AI晶片及GPU行業的發展脈絡與方向有哪些新的感悟與思考?近日,芯東西與這位國內GPGPU領域的創業代表人物進行了深入交流。
插播一則會議預告。9月14-15日,2023全球AI晶片峰會將在深圳舉行。清華大學魏少軍教授領銜近50位演講嘉賓,NVIDIA與AMD齊聚,15+國產AI晶片企業屆時將登台交鋒,國內邊緣計算AI晶片代表公司亮相。珠海芯動力創始人、CEO李原將在AI晶片架構創新專場,發布主題為《RPP晶片架構給AI晶片帶來的發展前景及機遇》的演講。歡迎掃碼報名~
一、清華物理系校友創業,已在半導體領域深耕19年
創立芯動力之際,李原早已是一位入局半導體行業19年之久的資深老兵。
1989年,他從清華大學物理系本科畢業後,接連遠赴日本、加拿大進修無線通信專業。2004年,李原入職德州儀器,主攻通訊系統研發,在這裡,他和芯動力的另一位聯合創始人、當時已是德州儀器資深硬體工程師的朱建斌相識,這為多年後芯動力核心團隊的組建奠定了基礎。
當李原第一次籌備創業期間,朱建斌主動提出要轉到晶片設計行業,並要從一位硬體工程師跨界成算法工程師,這令李原感到「有點不可思議」。朱建斌很快憑藉其出色的學習能力、抗壓能力證明了自己,李原的創業團隊也組建就緒。
2008年,李原、朱建斌以及幾位來自德州儀器的同事共同創業,在美國加州創辦了一家無線通信晶片公司IPG Communications。
他們的初始目標很簡單,先靠創業生存下來,再換個視角觀察整個半導體行業。IPG創立後不久就承接設計了休斯頓衛星GlobalStar系統的通訊晶片,自研的Turbo解碼器被英特爾應用至其至強處理器,隨後在2011年順利被美國老牌通信晶片商敏訊科技(MindSpeed)收購。
芯動力發展歷程
這一次創業,也讓李原對半導體產業的認識更加深刻,他們發現幾個特點:
半導體行業產業鏈綿長,晶片設計公司就是其中的靈魂。
半導體行業全球競爭激烈,中小規模的公司不停被兼并、收購,很多從業人士被迫改行。李原的觀點是,不能這樣,「我們要逆流而上,要去看一看不同的風景」。
競爭激烈的行業共識後,他們還意識到,一旦在半導體行業里處於領先地位,企業就能獲得巨大市場。最後可能形成第一家公司供應產品,第二家公司艱難競爭,第三家公司基本不存在的現象。
因此,第二次創業,李原和團隊的目標就是:「我們應該成為一家什麼樣的公司才有可能存活下來。」
2011年,他們把各種各樣不同種類的晶片擺到一張圖上,他們發現其中有一個很大的空缺,在常見的CPU、GPU、DSP,以及專用的通信晶片之外,還有一類晶片的位置空缺,未被發現。
在這個空白處畫下的大大的問號,成為芯動力創立的起點。經過5年的探索,2016年他們找到了答案——可重構並行處理器架構。基於這一創新架構,李原等人先是在美國成立了公司,2017年轉回國內,在珠海創立芯動力公司。
二、研發「六邊形戰士」處理器,已實現千片級小規模量產
芯動力剛剛成立,李原曾問過朱建斌一個問題:什麼樣的節點代表他們做的事情成功了?朱建斌的答案是:「我們只要把這顆晶片真的做出來,達到了我們預期的性能指標。」
今年他們迎來了這一時刻。4月,芯動力發布首款基於可重構架構的GPGPU晶片RPP-R8。
RPP-R8每顆晶片內含有1024個計算核,相比傳統GPU架構在同樣的算力占用更小的晶片面積,實現了低功耗和高能效的有效平衡。RPP-R8除了具備專用晶片所沒有的通用編程性,面積效率比可達到同類產品的7~10倍,能效比也超過3倍,可滿足高效並行計算及AI計算應用。
GPU和RPP架構性能比較
這顆晶片於2020年一次性流片成功,李原透露,RPP-R8目前實現上千片級小規模量產,並且已經進行大規模測試,之後他們會根據客戶反饋進行產品修正,再繼續下一個產品研發。
事實上,基於RPP架構的晶片成果做出來,在成立時的他們看來是不可能的事情。
這背後的原因可以先從現在的三大GPGPU技術流派來看,第一類較多公司採用的是在比較成熟的GPU架構之上,構建矩陣計算的能力;第二類是純粹基於可重構技術來做;第三類是將可重構技術與GPU編程模型CUDA語言相結合。
芯動力選擇的即是第三類。李原解釋說,主要有兩大技術原因,首先選擇可重構技術是因為,採用傳統GPU架構很難追齊行業頭部玩家,因此他們需要尋找更好的技術;其次,與CUDA語言相結合是因為其可擴展且廣為行業所接受。
走一條全新的路徑,也意味著他們一定程度上需要從0開始。李原談道,最難的地方就在於,不僅要創新,還要達到市場的需求。
RPP架構是針對並行計算設計的晶片架構,芯動力將其稱作「六邊形戰士」。這一架構既結合了NPU的高效率與GPU的高通用性優勢,還支持實時作業系統(RTOS),具備DSP的低延時,可滿足高效並行計算及AI計算應用,大大提高了系統的實時性和響應速度。
芯動力同樣製程下的GPGPU晶片,與英偉達相比,在一些場景下性能提高達50%,且面積為類似晶片的1/7,功耗僅為其1/2-1/3。
這背後離不開芯動力的研發團隊,其核心成員有平均年限超過15年的資深半導體從業背景,且均來自英特爾、高通、德州儀器、聯發科等半導體知名企業,研發人員占比超過80%。
時至今日,當李原再次問到什麼是最大的成功時,朱建斌已經忘記了當初的說法,他的回答變成了:「我們把它在商業上做到成功,我們把這個事情變成一個客戶喜歡的商品,這樣才是真的成功。」
三、第一家客戶是銀行,率先落地三大應用場景
李原也一直在為做「客戶喜歡的商品」而努力。
芯動力GPGPU晶片的第一家客戶是一家銀行。李原認為,晶片行業周期長,因此晶片設計必須按照產品需求來設計,否則晶片公司拿出的產品很容易因市場需求變化而被淘汰。
因此2017年以後,芯動力團隊花了很長一段時間進行市場調研,調研結果與這家銀行的需求不謀而合。銀行希望將智能攝像頭的「智能」和「攝像頭」區分開,邊緣算力盒子可以獨立於攝像頭進行升級疊代。
李原談道,這也是他們與同類企業在市場策略上的不同之處——更加強調對於客戶需求的分析。
在這個過程中,他們將客戶分為三層,終端用戶、軟體集成商、硬體集成商。其中,關注設備功能的終端用戶目前不在芯動力的合作夥伴之列。
目前,他們採用的策略是,與軟體集成商合作先拿到市場,贏得硬體集成商的認同,進一步推廣晶片產品。
芯動力的產品已經在邊緣計算領域與銀行、通訊領域與醫療超聲波方向、AI方向的高性能計算等領域實現應用。
作為產業鏈的上遊玩家,晶片行業的封裝、模組、軟體、晶片本身領域都會影響到相關晶片企業研發或者進入新領域的動作,因此,芯動力目前的策略是把現存的幾個方向做紮實,按照節奏來走。
在公司的未來規劃中,李原有一個最為清晰的原則,那就是「技術是有邊界的」。放到RPP架構中來說,就是這一架構只做適合的並行計算,不會做串行計算。
從任職大廠到自主創業、從半導體老兵到創企CEO,這些此前的工作經歷及身份的轉變,幫助李原為芯動力一步步確立起了清晰的技術路線和應用方向等。他說,最大的改變是視野不同。創業之前,有限的視野讓他產生諸多困惑,例如自己到底在做什麼,做的東西有沒有用;創業之後,會更關注眼前的困惑,更加重視現在的產品。
四、GPGPU賽道競爭激烈,必須在細分賽道拿下第一
針對當前國內GPGPU產業,李原反覆提及四個字:競爭激烈。
國內相關創企迎著半導體熱潮湧入GPGPU賽道,李原認為,想要在這條賽道活下來,企業必須拿出產品驗證自己存在的價值,在某一些方面超過英偉達,做到英偉達做不到的事。
英偉達這個強大的競爭對手,也是國內GPGPU晶片走向落地的最大攔路虎。李原感慨道,最高端,英偉達的A100、H100晶片擁有市場其它晶片無法匹敵的能力;最低端,英偉達的晶片同樣在性能、價格上有競爭力。
面對這一勁敵,李原認為,全球競爭激烈的半導體產業中,他們必須超過第一位,成為這個賽道的龍頭,才有可能生存下來。想要和英偉達競爭,就要先從與之不同的行業切入。他補充道,英偉達雖然有不同產品,但不見得其產品在每個行業都無可替代。深耕這些行業,使得產品在性能、價格上擁有競爭力是芯動力目前最重要的事情。
此外,當下大模型狂潮席捲,GPU缺貨風波不斷,也為GPGPU產業帶來了很好的機會。在李原看來,主要有兩個方向:
首先是AI訓練,參數規模龐大的大型語言模型,需要強大的計算能力,國內創企未來的技術演進或許能滿足這一需求。不過,目前而言,英偉達在這一方向的領先性鮮少有企業可以與之抗衡。
其次是應用部分,大型語言模型在應用端的計算需求,一般晶片也可以滿足,因此這對於國內創企而言是一個巨大的機會。即便大型語言模型距離未來真正落到某一個場景還有一段距離,但李原對這個方向十分樂觀,其現在面臨的局限性未來有機會被打破。
就芯動力而言,他認為,大型語言模型呈現出的能力和人相比還有一段距離,芯動力會在自己的技術上做一些思考,如何找到創新的晶片架構路徑,使得大型語言模型性能達到替代人的地步。
最後,在半導體行業的漫漫創業路中,李原說:「要保持樂觀。」他和團隊選擇了一條艱難的路創業,正因為他們沒有在整個半導體行業走下坡路時放棄,現在也幸運地碰到了其中為數不多蓬勃發展的好機會。
結語:國產GPGPU新秀髮力,核心團隊離不開三大要素
GPGPU將GPU的應用範圍擴展到了圖形計算之外,在眾多大規模並行計算中得到了廣泛的應用。今年晶片實現小規模量產的芯動力開始在這一領域嶄露頭角。
李原總結了芯動力核心研發團隊具備的幾大核心要素:
首先要有資深從業背景,芯動力的研發團隊准入門檻非常高,有熟練研發經驗、善於從事這一行業的工作,是最起碼的要求。
其次,要對新技術保持開放的心態,他說:「當我們把這件事情做的很好的時候,我們往往會給自己畫地為牢,走出來是很難的。」
第三,研發團隊要有激情,遇到挑戰不低頭。芯動力選擇的路線是沒人做過的事情,因此挫折往往更多。
對於GPGPU賽道則更為艱難,英偉達身處霸主地位已經成為業界共識,另闢蹊徑的芯動力或許有望通過「六邊形戰士」的RPP架構,在部分特定能力上做到超越英偉達。
在今年9月14日-15日舉行的2023全球AI晶片峰會期間,李原教授將對RPP晶片架構給AI晶片帶來的發展前景及機遇進行深入解讀,分享這一架構在適配各種不同AI算法和應用場景方面的通用性,以及如何為AI企業提供強大的計算能力,推動AI產品的應用落地。