清華孵出一家Chiplet黑馬!連拿億級融資,首款AI晶片已跑通,獨家對話創始人

2023-09-01     芯東西

原標題:清華孵出一家Chiplet黑馬!連拿億級融資,首款AI晶片已跑通,獨家對話創始人

芯東西(公眾號:aichip001)

作者 | 程茜

編輯 | Panken

又有一家「清華系」前沿晶片創企浮出水面。

本月初,國內Chiplet晶片設計創企北極雄芯宣布完成新一輪超億元融資。這是繼去年10月獲得1.5億元天使輪融資後,北極雄芯拿下的又一筆億級融資。韋豪創芯、中芯熙誠、訊飛創投、豐年資本、正為資本均在其股東陣容。

這家2021年7月成立的年輕創企,在今年2月推出了國內首款基於異構Chiplet集成的智能處理晶片「啟明930」,成為國內第一家流片成功Chiplet異構集成AI晶片的公司。

啟明930實物(左)、啟明930板卡(右)

北極雄芯的創始人、首席科學家馬愷聲,是清華大學交叉信息研究院助理教授、博士生導師。圖靈獎得主、中科院院士、清華大學交叉信息研究院院長姚期智,現任北極雄芯的首席科學顧問。

過去四年,馬愷聲帶領團隊在架構拆分設計、高速互聯接口、國產供應鏈封裝等各項Chiplet基礎技術研發層面取得了一系列成功。

英偉達A100、AMD MI300、特斯拉D1、蘋果M1 Ultra等經典AI晶片產品均採用了Chiplet架構。基於Chiplet架構的高性能解決方案,能夠有效降低雲邊端AI晶片的設計門檻,潛在市場規模巨大。而馬愷聲對此積累頗深。

近日,芯東西與這位國內Chiplet領域的前沿學者進行了一場深度對話,不僅回顧了其如何前瞻性地選擇在Chiplet賽道創業,還解讀了北極雄芯背後的核心技術積累。

一、用Chiplet架構解決行業痛點,三年積累迎來產業風口

馬愷聲與Chiplet的緣分,是在加入清華後開始的。

2018年,從賓夕法尼亞州立大學畢業後,馬愷聲進入清華大學交叉信息核心技術研究院,成為其中除量子晶片外主攻應用晶片研發的「第一人」。在這裡,眾多專家專注於研究AI在不同行業的應用,所涉及的場景及算法差異性極大,而馬愷聲負責底層硬體支持。「按照每2-3年做一款AI晶片的進度,我得做幾十年。」馬愷聲說,這樣的研發速度,對於飛速發展的AI行業而言,只能是杯水車薪。

恰巧在這時,電動汽車的滑板底盤技術給了他靈感。

所謂滑板底盤,就是將電動車的制動、懸架、電動傳動、電池等部件以模塊化形式集成,這樣不同車型可以根據需求組裝相應模塊。

無獨有偶。蘇州晶片創企貝塔微打造的工具,可以低成本快速批量生產晶片,與半導體產業頭部玩家德州儀器的電源管理晶片DC-DC、AC-DC搶市場。

在這些啟發下,馬愷聲開始集中琢磨一個問題:怎麼能快速、低成本的做晶片,還能滿足AI+各行各業的需求

Chiplet,就這樣闖進了馬愷聲的研究主線。

Chiplet常被譯為「芯粒」、「小晶片」,通過將一整顆SoC的功能模塊解耦,分別設計製造採用不同製程工藝的chiplets,再通過2.5D/3D先進封裝技術集成在一起。這種異構集成的設計理念,不僅有助於降低晶片研發成本,而且能夠有效緩解各行業算力需求方在差異化需求、性能、成本、算法疊代周期、供應鏈保障等各方面的核心痛點。

嗅到巨大商業價值後,2019年,馬愷聲意氣風發地率領團隊投入Chiplet研發。

早期依託於西安交叉信息核心技術研究院的孵化支持,團隊完成了啟明910、啟明920等幾代AI加速模塊的研發; 2021年7月,北極雄芯公司成立並獲得圖靈創投、SEE Fund、紅杉等天使輪投資,馬愷聲正式踏上創業之路。

2022年初,Intel、AMD等國際半導體產業巨頭成立Chiplet產業聯盟發布UCIe 1.1規範,Chiplet在市場上的關注度漸起。

一切開始步入正軌。

二、主攻雲邊端AI推理,智能駕駛成重點突破口

理想很豐滿,現實卻很骨感。

「在晶片領域,大家都很保守,你不把(產品)跑通,客戶看不到產品就會選擇觀望,不會貿然採用Chiplet路線。」馬愷聲說。

實際操作中,不同場景的需求並不收斂,如何在不同場景的硬體需求中找到最大交集?如何有效的解耦其中共性的部分以及差異化的部分? 這是做Chiplet無法繞開的一大難題。

帶著這樣的思考,馬愷聲聯合團隊深挖潛在客戶需求,綜合考慮Chiplet的技術特性和經濟效益後,北極雄芯將選擇先從雲邊端AI推理入手AI加速智能駕駛為重點場景突破口,先做出具有代表性的Chiplet架構晶片,再通過方案授權或聯合研發等方式向其它行業拓展。

Chiplet技術演示(圖源:北極雄芯官網)

例如在智能駕駛領域,單一晶片很難同時兼顧不同檔次車型在產品差異化、疊代周期、成本控制上的需求;AI推理加速方面,市場對高性能算力的需求將從「通用化」向「專用化」轉變。這些趨勢都與Chiplet架構將大型SoC晶片的模塊拆分成芯粒的技術路線相契合。

「無論是人工智慧伺服器,還是智能駕駛高性能計算平台,我們看到的均是千億級別的潛在市場,並且認為Chiplet架構在其中能夠提供獨特的商業價值。」馬愷聲對Chiplet的商業價值及市場前景非常樂觀。

三、兩年半跑通首顆Chiplet晶片,築起三大核心技術壁壘

從設計、製造、互聯、封裝、工具鏈等全部跑通,在這件事上,我們應該是國內第一家。」馬愷聲談道

今年2月,北極雄芯發布了首個基於Chiplet架構的「啟明930」晶片,可用於AI推理、工業智能等不同場景

啟明930基於12nm工藝,採用了北極雄芯自研的第三代「MUSE」核心架構NPU,搭配北極雄芯構築的完整算法、編譯、軟體工具鏈體系,使得自研NPU在主流AI模型應用上的平均晶片利用率超過70%

這是首個基於Chiplet異構集成並完成流片及國產封裝全鏈路成功驗證的高性能計算SoC,中央控制芯粒採用RISC-V CPU核心,同時可通過高速接口搭載多個功能型芯粒,做到8~20T的算力靈活拓展,支持主流AI運算元。

目前,啟明930已與多家AI下游場景合作夥伴進行測試。

由於基於全國產基板材料以及2.5D封裝,啟明930的成本更加可控。北極雄芯還提供了與其晶片配套的基礎驅動、框架支持、應用層全棧式的應用部署工具。

「把十幾個小芯粒封裝在一起,並且部署相應的任務,這塊晶片能跑通,是一個非常複雜的工程。」馬愷聲感慨道,「如何在架構定義層面進行縱向拆解?需要支持哪些算法?在哪個模塊做?IP如何集成?如何實現高速互聯通訊?如何解決應力問題?如何解決供電散熱材料?」……最後,北極雄芯聯合將近10家廠商一起才跑通了啟明930。

據他回憶:「啟明930從研發、流片、回片,折騰了將近兩半年的時間。」,因為之前從未有人完整的在國產供應鏈跑通全部。

在這背後,北極雄芯積累了三大核心技術。

一是「」,明確Chiplet的拆解與定義;二是「」,解決Chiplet的互連與通信;三是「」,負責Chiplet與封裝優化。

其中,基於芯粒劃分方法學,能降低跨芯粒數據通信負擔;採用低「芯粒稅」的架構定義,可以降低芯粒化帶來的面積負擔;內部Chiplet-Actuary成本模型,能實現高性價比復用。

北極雄芯對於Chiplet的拆解與定義

北極雄芯自主研發的PBLink D2D互連接口,能實現高速高帶寬與低延時的芯粒通信,同時符合國內《芯粒互聯接口標準》及車規級D2D接口標準。

在封裝方面,為了促進供應鏈國產化,低線數的PBLink D2D接口可以滿足國內基板的層數要求(≤8層),多芯粒與封裝協同布局同步優化封裝利用率等。

四、預告晶片量產路線圖,下一代Chiplet產品正在緊密研發

基於產學研結合的多年積累,北極雄芯已經完成了首個基於Chiplet異構集成晶片的試生產驗證,並向下遊客戶交付了首個隱私安全計算芯粒產品。

北極雄芯也陸續與經緯恆潤、海星智駕、山東雲海國創等多家下游場景方達成戰略合作,致力於共同推動Chiplet在智能駕駛、AI伺服器等各行業場景的應用。

馬愷聲認為,Chiplet的市場發展已經很清晰,他預計到2030年超過一半的高性能AI計算晶片以及智能駕駛相關主控晶片均會採用Chiplet架構

市場研究機構Omdia的數據也顯示,到2024年Chiplet的市場規模將達到58億美元,2035年市場規模將進一步擴大到570億美元。

目前北極雄芯正投入下一代高性能通用型芯粒以及AI計算芯粒的研發。據馬愷聲透露,其下一代產品預計將於2024年回片測試成功並開始小規模量產,預計將率先在部分高性能計算、商專車、低速無人駕駛等場景實現小批量使用,並按節奏逐步進入乘用車智能駕駛領域。

面向未來,當下蓬勃發展的大模型機器人產業,也讓馬愷聲看到了Chiplet落地應用的諸多機遇。

不同於此前人形機器人的傳統控制算法,現在人形機器人採用端到端控制,基於模型輸出電機怎麼轉的指令。

這樣一來,機器人的每個自由度都是一個電機,每個電機都需要一套模型,模型的計算速度要更快,才能讓機器人收到反饋、做指令更靈活。

此外,大模型包含訓練和推理的需求,可能兩年之後,隨著產業發展較為成熟,推理需求將進一步被釋放出來。

在這些機遇中,基於國內尚有差距的供應鏈、工藝等,如何做出高性價比的系統,是北極雄芯要做的事。這些擁有巨大潛力的應用場景的出現,也為馬愷聲繼續探索Chiplet增添了更多動力。

五、 拆解Chiplet發展三大攔路虎,發布國產供應鏈Chiplet互聯標準

對於國內Chiplet發展面臨的挑戰,馬愷聲重點談及三個環節。

首先是生產製造環節,如何儘可能基於國內自主可控的供應鏈實現Chiplet晶片的量產,擺脫受制於國外先進位程的枷鎖,用國內成熟製程工藝技術實現滿足需求的性能。

其次是如何拆分晶片模塊,並通過不同工藝製程生產,使其商業化達到最優。

還有封測環節,國內封裝基本材料與國外存在差距,先進封裝的量產成本高,因此做Chiplet既要考慮通過國產封裝供應鏈來優化芯粒、接口設計,還要考慮成本。

難題擺在眼前,北極雄芯也在積極推進Chiplet接口標準的制定。

早在2020年,其團隊即與國內上下游共同建立了中國Chiplet產業聯盟(CCLL),專注於Chiplet架構在各領域應用的前沿探索。今年年初,交叉信息核心技術研究院牽頭、中國Chiplet產業聯盟共同起草的《芯粒互聯接口標準》ACC 1.0高速串口標準《車規級芯粒互連接口標準》ACC_RV 1.0正式發布。

下載連結:http://accchiplet.iiisct.com/

相比於UCIe標準,ACC標準更關注針對國產供應鏈的優化,適合對供應鏈自主可控程度要求高、量產成本敏感的下游領域,能滿足其商業落地的需求。

馬愷聲坦言,雖然UCIe已經發布一段時間,但市場上至今還沒有相對成熟的支持所有頻點的滿足標準的產品,而真正下場做各個「芯粒」的企業更是寥寥無幾

他認為,標準應該先讓大家能用起來,基於各場景的真實商業需求以及國內相關供應鏈的完備程度來制定標準。往後看,北極雄芯計劃進一步投入高速互聯芯粒接口等Chiplet基礎技術的研發。

在這個過程中,他將Chiplet的發展和工藝進步看作「正交」關係,在工藝製程發展受光刻機等關鍵設備及半導體材料制約的情況下,接下來10-15年內,Chiplet或許會貢獻出不一樣的東西。

結語:高性能計算Chiplet需求漸起,國內新生勢力挑起大梁

北極雄芯希望在Chiplet產業中扮演怎樣的角色?馬愷聲用一句話加以概括:「北極雄芯希望基於國產化的供應鏈,用最大的自主可控程度,做出不錯的系統應用。」

如今北極雄芯的核心研發團隊,已經聚集了有中興、華為、紫光、英特爾、Cadence、Marvell等國內外知名半導體企業背景,擁有不同工藝多款晶片成功流片經驗的一批晶片人才。

隨著系統級晶片集成進入後摩爾時代,加上國內先進位程供應受阻,基於Chiplet的創新思路成為國內半導體產業發展的重要途徑。在時代浪潮中,北極雄芯致力於成為基於Chiplet架構定製化高性能計算解決方案的領航者,從AI在各領域落地的實際應用需求出發,協助各行業「用小晶片,做大晶片」。

在今年9月14日-15日舉行的2023全球AI晶片峰會期間,馬愷聲教授將對Chiplet架構在AI晶片中的商業價值進行進一步的深入解讀,分享推動Chiplet架構在國內的商業化落地以及創造新的高性能計算範式,並介紹北極雄芯在Chiplet領域的拓展及實踐。

文章來源: https://twgreatdaily.com/zh/e6098e16ecc51e03c9a6087c79329346.html