清華團隊研發光電融合晶片,推動構建生態友好的AI計算框架

2023-10-26     DeepTech深科技

原標題:清華團隊研發光電融合晶片,推動構建生態友好的AI計算框架

日前,清華戴瓊海院士團隊與喬飛副研究員團隊再迎晶片新成果,他們造出一款名為 ACCEL 的光電融合晶片。該晶片的系統級算力和能效,實測達到高性能工業級 GPU 的 3000 餘倍,能效的 4000000 餘倍,具備超高算力、超低功耗的特點。

ACCEL 晶片光學部分的加工最小線寬僅採用百納米級,而電路部分僅採用 180nm 互補金屬氧化物半導體(CMOS,Complementary Metal Oxide Semiconductor)工藝,已經比 7nm 製程的 GPU 取得了多個數量級的性能提升。

研究人員表示:「形象來說,如果原本的電量可支持現有高性能晶片工作一小時,那麼相同的電量供給下 ACCEL 晶片可以工作五百多年。」

圖 | 部分團隊成員合影(來源:資料圖)

論文中的實驗演示表明,該晶片的成功研製證明了光子計算在諸多 AI 任務中的優越性(即光子霸權),也為解決摩爾定律增速放緩、構建生態能源友好的大規模 AI 計算框架開闢了新路徑。

圖 | ACCEL 晶片(來源:課題組)

在論文中,研究人員用「All-analog Chip Combining Electronics and Light」來描述這款光電融合晶片的特徵。這句英文的首字母簡稱為 ACCEL,恰好是「加速」的含義。

當前,人類正處於算力需求爆炸式增長的時代,超高性能的計算架構有著大量用武之地。研究人員非常希望能將 ACCEL 晶片快速用於實踐之中。

目前,他們正在基於 ACCEL 晶片的光電計算框架,開展一系列應用探索例如自動駕駛、野外監測、物聯網傳感器網絡、計算機視覺等。

目前,他們已經開展了將超高速圖像計算,用於光纖通信中的信號編解碼和誤碼糾錯的探索,有望將光纖通信端到端信號處理的時延降低四個數量級。

一旦計算時間從三小時變成三秒鐘,很多日常生活應用和科學計算任務將會發生質的變化。

圖 | 光電計算晶片 ACCEL 的計算原理和晶片架構(來源:Nature)

據介紹,ACCEL 晶片通過融合光域計算和模擬域電計算,來實現神經網絡的計算。在光域之中,ACCEL 晶片通過一個多層光學衍射神經網絡,針對所輸入的高解析度圖像,以光速來進行特徵提取和數據降維。

衍射網絡的輸出,則由一個光電二極體陣列加以接收,並通過光電效應轉換成模擬電流信號。通過這種光域處理,可以極大地減小數據維度,從而降低光電轉換的規模。

其中,每一個光電二極體所產生的光電流,會根據電網絡的權重參數流入相應的計算結點之中,並基於基爾霍夫定律實現模擬域的電計算。

這時,通過光電二極體這一超高速、低功耗的光電接口,光網絡和電網絡完成連接,讓光電融合計算系統實現直接、高效的集成。

那麼,在自動駕駛等視覺任務中,ACCEL 晶片的泛化能力如何?泛化能力,通常指一個模型對於新樣本、新場景的適應能力。

ACCEL 不僅在不同測試集上表現出很好的泛化能力,在不同工況下也具備優秀的泛化性。比如,同樣是用於交通場景的計算,如果出現極弱光、超高幀率等場景,相比單獨光計算或電計算,ACCEL 晶片在抗噪聲訓練算法之下表現出極好的魯棒性。

此外,現有光計算系統,常常針對特定的專一任務而設計,這導致其應用範圍受到限制。而 ACCEL 晶片融合光域計算和模擬域電計算,可以輕鬆實現重構。

當針對特定任務來設計並製備出來 ACCEL 晶片之後,藉助電信號域的易編程性,ACCEL 晶片能夠重新訓練電網絡的參數,從而適用於不同的任務,而幾乎不影響最終準確率。

圖 | 光電計算晶片 ACCEL 在不同任務和光強下的性能(來源:Nature)

光晶片,有何不同?

相比傳統電子晶片,光晶片使用光子來完成相關計算。與傳統的電子晶片相比,它並不是用電作為載體來完成數位訊號處理,而是通過光在傳播和相互作用之中的信息變化來進行計算。

比如在物理學史上著名的楊氏雙縫實驗中,相干光經過帶有兩條狹縫的擋板之後,會在後面的探測板上得到明暗相間的條紋。如果把相干平行光看做輸入,探測板上的圖案看做輸出,上述實驗就可以簡單抽象理解為:擋板對輸入光進行了調控,並通過光在擋板和探測面之間的傳播,實現了對於輸入光信號的處理。

對於現有光計算來說,許多思想都和上述過程類似。即通過精細調控光傳播的過程,改變接收位置處的光相位、光振幅、光偏振等物理屬性,從而實現光域的計算和信號處理。

光計算晶片的優勢在於光子的高速度、低耗能和大帶寬,這能為大規模並行計算和高速數據傳輸提供極具潛力的解決方案。

與此同時,在大量視覺任務及日常生活場景中,原始信號本身就是光信號。使用傳統解決方案,需要在傳感器拍攝之後,再使用電子晶片進行處理,這會增加光電轉換、存儲、以及計算的步驟。相比之下,利用光直接進行計算,是一種更自然、更高效的方式。

光晶片,有何不足?

近年來,面對摩爾定律增速放緩和失效危機,光計算作為一種新型計算範式,得到了廣泛關注並被寄予厚望。相比目前的電子器件,通過在光域之中直接對原始視覺信息進行處理,讓光計算在速度和能效上得以提高几個數量級。然而,目前的光計算系統面臨著非線性實現複雜、光電接口耗能等國際難題,導致不少科研工作評估的高性能優勢難以落地並實現應用。

基於此,該團隊便將課題初衷瞄準攻克當前光計算領域存在的瓶頸,讓光計算的超高性能從實驗室走到日常生活。

光晶片,如何完善?

為解決上述國際難題,本次研究首次提出了深度融合的光計算和模擬電計算,建立起一種全模擬的晶片計算框架。

為了克服現有光計算系統的痛點,研究人員把目光轉向同為模擬計算的電域模擬計算:它藉助基爾霍夫電壓電流定律、電荷守恆定律等基本的物理規律實現計算。而光信號通過光電效應轉換成模擬電信號時,存在著本徵的非線性關係。

基於此,他們提出了新的計算範式:ACCEL 將用於大規模提取視覺特徵的衍射神經網絡和基於基爾霍夫定律的純模擬電子計算,集成在同一枚晶片框架內。藉此繞過模擬數字轉換器速度、精度與功耗相互制約的物理瓶頸,從而在一枚晶片之內就能突破大規模計算單元集成、高效非線性、高速光電接口等三大關鍵瓶頸。在保證高任務性能的同時,還實現超高的計算能效和計算速度。

圖 | ACCEL 有望用於電子設備超低功耗人臉喚醒示意動圖(來源:清華大學)

一場線上會議,誕生一篇Nature 論文

在本次成果的對應論文中,通訊作者多達四位,他們來自不同的團隊。這要從 2020 年的一次線上會議說起,當時清華大學電子系喬飛副研究員聽取了該校吳嘉敏助理教授關於光計算的報告。

之後,兩者所在課題組開展的討論中,便萌生了這樣一個想法:既然同為模擬計算領域,那麼是否可以通過深度合作,共同解決領域內的瓶頸問題?

很快他們定下了這項課題。隨後,先是開展理論建模和仿真驗證,針對衍射光網絡的計算模型、光電效應的非線性模型模擬、以及電網絡的計算模型,開展了物理推導、物理仿真和晶片設計。

後來在實際流片後和晶片實測中,為了克服實際系統部署中所存在的誤差累積和噪聲,他們對這些非理想因素進行建模,藉此開發出一套系統性修正算法,以此來應對弱光噪聲、對齊、加工誤差等非理想因素。藉此實現了與仿真結果符合度較高的實驗準確率。

此後,他們又對晶片系統級的能效和算力加以評估。實測結果顯示,ACCEL 晶片在系統級算力和能效上,分別比目前高性能的商用工業級 GPU 高出千餘倍和百萬餘倍。

為了確保如此驚人數據的可靠性,研究人員做了尤為紮實的工作來進行實測和驗證。

他們不僅實測了 ACCEL 晶片端到端系統級的耗能數據和時延數據,還進一步提出了等效算力的概念。直接從準確率的角度來衡量計算效果,從而能夠摒除不同物理建模方式的影響。

真正做到即便在複雜數據集之上,也能達到和數字卷積神經網絡相同的準確率,同時將端到端系統級的耗時降低千倍、耗能降低百萬倍。打消了業內人士對光計算算力「有效性」的顧慮。

最終,相關論文以《用於高速視覺任務的全模擬光電子晶片》(All-analog photoelectronic chip for high-speed vision tasks)為題發在 Nature[1],博士生陳一彤、博士生麥麥提·那扎買提、許晗博士是共同一作,清華大學戴瓊海院士、方璐副教授、喬飛副研究員、吳嘉敏助理教授擔任共同通訊作者。

圖 | 相關論文(來源:Nature)

後續,他們將研究規模更大、算力更強的模擬域光電融合系統,這需要在算法層面和硬體層面,開展更高層次的聯合設計優化。

另外,以大語言模型為基礎,基於新型 AI 算法的高效硬體計算平台,也是非常值得研究的方向之一。

毋容置疑,硬體算力的提升是引領當今 AI 浪潮的重要引擎之一。研究人員認為,基於全模擬光電融合計算的框架,有著非常好的應用前景。

要想進一步拓展應用範圍,就需要構建從軟體到硬體的生態環境。而一個完善的生態環境,則需要由學界和業界協同打造,因此他們非常期待業界可以在該方向上部署相關業務,讓前沿學術成果能夠加速轉化成為產品,完成高效計算平台範式的進一步跨越。

參考資料:

1.Chen, Y. et al. All-analog photoelectronic chip for high-speed vision tasks. Nature https://doi.org/10.1038/s41586-023-06558-8 (2023).

文章來源: https://twgreatdaily.com/zh-tw/55688c3b125af3e29d91f805526a31e7.html