讓x86處理器也有AI智能,解讀AMD Ryzen AI引擎

2023-11-13     微型計算機雜誌

原標題:讓x86處理器也有AI智能,解讀AMD Ryzen AI引擎

在移動處理器市場,AMD銳龍系列處理器憑藉更高的性能功耗比、更出色的性能和更好的性價比,深受不少玩家的喜愛。特別是AMD今年推出的銳龍7040系列移動處理器,它集高能效、高性能和4nm先進工藝於一身,受到用戶廣泛青睞。實際上,銳龍7040系列移動處理器還有一個「大殺器」—Ryzen AI引擎。那麼,AMD Ryzen AI引擎究竟是什麼?它有什麼獨特之處呢?今天我們就來解讀一下。

來自賽靈思的AI引擎:AMD為什麼要集成AI引擎?

AMD在AI產業布局已久,在雲端,無論是EPYC系列處理器,還是GPU系列產品,這些面向企業級用戶的產品都得到了AI產業的廣泛認可。而在消費級市場,雖然多年以來AI已經在手機等移動終端設備上應用的紅紅火火,但是在x86領域,AI應用方面的進展似乎並不太多。事情的轉變發生在2020年,AMD在這一年宣布以大約500億美元的價格收購當時FPGA行業的巨頭賽靈思,也正是這次收購,為AMD在x86領域帶來AI創新的能力和機會。

AMD收購賽靈思後,不但擁有了FPGA產業,還快速切入了AI賽道。

在完成收購賽靈思不久之後,AMD就成功地將賽靈思的AI模塊集成到銳龍處理器中,也就是我們今天看到的銳龍7040系列移動處理器中的Ryzen AI引擎。這樣的改變,其實和AMD對AI行業發展的思考有關。AMD董事會主席兼CEO蘇姿豐博士就表示,AI是未來十年最重要的事情,可以提高生產力並帶來更多的優勢。AMD公司副總裁David McAfee也提到,AI將成為其未來處理器發展的重要組成部分。由於AI將極大地提高人們的工作效率和生產力,AMD希望其產品能涵蓋從邊緣AI到中間市場,再到雲端AI的一切,這就意味著AMD要為所有市場的AI應用和AI客戶提供對應的產品。David McAfee認為,未來無論你是遊戲玩家、創作者還是兩者兼而有之,AI都將在未來幾年不斷深入各種不同的負載,重塑或者改變這些行業現有的生態。

AMD將賽靈思的AI模塊集成到銳龍處理器中。

David McAfee還帶來了一些案例,比如遊戲中用於更智能NPC的生成式AI,創作者利用AI來自動化工作流程並降低複雜的開發包的使用門檻,包括但不限於建模、Adobe套件和編程操作等,生成式AI的加入都將極大地改變整個工作流程。近日,微軟宣布將全面擁抱AI,更為緊密地結合AI和作業系統,比如微軟的Copilot(副駕駛)系統將帶來作業系統使用上的變革。微軟甚至還將AI視為和滑鼠被發明一樣等級的重要技術發明或技術進展。這雖然令人驚訝,但並不意外。

微軟通過Copilot大幅度加強了AI在作業系統中的地位

看起來微軟非常激進,不過這也說明隨著時間的推移,人們才能持續看到AI如何影響所有人的工作流程。AI無疑具有極為驚人的潛能,將改變我們和數字空間交互的方式,並為每個人創造一種單獨、定製化的個人數字助手,從而大大改變我們的使用體驗。

正是因為AI如此的重要,AMD才下決心為自己的處理器加入AI相關的加速引擎,使得人們在執行相關任務時擁有更好的體驗。筆記本平台擁有專用的AI引擎之後,將帶來三個方面的優勢。一是推理計算不再需要在雲端完成後才給出結果,延遲更低,體驗效果會更好。二是數據安全方面,數據不用上傳至雲端,而是在本地完成操作,因此數據泄露的風險更低。三是未來雲資源將越來越昂貴,AMD認為本地資源將更為便宜好用,性價比更高。

AMD Ryzen AI引擎擁有三個獨特的優勢

AMD在銳龍7040系列處理器中集成Ryzen AI引擎後帶來了諸多應用方面的優勢

在集成Ryzen AI引擎之後,AMD銳龍系列移動處理器因此擁有諸多優勢。首先是它是現有市場上唯一一個擁有專用AI引擎的x86處理器系列產品,這將很大程度上保證AMD處理器的競爭力。其次微軟在即將到來的作業系統中將加入更多AI方面的應用,AMD銳龍系列移動處理器將獲得先機。另外,AI引擎的使用將帶來用戶體驗的持續提升,不斷加入的各類AI應用將帶給用戶更多全新、獨特的體驗。

Ryzen AI如何運作?AMD統一AI棧 支持XDNA和CPU

由於AI已經成為AMD在處理器上的戰略級功能,因此AMD也在不遺餘力地推廣AI相關的內容,並給出了Ryzen AI引擎的一些技術細節,我們一起來看看。

首先是AI相關的性能。AMD在代號為Phoenix的銳龍7040系列處理器中集成了Ryzen AI引擎。AMD宣稱Ryzen AI引擎可以執行最多4個實時的AI工作流,由於採用專用的硬體模塊,所以還能帶來更好的效率。

AMD解釋AI計算在專用單元上運行和傳統CPU上運行的差異。

AMD進一步解釋,Ryzen AI引擎處理AI相關任務是採用神經網絡進行計算的,和傳統計算在架構和模式上都存在巨大的差異。我們知道人工智慧最初是由傳統的硬編碼算法創造,並由人類編程完成,而現代的人工智慧大多基於神經網絡,數據以不同的權重從一個神經元「流轉」至另一個神經元,並通過機器學習進行訓練,所以採用神經網絡進行計算是更現代、更高效的選擇。

目前AMD在Ryzen AI引擎中使用的硬體部分是賽靈思XDNA架構的AI加速模塊,這個加速模塊的特點在於,其整體採用Mesh架構完成,所有的結構單元都互聯且採用非阻塞分布式架構,存儲單元和計算單元緊密結合,因此擁有更大的帶寬並且所需容量更低。從AMD給出的示意圖來看,XDNA架構最大的特點是AI引擎的計算部分和存儲部分是綁定在一起的,然後掛接到Mesh網絡上。這種去中心化的設計避開了傳統計算架構的存儲瓶頸,使得神經網絡計算能夠以更高的效率運行。

AMD介紹了XDNA架構在計算模式上的優化

相比之下,AMD對比了傳統的基於緩存的計算架構。數據通過DRAM、L2緩存、L1緩存後再進入不同計算模塊的不同核心中,從宏觀上來說,這是一個固定的、共享的互聯架構,內存帶寬和速率將成為整個計算的瓶頸,數據帶寬和延遲將影響整個計算的效率。

AMD還介紹了XDNA架構在計算模式上的優化。由於神經網絡需要一層一層的計算,整體路徑和方向在計算中可能都是無序的,這就意味著計算架構也必須有相應的優化。XDNA架構在互聯模型上採用了Mesh的全向互聯架構,因此可以進行自適應配置,實現自適應互聯,比如案例中L1、L2、L3、L4等針對的是神經網絡的每一層計算,在自適應互聯中就可以實現計算根據硬體情況的自適應化,從而實現更高的效率。

AMD介紹Ryzen AI引擎的基本架構和技術特性

在相關計算能力方面,AMD給出的數據顯示,XDNA核心目前可以支持CNN、RNN和LSTM相關的模型,支持INT8、16、32和BF16格式的數據,支持細粒度時鐘門控技術以實現更出色的能效控制,並支持4個並發流同時進行。AMD宣稱Ryzen AI引擎的算力高達10TOPS。

在基本架構方面,AMD給出的示意圖顯示XDNA支持最多4個DDR內存控制器,並通過數據總線連接至DMA和NOC。XDNA的內部會被分成一個個區塊,包括20個AIE區塊和5個內存區塊,所有的區塊都掛接在Mesh總線上形成內部的共享、互聯、非阻塞架構。

通過AMD Ryzen AI實時處理,視頻人物背景被虛化。

AMD給出了在Windows 11中使用Ryzen AI引擎的相關案例。比如在Windows相機中,目前作業系統可以調用Ryzen AI引擎來識別前景、人物和背景,並進行背景虛化、自動取景和眼神交流。AMD只是給出了一個非常簡單的案例,未來微軟和更多其他應用還將會進一步調用AMD Ryzen AI引擎,尤其是微軟在引入了Copilot之後。

AMD Ryzen AI引擎的軟體堆棧情況

AMD還提到了有關AI平台軟體方面的內容。剛發布時,AMD尚未完成有關XDNA架構在軟體方面的全部支持工作,接口只支持CPU和有限的XDNA。不過AMD已經構建完成了從應用到硬體的全部層:從應用開始,分別是微軟或者早期開發人員的一些應用服務,採用ONNX格式和TensorFlow模型,構建在AMD統一AI棧上,支持CPU和XDNA進行計算。2023年夏天,AMD通過臨時版本增加了對運行在IPU上的新操作符的支持,並提供了對ONNX、PyTorch和TensorFlow模型的量化支持。AMD還承諾,作為在各個層面簡化人工智慧戰略的一部分,2023年晚些時候,將發布更多的工具鏈、庫和指南,以簡化人工智慧開發,從訓練模型到在由Ryzen AI驅動的系統上對其進行本地部署。另外,AMD還計劃增加對Generative AI模型的支持。

硬體支持:大部分AMD銳龍7040系列移動處理器具備Ryzen AI引擎

最後我們再來看看AMD Ryzen AI引擎的硬體支持情況。根據AMD的官方數據,目前大部分銳龍7040系列處理器都已經配備Ryzen AI引擎。具體說銳龍9 7940HS/H、銳龍7 7840HS/H、銳龍5 7640HS/H等6款處理器都支持Ryzen AI,而銳龍7040U系列只有銳龍7 7840U和銳龍5 7640U兩款處理器支持Ryzen AI。另外,聯想和AMD合作定製了一款銳龍7 7840S處理器,這款處理器的整體規格和銳龍7 7840HS/H相當,它也支持Ryzen AI。其他的銳龍5 7540U、銳龍5 7545U、銳龍3 7440U等處理器則不支持Ryzen AI引擎。

文章來源: https://twgreatdaily.com/zh-mo/b6e2c8b970703f61af9057f4ff81a4be.html