AI性能6年暴漲100倍,CPU趕超蘋果英特爾?高通最強晶片秘籍公布

2023-10-26     芯東西

原標題:AI性能6年暴漲100倍,CPU趕超蘋果英特爾?高通最強晶片秘籍公布

芯東西(公眾號:aichip001)

作者 | 心緣

編輯 | 漠影

芯東西10月25日毛伊島報道(北京時間10月26日),昨日,高通推出旗艦移動平台第三代驍龍8、旗艦PC平台驍龍X Elite、旗艦音頻平台第一代S7/S7 Pro、Snapdragon Seamless跨平台技術(高通甩出最強晶片三件套!手機跑100億參數大模型,PC晶片逆襲蘋果英特爾)。

在今日舉行的2023驍龍峰會第二天主題演講期間,高通多位高管輪番上陣,進行了超過3.5小時的密集技術乾貨輸出,詳細解讀了3款旗艦晶片新品實現顯著性能提升背後的核心技術。

榮耀CEO趙明現場宣布榮耀Magic6搭載70億參數的端側AI大模型技術,並宣布榮耀將加入驍龍X Elite大家庭,設計基於Arm的PC。

為了展示第三代驍龍8的生成式AI實力,高通在驍龍峰會現場演示了終端側運行語音訂票、語音對話AI虛擬助手、AI文生圖。

不過在演示用百川智能大語言模型進行中文對話時意外翻了車——沒有響應。可能是考慮演講時間把控,該演示沒有重啟,而是直接被跳過了。

一、PC晶片性能逆襲蘋果英特爾,驍龍X Elite憑什麼?

高通將驍龍X Elite稱作是同級別Windows處理器中「最強大、最智能、最高效」的處理器。搭載驍龍X Elite的PC預計將於2024年中面市。

驍龍X Elite採用4nm工藝技術,搭載5G基帶晶片驍龍X65和Fast Connect 7800 Wi-Fi/藍牙晶片,採用高通最先進的CPU內存架構設計、LPDDR5X內存,最大內存帶寬136GB/s,總緩存為42MB,低功耗支持PC一次充電管幾天。

從高通曬出的好幾張測試數據來看,高通稱驍龍X Elite將「改變遊戲規則」,還真不是在瞎吹牛。

同樣功耗水平下,驍龍X Elite的CPU峰值性能達到14核x86處理器英特爾酷睿i7-13800H的2倍;同等峰值性能下,其功耗比i7-13800H競品少65%。

比單線程,相同峰值性能下,驍龍X Elite的單線程CPU所用的功耗比Arm處理器蘋果M2 Max功耗少30%,比x86處理器英特爾酷睿i9-13980HX功耗少70%。

比多線程時,競品對象換成了M2,相同功耗水平下,其峰值多線程CPU性能比蘋果M2高出50%。這麼一看估計是多線程性能還沒打過M2 Max。

該晶片採用定製的集成高通Oryon CPU,有12個性能核,3 Cluster設計,主頻最高達3.8GHz,雙核boost頻率可達4.3GHz,是首個主頻達到4.0GHz的Arm架構PC處理器,能支持視頻轉碼、大數據集分析、代碼編譯等功能,同時可提供超長電池續航。

再來看集成的Adreno GPU,性能提升也很可觀,在測試數據中做到「拳打」英特爾酷睿i7-13800H,「腳踢」AMD Ryzen 9 9740HS。

其GPU算力可達4.6TFLOPS,支持高達4K@120Hz的內部顯示屏、HDR10、3個UHD超高清或雙5K外部顯示屏。

驍龍X Elite還具備在終端側運行大模型的能力,其AI處理能力是競品的4.5倍,例如面向Windows 11 PC的終端側聊天助手(基於70億Llama 2大語言模型)可實現每秒處理30個token。

再比如,在運行經典的文生圖模型Stable Diffusion 1.5時,驍龍X Elite的圖像生成速度達到英特爾競品的2.7倍;在跑優化版Stable Diffusion時,其圖像生成快到用時不到1秒,速度達到競品的20倍。

UL Procyon AI推理基準測試顯示,驍龍X Elite的性能比x86處理器英特爾酷睿i7-13800H和AMD Ryzen-9 7940HS快10倍,讓用戶在使用背景虛化、降噪、使用AI濾鏡等視頻通話功能時能夠享受到更無縫的體驗。

這主要得益於負責加速AI計算的高通Hexagon NPU,針對生成式AI進行了架構優化,引入微Tile推理技術,處理大矩陣速度提升到以前的2.5倍,大共享內存也翻倍提升。Hexagon NPU最高可實現45TOPS INT4的AI算力,相較2017年時提升100倍。

升級的高通AI引擎,性能可達75TOPS,支持在PC本地運行超過130億個參數的生成式AI模型。

驍龍X Elite是首個集成常感知ISP的PC處理器。其內置的高通傳感器中樞(Sensing Hub)是一個常在線的低功耗AI子系統,相比前代產品,其AI性能提升達到2倍,內存提升50%。

高通傳感器中樞集成了1個常感知ISP、2個微NPU、1個DSP和內存,可將敏感數據保留在電腦上,增強安全性、登錄體驗和隱私,並具有在睡眠模式下喚醒設備的能力。

還有軟體的功勞,高通AI軟體棧讓基於驍龍X Elite開發工作更加快捷輕鬆。

此外,驍龍X Elite支持5G和Wi-Fi 7快速連接、沉浸式無損音頻、更先進的攝像頭ISP,並提供智能安全功能,從芯到雲保護PC,包括高通安全處理單元運行的微軟Pluton解決方案、全內存加密、微軟安全核心PC支持、對生物識別信息等敏感信息零信任保護等。

據高通分享,94%的商業領導者表明AI已經提升他們的工作生產力,約50%的IT決策者準備基於AI性能來更換PC品牌。

接著,高通曬出了一張驍龍計算生態系統圖。

驍龍X Elite的編譯速度比12核英特爾酷睿i7-1360P快25%。

下圖是高通合作的一些領先PC OEM廠商。

二、第三代驍龍8:CPU核心配置變化,現場演示多項生成式AI功能

高通將第三代驍龍8稱作是「終端側智能的集大成者」。該旗艦移動晶片採用4nm工藝,搭載業界最快的設備端內存LPDDR5X(@4.8GHz)、集成AI張量硬體加速器的5G基帶晶片驍龍X75、Fast Connect 7800 Wi-Fi/藍牙晶片。

與前代相比,CPU性能提升30%,能效提升20%。這一提升與核心配置的變化有關,除了最高頻率提升外,比上一代多了1個性能核、少了1個能效核。

第三代驍龍8的Kryo CPU基於64位Arm架構,採用「1+5+2」核心配置,包含1個最高頻率達3.3GHz的主核Cortex-X4、5個最高頻率達3.2GHz的性能核、2個最高頻率達2.3GHz的能效核。

對比之下,第二代驍龍8採用的是「1+4+3」核心配置,包含1個最高頻率達3.36GHz的Cortex-X3、4個最高頻率達2.8GHz的性能核、3個最高頻率達2.0GHz的能效核。

實現最優性能,得益於異構計算的加持。

不同硬體組合搭配算法,能夠支撐音頻/語音、語音助手、攝影/視頻、生成式AI等不同用例。

1、生成式AI:讓手機本地暢跑百億參數大模型

高通現場演示了第三代驍龍8在終端側運行語音訂票、語音對話AI虛擬助手、Stable Diffusion文生圖等AI功能。

針對生成式AI,第三代驍龍8率先支持多模態通用AI模型,現已支持運行超100億個參數的大模型,跑大語言模型每秒可生成超過20個Token,用Stable Diffusion模型生成1張圖像快到0.6秒。

與前代平台相比,Hexagon NPU的AI性能提升98%、能效提升40%,主要是通過優化主頻、提高微Tile推理速度等方式實現。

Hexagon NPU架構如圖所示,從左到右依次有一個加速器專用電源軌、升級的微Tile推理、升級的微架構、更高帶寬的張量(Tensor)加速單元、更高時鐘速度的標量(Scalar)和向量(Vector)處理單元,以及2倍帶寬的大共享內存,這些共同支撐起終端側的大模型推理。

高通AI引擎由Hexagon NPU、Adreno GPU、傳感器中樞、Kryo CPU與內存共同組成。

高通傳感器中樞集成了2個常感知ISP、2個微NPU、1個DSP和內存,可以安全使用數據,使AI虛擬助手為用戶提供更具個性化的響應。相比前代產品,其AI性能提升達到3.5倍,內存提升30%。

相比雲端,終端側在運行大語言模型時能做到立即響應,沒有延遲,有助於提高用戶體驗。

高通AI軟體棧為第三代驍龍8和驍龍X Elite全面優化,已發布超過20個模型,並增加對 PyTorch ExecuTorch的支持。

2、影像:AI深度參與優化,隨手一拍就是大片

升級的Hexagon NPU除了能跑生成式AI模型外,還能與認知ISP、傳感器等搭配,讓第三代驍龍8能夠支持更好的攝影與影像編輯功能,包括用AI填充背景的照片擴展、視頻對象擦除、AI背景生成等。

比如,拍攝時長30秒、60fps幀率的視頻,只需輕點一下,虹軟視頻對象擦除功能就能去除不想要的背景或人物,讓視頻摳像變得輕而易舉。

再比如,高通與Visionary AI合作用AI優化夜景視頻拍攝,能在黑暗環境中拍攝出畫面清晰的視頻。

第三代驍龍8是第一個引入杜比視界HDR拍攝技術的移動平台,能拍攝和現實更豐富的色彩與陰影範圍。

去年第二代驍龍8首創的認知ISP圖像處理器再度上陣,包含3個18位ISP,做到最多12層的實時圖像語義分割。

其通過將畫面中的人臉、皮膚、頭髮、眼睛、建築、樹木等不同對象進行語義分割,然後分別根據每類對象的特性進行調優,從而能實現更加有質感的調優效果。認知ISP與Hexagon NPU直連,因此能做到在拍攝過程實時優化,完成Vloggers視圖的背景替換也不在話下。

還有Vlogger View功能,可將前置和後置攝像頭拍攝的視頻圖層到一個視圖中。它改進的圖像分割技術,能從自拍視頻中刪除背景,讓你看起來就像站在你的後置攝像頭所拍攝背景的前面。

高通要把攝像頭變成強大的手持式圖像傳感器。在優化拍攝視頻景深方面,深度和RGB傳感器能夠進行深度捕捉,用AI節省95%的功耗;通過搭配iToF傳感器能實現1080p30幀深度圖。

高通還與三星合作打造專為驍龍優化的拍照體驗,使用三星2億像素圖像傳感器,三星Zoom Anyplace變焦技術能在不損失圖像質量的情況下對移動物體拍攝4倍特寫。

此外,高通去年與索尼推出兩款新的HDR圖像處理器,如今又打造新的DCG HDR圖像傳感器(Dual Conversion Gain)。首度支持DCG HDR圖像傳感器的第三代驍龍8,能夠拍出更好的照片和進行計算攝影的視頻拍攝。

第三代驍龍8支持HDR圖像傳感器的3個視頻拍攝,通過針對性微調,可在任意HDR模式之間進行無縫切換,通過傳感器間的背景操作節省60%的能耗。

一些高通合作夥伴正優化傳感器來監測各種信息。比如普諾飛思(Prophesee)的事件視覺傳感器能讓抓拍動態畫面時不再拍出糊圖,意法半導體更小、更準確的煙霧和空氣品質監測裝置,2個常感知攝像頭支持掃碼、人臉識別等。

創邁思(trinamiX)與高通合作推出首款集成在智慧型手機參考設計中的移動近紅外光譜儀,用於分子生物標誌物測定,可無創式監測皮膚健康、分析食物營養等。

3、遊戲:支持實時光追,撐起240fps幀率

第三代驍龍8的Adreno GPU性能提升25%,能效提升25%,光追性能提高40%。

該晶片支持全新Snapdragon Elite Gaming特性,是世界上首個支持暢玩240fps遊戲的移動平台,通過採用Adreno幀運動引擎2.0(AEME 2.0)的幀生成算法在保持功耗不變的情況下實現幀率翻倍。

它藉助驍龍遊戲超分技術實現對8K超解析度的支持,同時也是第一個能夠以全交互幀率運行虛幻引擎5 Lumen實時全局照明系統的移動處理器,讓手游的光線及照明效果更為栩栩如生。網易武俠手游《逆水寒》將支持這些技術。

三、旗艦音頻晶片AI性能躍升100倍,耳機遠隔一棟樓也能穩定連接

高通Snapdragon Sound驍龍暢聽技術具有玩遊戲聲音幾乎無延遲、無損和高解析度音樂流、在複雜通信環境中穩定連接、支持藍牙經典和LE音頻等特點。該技術了通過日本音頻協會Hi·Res Audio Wireless標準的正式認證。

驍龍暢聽技術已應用於最新的第三代驍龍8和驍龍X Elite,當與採用第一代高通S7或S7 Pro音頻平台的終端配合使用時,用戶將享受到更好的音頻體驗。

高通新推出的第一代S7及S7 Pro音頻平台,該平台將DSP性能提升至前代平台第二代S5的3倍,AI性能是前代平台的近100倍,計算性能提升到前代平台的6倍,存儲性能提升前代平台的3倍。搭載該音頻平台的首批終端明年問世。

其用於音頻管理的專用核心包括第四代高通自適應主動降噪(ANC)、聽力損失補償、通透、人聲放大、噪聲管理等。當耳機鬆動,或者環境里的噪音突然發生變化,ANC能自動無縫切換降噪模式或通透模式,改善開放式環境的通話效果。

該音頻平台內置專用的高通微NPU AI引擎、多個DSP內核和傳感器中樞。端側AI技術與音頻技術協同,能以超低功耗在設備端進一步優化聲音體驗,而且不犧牲續航時間。

第一代S7和S7 Pro主要區別在於通信連接範圍和質量上。

第一代S7 Pro(架構圖如下)是首款支持高通擴展個人區域網(XPAN)技術和超低功耗Wi-Fi連接的音頻平台,支持藍牙5.4和Auracast廣播音頻,並能從藍牙無縫過渡到Wi-Fi,確保連接穩定。

XPAN能實現遠超目前僅利用藍牙所實現的連接距離,與驍龍暢聽技術搭配使用,哪怕你的手機距離遠到在某棟大樓的另一側,依然能保持耳機與手機之間不間斷的無損音頻連接。

該音頻平台可通過Wi-Fi提供高達24位192kHz的多通道無損音樂串流,並能夠在不增加功耗的情形下通過藍牙和Wi-Fi提供10小時不受限96kHz無損音樂串流。

在Seamless技術加持下,耳機能夠及時找到並無縫切換至其他終端。

比如,當用戶正在用耳機連接手機聽音樂,這時筆記本電腦突然接入一個視頻電話,耳機就能立刻切換到連接電腦,等通話完又自動切換回連接手機,繼續聽音樂。

四、XR晶片:用端側AI增強視聽感知

元宇宙與空間計算同樣是高通著力投入的方向。

高通在今年9月底推出兩款全新空間計算平台——第二代驍龍XR2和第一代驍龍AR1,以支持打造新一代混合現實(MR)、虛擬現實(VR)和增強現實(AR)設備。

第一代驍龍AR1已經出貨,用在Meta最新智能眼鏡產品中。搭載AR1的智能眼鏡可用於拍照和拍視頻,並有強大AI助手的助力。AI可用於增強感知能力,比如幫助讀菜單,或是實時翻譯對話。

LG、OPPO、NTT QonoQ Devices、雷鳥創新、夏普都使用了第一代驍龍AR1。高通還與上下游廠商合作打造了基於第一代驍龍AR1的智能眼鏡參考平台,會有不同造型設計以供參考。

在空間計算平台中,AI同樣是重要基礎。高通也在探索智慧型手機和AR眼鏡的結合,在終端側運行生成式AI應用。下圖是高通XR開發者平台Snapdragon spaces的合作夥伴列表。

五、榮耀明年推出Arm版PC,Magic6本地能跑70億參數大模型

在今天的驍龍峰會上,榮耀CEO趙明現場分享了與高通的合作成果,並曬出榮耀在摺疊屏手機、終端側運行大模型、跨設備協同等方面的實力。

他首先展示了厚度僅8.6mm、重量僅214g的摺疊屏手機Magic V Purse。通過簡短手勢操作,消費者就可以將這部摺疊屏手機當成兩個手機用,實現「平行空間」,可以在第一空間、第二空間分別登陸帳號,用兩個帳號玩同一款遊戲,乃至通過雙屏實現自己跟自己對打。

趙明也談及終端側運行大模型的進展,認為這需要做到足夠的資源、內存、算力、電池續航、數據隱私保護之間的平衡,並確保AI戰略認識到目前的限制並提供具體的解決方案。現場演示了通過自然語言對話在榮耀手機上使用文生視頻模型生成一段孩子跳舞、微笑的視頻。

趙明宣布,榮耀Magic6將支持終端側運行擁有70億參數的大模型。他說這是為數不多的廠商所能做到的能力。

Magic6支持用目光隔空打開郵件,以及跨終端設備(手機、筆記本電腦、平板電腦等)、跨作業系統(Windows、安卓等)的無縫連接。例如,筆記本電腦可以直接調取手機相冊里的圖片,手機攝像頭可以變成筆記本電腦內置能力的一部分,安卓遊戲可以直接從手機螢幕挪到筆記本電腦螢幕上接著玩,用同一組鍵盤和滑鼠可以交互操控不同設備。

趙明還宣布,榮耀將加入驍龍X Elite大家庭,設計基於Arm的PC,明年推出相關產品,交付優質的用戶體驗。

結語:終端生成式AI革命的序幕剛剛拉開

在兩天的驍龍峰會主題演講中,AI技術成為高通所有最新晶片產品線的主角。正如高通總裁兼CEO安蒙所言,進入AI時代,終端側生成式AI對於打造強大、快速、個性化、高效、安全和高度優化的體驗至關重要。

端側生成式AI革命的序幕才剛剛拉開,而高通驍龍正沖在前排。隨著搭載第三代驍龍8、驍龍X Elite的手機和PC進入千家萬戶,更豐富的生成式AI用例向邊緣側和終端側遷移將是大勢所趨。

文章來源: https://twgreatdaily.com/zh-cn/313cca5b8b159302e3a21819ff917f03.html