破舊立新,聯發科天璣9300的「全大核」成了旗艦芯新方向

2023-11-06     芯東西

原標題:破舊立新,聯發科天璣9300的「全大核」成了旗艦芯新方向

芯東西(公眾號:aichip001)

作者 | 雲鵬

編輯 | 漠影

近年來,安卓旗艦晶片性能的「突飛猛進」,給人留下了深刻印象。

聯發科和高通兩大移動晶片巨頭的旗艦手機晶片,其GPU峰值性能均已顯著超過了蘋果同期的A系列晶片,CPU的多核性能也成功實現了逆襲。

今年蘋果A17 Pro的性能提升不及預期,產業和消費者們的目光再次聚焦在了聯發科和高通身上。

最近兩大晶片巨頭接連發布旗艦晶片新品,必然將引起移動晶片領域的又一次旗艦「芯皇之戰」。

為何時至今日,我們仍然如此關注手機晶片性能的提升?實際上,這與手機性能需求依然持續高漲的行業現狀密不可分。

如今高負載移動應用正加速流行普及,不少大型應用的實際負載都能給晶片造成不小的壓力,與此同時,智慧型手機多任務並行的需求越來越高,手機應對的場景更加複雜,手機需要具備的功能也更加多樣。

更重要的是,AI大模型熱潮的湧起,既讓廠商們看到了端側AI應用的巨大潛力,也同樣讓廠商們看到了AI對晶片性能、能效,甚至是架構設計層面的更高要求。

如何做出性能更強、功耗更低的晶片,如何從更深層次找到手機核心架構的更優解,成為更關鍵的命題,手機晶片設計仍需要更多技術創新和突破。

在這樣的大背景下,全球手機晶片「一哥」聯發科正式亮出了天璣9300旗艦芯大招,並且直接從架構層面來了一次「顛覆式創新」,破天荒地採用了全大核設計,屬於行業首次。

晶片發布之際,芯東西與聯發科相關高管和技術負責人進行了深入交流,天璣9300的全大核設計,不僅帶來了性能和能效比方面的顯著提升,也可以說直接引領了手機晶片發展的下一個「新紀元」。

天璣9300背後藏著哪些硬核「黑科技」?性能之外,聯發科在AI、遊戲、影像等領域又放出哪些大招?天璣9300背後還有諸多值得深扒的技術和研發細節。

一、全大核架構打破常規思路,性能功耗兼得,三年磨一劍解決底層技術難題

歷代聯發科天璣旗艦芯的發布,都會給移動晶片產業帶來一些新的風向,這次天璣9300在晶片架構層面的突破性設計,是最為搶眼的,也是對產業影響最為深遠的。

相比此前通常單獨使用Cortex-X系列超大核,這次聯發科直接在天璣9300的CPU中放入了4顆Cortex-X4,其最高頻率為3.25GHz,與4顆主頻為2.0GHz的Cortex-A720大核共同組成了「4+4」的架構,與以往的「1+4+3」或「1+3+4」等傳統架構有著本質上的區別。

根據官方實驗室數據,這代CPU的峰值性能相較上代提升了40%,在這樣的性能提升基礎上,功耗還節省了33%,可以說,這種「全大核」架構在性能和能效方面都表現較為亮眼。

對於消費者來說,這些提升最直觀的反映就是應用運行更流暢,同時整機發熱更低、續航時間更長,用戶體驗有了明顯改觀。

根據實驗室實測數據,天璣9300在Geekbench 6中的CPU多核性能跑分在7500-8000分左右,已經顯著超越了今年蘋果發布的A17 Pro以及高通最近發布的驍龍8 Gen3。

其安兔兔跑分也進一步衝破了213萬分,刷新了安卓端的紀錄。

可以看到,在多大核協同之下,CPU的多核性能有著非常直觀的提升,效果是立竿見影的。

並且天璣9300的性能升級兼顧了功耗的同步優化,這一點對於移動終端來說更是極為關鍵的。

在日常使用場景中,天璣9300的功耗降低了最高30%,在日常瀏覽、短視頻類應用中功耗也降低了11%左右。

值得一提的是,這種全大核的架構帶來的多線程性能顯著提升,讓手機在多任務處理方面表現有直觀提升,比如當我們同時玩遊戲並進行直播時,遊戲畫面幀率的穩定性以及直播畫面的穩定性都表現更好。

在深入交流中我們了解到,這樣出色表現的背後,全大核的架構設計解決了目前移動晶片設計領域的不少「瓶頸」,在設計思路上頗具開創性。

比較明顯的一點就是全大核架構對於平行運算能力的提升,也就是前文提到的多任務處理能力,這對於電池續航的提升也有直觀作用。

同時,全大核架構可以比較明顯地提升亂序執行的效率,這種全面採用亂序執行的內核設計,目前來看是行業首創。

直觀來看,亂序執行跟以往的順序執行有本質的不同,從結果來看,核心執行同樣的指令,亂序執行可以不用等程序一個一個順序執行完,而是可以亂序同步並行運算,這樣就增加了內核的「休息」時間,縮短內核運算的時間,但在運算時間內,運算效率顯著提升。

在這種亂序執行設計下,應用執行的效率更高,對用戶來說,應用的卡頓現象會更少,還起到省電的效果。

這也是對「大核費電」這種傳統觀念的一種顛覆和轉換,在晶片的晶片尺寸小到一定程度後,由於原理層「漏電」現象的加重,小核並不一定就更省電,相反越快完成任務處理會越省電,這正是大核的強項。

用聯發科的話來說,就是「做的更快、休息的更快、功耗更低」,晶片更高效的處理完任務,「休息」的時間自然也就更長。

這種設計反映在能效比方面,可以讓晶片在同樣功耗下實現更高性能,執行的任務數量更多,同時兼顧終端設備電池的續航。

系統可以識別相對更重要的內容並優先處理,減少系統等待的時間,同時在資源擁擠時,計算需求可以得到更好滿足。

整體來看,全大核設計帶來的優勢是顯而易見的,但為何至今聯發科才第一個將其實現?

實際上,「想到很簡單,做到很困難」,這句話放到晶片設計領域是十分適用的。

在深入交流中我們了解到,為了實現今天看到的全大核設計,聯發科已經在相關領域深耕了三年多,這次的天璣9300也可以說是「三年磨一劍」,背後包含了諸多技術難題的攻克,對於聯發科來說也是一款具有極為重要意義的產品。

全大核架構的落地,涉及硬體設計、軟體設計、系統架構設計等多方面的綜合創新,並且需要找到關鍵的應用場景並進行針對性優化。

正如前文所說,如何把應用的執行需求集中在一起並快速執行完畢,這些都充滿挑戰。

蘋果在移動晶片設計領域一直走在前列,是不少廠商的學習對象,其實蘋果A系列晶片的「小核」也並不「小」,甚至要比安卓端的大核還要更大一點,所以這種全大核的架構並不是「從無到有」。

聯發科核心要做的是真正將這一架構通過自己的技術來實現,並真正能夠在實際應用中取得好的效果,用比較形象地比喻來看,晶片就像一支部隊,而聯發科不僅要打造一支部隊,更要為部隊制定好高效作戰方案和詳細的作戰手冊。

當然,在實際應用中,不同的遊戲和應用的運行,都涉及到調校和適配的問題,因此聯發科必然會與生態合作夥伴共同在這方面進行優化。據了解,一些更為深度的合作都在推進中。

可以看到,通過思路上的創新以及底層技術上的突破,聯發科在手機晶片設計領域找到了一種更高效的破局方式,手機性能提升的瓶頸被進一步打開。這種底層性能的提升也為手機其他各方面體驗的改善打了一個好基礎。

二、抓住AI大模型落地核心痛點,強算力賦能終端生成式AI好體驗

除了在性能方面的突破,聯發科天璣9300作為一顆旗艦晶片,在AI、遊戲、影像、連接等方面也有不少可圈可點的新特性,對於終端用戶體驗的實際提升有著直觀作用。

首先,AI大模型作為如今科技產業發展中最重要的技術焦點,甚至沒有之一,一直受到全球各大科技巨頭的高度關注,各條賽道中的玩家也都在產品和服務中融入AI能力。

在智慧型手機行業中,手機終端廠商以及手機晶片廠商都在積極地將AI大模型落地在手機里,此次聯發科在天璣9300中也重點提升了晶片的AI能力。

在交流中聯發科高管提到,AI能力也是未來智慧型手機晶片提升的最主要方向之一。

此次天璣9300的APU已經疊代至第七代,在性能和能效方面的提升較為顯著,整數運算和浮點運算性能是上一代的2倍,功耗降低了45%。

值得一提的是,聯發科特彆強調了這代APU 790是專門為生成式AI而設計,其內置了硬體級的生成式AI引擎,邊緣AI計算性能和安全性均有提升,同時APU 790專門針對生成式AI中常用的Transformer模型進行了運算元加速,處理速度是上一代的8倍,據稱可以在1秒內完成常見的AI文生圖功能。

另外,針對端側生成式AI應用的關鍵痛點之一——內存占用問題,聯發科研發了混合精度INT4量化技術,結合自研的內存硬體壓縮技術NeuroPilot Compression,提升了內存帶寬的利用效率,同時減少了AI大模型對終端內存的占用,讓手機可以更順暢地跑各類生成式AI應用。

據稱,目前已支持終端運行10億、70億、130億大語言模型,這顆移動晶片最高可運行330億參數的大語言模型。

這樣的成績也不由得令人感嘆,生成式AI落地終端的速度,實際上已遠超人們的想像。

除此之外,天璣9300的APU 790支持生成式AI模型端側「技能擴充」技術——NeuroPilot Fusion,據了解,該技術基於基礎大模型持續在端側進行低秩自適應(LoRA,Low-Rank Adaptation)融合,進而讓基礎大模型的能力更全面,可以快速方便的擴展出終端用戶所需要的各項生成式AI應用和功能,做到 「琴棋書畫」樣樣精通。

其實目前行業中比拼AI模型運行的速度和準確度已經很難拉開較大差距,相比之下,聯發科在落地生成式AI的過程中,更注重落地場景的探索,核心目標就是能把用戶的痛點給解決掉,用AI帶來直觀的體驗改善,將AI用在「刀刃上」。

從生態層面來看,聯發科的AI開發平台NeuroPilot已經支持了Meta的LIama 2、百度的文心一言大模型、百川智能的百川大模型等前沿主流AI大模型,通過提供完整的工具鏈來幫助開發者們在智慧型手機等終端上高效開發和部署多模態生成式AI應用。

據了解,聯發科與vivo、OPPO等頭部終端廠商也均有合作,他們在一起推動AI大模型在智能終端側加速落地。

三、這把遊戲徹底穩了,影像、連接帶來新看點

在GPU方面,這次天璣9300用上了12核的GPU Immortalis-G720,其峰值性能同比提升了46%,並且在相同性能下可以節省40%左右的功耗,可以說在能效比的提升上表現十分亮眼。

在GFXBench Aztec Ruins 1440P測試中,天璣9300跑出了99FPS的成績。從GPU的能效曲線來看,天璣9300已經遠超蘋果的A17 Pro,相比競品驍龍8 Gen3也有一定領先。

從實際遊戲體驗來看,天璣9300在《原神》30分鐘測試中不僅可以全程保持幾乎滿幀60幀,功耗相比上代還降低了20%。

值得一提的是,作為在移動光追領域走得最早的廠商,聯發科繼續更新了第二代硬體光線追蹤引擎,天璣9300可以在《暗區突圍》遊戲中實現60FPS的主機級別全局光照遊戲體驗,直接把移動遊戲的體驗再次拉升了一個台階。

此前蘋果也在A17 Pro中首次加入了對於硬體光線追蹤的支持,這恰恰證明了移動光追技術路線方向的正確性,聯發科在這一技術的應用深度上顯然已經超過了蘋果。

影像方面,天璣9300的ISP升級為Imagiq 990,此前推出的AI語義分割視頻引擎這次升級支持了同級最多的16層圖像語義分割,對畫面色彩、紋理、噪點以及亮度進行的逐幀實時優化更加精準。

據了解,為了在暗光環境下達成更好的成片率,天璣9300集成了OIS光學防抖專核,防抖計算速度更快,這也是本次影像方面其新增亮點之一。

值得一提的是,天璣9300通過與全球頭部CMOS圖像傳感器廠商進行合作,支持了「全像素對焦疊加2倍無損變焦」功能,手機影像的專業性得到進一步提升。

連接方面,這次天璣9300支持的最新Wi-Fi 7無線通信標準,可以將理論最高峰值速率提升到6.5Gbps,天璣9300還搭載了特有的Wi-Fi 7增強技術——Xtra Range 2.0,進一步增加了室內信號覆蓋的廣度、支持設備數量以及數據傳輸的速度和穩定性。

多媒體方面,聯發科在晶片中採用了旗艦電視級智能顯示技術,這也是聯發科的傳統強項了。天璣9300支持Ultra HDR,最高支持3個麥克風,同時支持HDR高動態立體聲錄音降噪。

這次天璣9300在5G通信方面也應用了AI技術,AI融合下的情境感知功能,可以進一步降低手機5G通信的功耗。

可以看到,不論是AI能力的重點提升、對於AI大模型落地痛點的精準把握,還是移動光追技術的進一步疊代引領,抑或是移動影像領域硬體、算法與AI的深度融合,聯發科天璣9300都已經成為年度旗艦「芯皇」的有力競爭者,同時聯發科在底層技術上的突破和引領,也正在深刻影響著移動晶片產業的發展。

四、旗艦芯邁入「全大核時代」,AI融合成未來,聯發科站穩高端再進一步

近年來,聯發科在高端市場的動作不可謂不頻繁,其在晶片底層技術創新層面取得的成果和實際晶片落地取得了良好市場反饋,都引起了產業和消費者的廣泛關注。

從2019年年底聯發科首次發布「天璣」系列晶片,第一次正式向高端市場發起衝擊開始算起,已經過去將近四年。高端市場,比拼的就是技術硬實力以及快速應變的能力。

四年間,聯發科旗艦移動晶片在晶片架構革新、移動光追技術應用、AI大模型落地等關鍵產業節點都做到了關鍵技術的自研以及技術的快速商業化落地。

這一方面是聯發科技術硬實力的體現,從另一方面來看也是一家企業對行業發展趨勢的精準把握。

晶片產業是長周期、重資產的,因此能夠踩對節奏、把握住市場需求的變化,對一家晶片設計公司來說是尤為重要的。或許這也是聯發科能夠長期坐穩全球智慧型手機晶片市場出貨量第一的主要因素之一。

未來,隨著AI大模型的深度融入,智慧型手機產業必然將會湧現出更多新的變量,例如AI多模態能力帶來的交互範式的革新,而晶片作為根本的底層硬體支撐,必然也將針對產業和技術的發展趨勢做出調整。

各類應用對手機晶片算力的要求仍然會快速提升,手機應對的場景會更加多樣和複雜,對於多核性能的要求提升,同時在工藝製程來到3nm、4nm之後,小核功耗的優勢又在不可避免的縮小,採用更多大核的架構設計,必然會越來越多的湧現。

不論是以聯發科為代表的晶片巨頭的實際動作,還是從上游晶片IP廠商Arm的規劃方向來看,大核占比的增加必然會是手機旗艦晶片疊代的重要方向,全大核設計也將成為行業的標準。

在聯發科看來,全大核設計以及端側生成式AI的落地也必然會是未來旗艦晶片發展的兩大核心方向。

在手機晶片產業中,聯發科常常是「吃螃蟹的人」,在衝擊高端的路上,聯發科這一吃就是四年,雖然新技術的應用總是伴隨著挑戰,但當廠商通過自身技術研發克服這些挑戰時,迎來的往往就是由自己主導的「新時代」。

結語:用硬核技術顛覆晶片設計,瞄準旗艦市場,聯發科的高端路行穩致遠

聯發科天璣9300的全大核設計,初看頗有些大膽,甚至有些「不可思議」,但當我們看過實測數據後,卻發現其可以帶來顯著的性能和能效提升,成為當下移動晶片設計領域一種值得借鑑的思路,也大機率將成為後續移動晶片設計的主流方向之一。

與此同時,天璣9300讓我們看到了聯發科在高端晶片賽道上的技術創新和突破,天璣9300齣色的性能表現,以及在AI、遊戲、影像、連接等領域的賦能都在繼續拓寬智慧型手機體驗的邊界。

近日vivo官宣了X100系列將在11月13日首發天璣9300,業內和消費者們對這款產品抱有很高期待,其能夠帶來怎樣的驚艷表現,我們將持續關注。

未來,隨著AI大模型的融入,應用的負載還會進一步增加,對手機晶片算力的需求會水漲船高,手機晶片性能的提升,還遠未到終點。

天璣9300,或許代表著手機晶片發展來到了一個新的里程碑式的節點,但放眼未來,手機晶片的較量,還遠未結束。

在未來基於AI的萬物互聯時代,晶片巨頭們的博弈焦點將不再局限於單一的技術或產品,而是一種「綜合性競爭」,這種競爭更多會體現在生態的博弈上。如何面對這些新的挑戰,是每一個玩家迫切需要思考的。

文章來源: https://twgreatdaily.com/zh-my/79e6ce34883754425b665c50b8b46f26.html