OPPO調校晶片的秘籍,對外公布

2023-12-27     芯東西

原標題:OPPO調校晶片的秘籍,對外公布

芯東西(公眾號:aichip001)

作者 | ZeR0

編輯 | 漠影

芯東西12月27日報道,自研晶片技術已經是優化手機終端體驗的重要途徑。今日下午,OPPO亮出晶片調校技術的最新進展,首度公布其自研晶片軟硬融合技術棧關鍵的潮汐架構

潮汐架構能有效解決影響SoC計算效率提升的存算分離、晶片調度兩大瓶頸:

1、對性能的優化深入到傳統手機廠商無法精細化的片上緩存系統,首次實現系統級緩存及L3緩存的動態匹配,可將平均能效節約8%

2、精準動態調度SoC計算單元,使得快手、高德地圖、微博、瀏覽器等應用均能效提升明顯

3、解決了影響系統流暢性的GPU控制顯示時延一致性難題,讓安卓旗艦手機的啟動性能一致性體驗超越蘋果

除了潮汐架構外,面向安全隱私,OPPO獨家VIP模式提供晶片級權限加密,內置國密認證安全晶片,實現隱私信息獨立存儲、物理隔離。

此外,OPPO預告潮汐架構還會有重大升級,將進一步拓展與聯發科的合作夥伴關係,深度參與下一代天璣旗艦晶片相關硬體的設計

一、緩存機制:精細化利用片上緩存,平均能效節約8%

OPPO軟體技術規劃與架構設計總監洪漢生說,做好晶片調校,需要兼具好的晶片和軟體能力。

當前SoC晶片計算效率提升困難有兩大瓶頸:1)智慧型手機性能鏈路沿用經典的馮·諾依曼式結構,存算分離,存儲讀寫速度遠低於CPU計算速度;2)晶片的調度方案缺乏場景級的認知。

對此,OPPO帶來自研的軟硬晶片融合技術棧——潮汐架構

據洪漢生分享,潮汐架構是OPPO在手機晶片調校領域鑽研多年的綜合成果。這些年,OPPO一直讓一些做系統軟體的工程師學習晶片技術,又招聘了大量的晶片設計工程師,讓他們理解軟體場景。所以潮汐架構是由一群懂軟體、懂系統、懂晶片的技術專家們共同打造出來的。

針對典型馮·諾依曼計算機體系結構普遍存在的存算分離問題,洪漢生認為,緩存的使用是所有策略中最沒有副作用的、最有效的一個辦法

存儲器的金字塔,越往高處,速度越快。因為價格貴,所以上面幾層容量越來越小。越往下,因為成本優勢,容量能做的比較大。

相比內存存儲,緩存的讀寫速度優勢能達到10倍甚至百倍。如果讓數據讀取發生在金字塔上層,那麼整個計算鏈路的效率能得到很大提升。

用好緩存,有助於實現性能和功耗的兼顧。

OPPO過去幾年在這方面取得了進步。相對傳統手機公司僅能在ROM或RAM進行性能優化,潮汐架構深入到了片上系統緩存及L3緩存。

「裡面的辛酸,可能只有我自己知道。」據洪漢生回憶,兩年前OPPO團隊決定做的時候,沒有仿真平台,更不要說代碼或者開放接口,工程師們只能通過調整CPU、GPU、DDR的參數,改變投票策略,看緩存的命中和缺失,改一組數據就測一個結果,硬是用這種「笨辦法」,足足整理了一整年的數據,進行數據建模,看明白其中的規律和原理,從入門到精通,真正理解了技術。

然後,OPPO團隊與晶片廠商深入合作,成立性能和功耗的聯合實驗室,一起設計了從L3緩存到系統緩存的分區管理機制。

潮汐架構基於單場景去判斷當前應用對系統資源的需求,緩存能夠根據CPU和GPU進行動態配比,並使CPU、GPU等計算核心在最優頻點區間運行。如果是計算型任務占多,則主動分配更多緩存給CPU;如果渲染型任務占多,則將資源傾斜給GPU。

洪漢生說,這些方案看上去不複雜,但如果回到兩年前,「黑盒子」曾經就像一座大山一樣擋住了道路,不翻過去,永遠不會知道山的那邊是什麼樣子的,所幸OPPO團隊翻過了那座大山。

經測算,在性能無損的情況下,潮汐架構可實現8%的平均能效節約。

二、算力調度:動態調度SoC計算單元,明顯提升日常應用能效

下一個問題是晶片怎樣做算力調度。

計算機CPU有一個甜點區間,在這個區間裡,能效比是最佳的;在這個區間外,有時候為了一點點的性能提升,要付出極大的功耗損失。

如果一個場景變得複雜,計算需求如何在多個計算單元里以最低能耗執行?怎樣讓多個核心都處於這樣的甜點區間?這是一門複雜的學問。

據洪漢生透露,在OPPO新一代旗艦上,有1+2+3+2的架構,也有全大核的架構。

由OPPO與晶片廠商深度合作打造的潮汐架構,通過對應用具體場景的準確識別,精細化地進行場景調度分析和精準的算力功耗匹配,實現SoC計算單元的動態調度,讓計算單元更多地運行在最佳能效的甜點區間。

在跨平台的CPU頻率映射上,潮汐架構幫助避免了一些過度的算力消耗。

如圖是實測在重載遊戲下滿幀情況的一個頻點分布。可以看到,性能該釋放時,高頻點不吝嗇,但其他時候,其調度控制得非常精細,能夠把整個頻率能夠壓到非常低。

從其他常用的快手、高德地圖、相冊、微博、瀏覽器等各種頭部應用測試結果看,潮汐架構使其在SoC整體能耗上取得了3%以上的收益。

洪漢生解釋說,這些數據看起來不多,是因為晶片能效不是那麼容易提升的,而這些,都是真真實實的數據。

三、流暢性:讓安卓旗艦啟動性能一致性超越蘋果

除了能效外,潮汐架構還給安卓旗艦手機帶來了流暢性上的顯著進步。

洪漢生提到蘋果手機總是給人以更加流暢的意向。在他看來,安卓手機的流暢性如果想要超越蘋果,最大的鴻溝就是「總是」這兩個字。

做一次流暢很容易,做百次、千次、萬次也不難,但是做到十萬次、百萬次,需要解決看不到的問題,要實現基本環節的體驗始終保持一致。

OPPO是怎麼做的?洪漢生分享說,日常使用手機點開一個應用,從點擊那一刻到這個應用的圖標展開,區間大概是100多毫秒。經過長時間的分析,OPPO團隊發現要把它做流暢,可能比做一個遊戲120幀還要難。

這是因為有三個行業難題:一是觸控響應一致性,二是軟體上的線程調度一致性,三是GPU顯示時延一致性。

跟GPU強相關的顯示時延一致性怎麼做呢?安卓手機採用的是分層次渲染,每一幀的動畫顯示都要經歷過多次軟體合成、硬體合成,會在GPU里進進出出。如果說這是一條生產線,GPU就像是控制中台,必須有能力根據整個生產線上所有環節可能產生的任何偏差進行及時糾正,去動態增加時鐘信號、動態增強GPU驅動能力,只有這樣,才能保證小到幾毫秒級別的時延,做到始終一致性。

否則,如果整個生產線錯過了一個時鐘信號,就會導致整個工序往右移,會出現丟幀和延遲感,帶給終端用戶不好的體驗,比如點擊圖標後沒有響應,整個頁面的顯示是姍姍來遲的。

在解決掉這三個問題後,OPPO參考了蘋果的設計,把響應時間調到了一個比較舒適的時間,不快也不慢,然後用高速攝像機反覆進行測試,最後成功將整個應用的啟動響應時間控制得像蘋果那樣非常平穩。

通過精準的晶片算力調度,基於場景動態增強GPU驅動能力,潮汐架構解決了影響系統流暢性的GPU控制顯示時延一致性難題,從而保證了啟動性能的一致性

在模擬1天使用的320次應用啟動測試,OPPO Find X7以低至11ms的啟動響應標準差,做到了所有旗艦的第一名,甚至超越了以穩定流暢著稱的蘋果

四、國密二級認證安全晶片加持,實現硬體級安全加密

在保障用戶隱私安全方面,OPPO致力於通過全鏈路的應用、數據管控和軟硬體結合的創新功能,已取得多項國內外安全隱私領域頂級認證。

在今年10月發布Find N3典藏版時,OPPO推出了行業首創的「VIP模式」,通過三段式物理開關,一鍵就能關閉麥克風、攝像頭、定位等敏感權限,為用戶隱私進行硬體級安全加密。VIP模式也將登陸下一代Find X系列旗艦。

OPPO為「VIP模式」加持了一個通過手機領域最高認證等級的國密二級認證安全晶片。該晶片能夠獨立存儲各種敏感信息,相比傳統的軟體安全方案,晶片級的加密方式可以將敏感權限的管理、授權開關,與作業系統分離,鎖進安全晶片的硬體層,由晶片級安全子系統進行管理。

安全晶片配合通話隱私雙向保護、隱私信息自動打碼、證件照片一鍵水印等隱私功能,從硬體到一系列軟體功能,全方面守護用戶的隱私安全。

結語:手機競爭卷向晶片調校

同一顆晶片,不同的晶片調校能力,影響了手機在實際使用中能夠發揮的晶片性能。

隨著摩爾定律瀕臨失效,每一代晶片製程提升,背後有行業千億級美元的投入、百萬級工程師的努力,也只能把晶片的整體能效提升百分之十幾。OPPO實現8%的平均能效節約,足見晶片調校對於優化能效表現的重要性。

在有限的晶片選擇中,通過軟硬體協同實現手機體驗差距的晶片調校能力競爭,已經從手機巨頭們之間暗戰轉化為台前「秀肌肉」的焦點。

這些終端用戶「看不見」的優化,拼得是不止是軟硬體技術實力,還考驗了手機大廠們的場景級認知、與晶片原廠合作深度等綜合能力。

隨著晶片調校愈發精細化,更高的性能、更優的能效,更穩定的流暢性,結合越來越多引入的智能優化技術,最終將使用戶受益。

文章來源: https://twgreatdaily.com/zh-my/23fd9334668da3dd4c1404681ca3267c.html