「退回」8核8線程的Lunar Lake表現如何?英特爾顛覆式變革目的何在?

2024-06-12     電腦報

在才結束的2024台北電腦展(COMPUTEX)期間,英特爾公布了下半年會登場的新款輕薄本處理器Lunar Lake——這絕對是令人震驚的一代產品,因為它取消了使用多年的超線程技術,從當下筆記本用主流酷睿處理器至少8核12線程,至多24核32線程的狀況,「退回」到了4大核+4小核共8核8線程!而且,它還把內存焊到了處理器整體封裝中!

如此大的變化,意欲如何?如此操作的背後又有著什麼故事?來聽聽牛大叔的科普和八卦吧^__^。

本文先簡單直白地解讀Lunar Lake的規格、特性、性能和價值。

然後,回答一個重要問題:英特爾為什麼要如此設計?以及背後的一些故事和背景。

看到這裡,大家的第一反應可能是:我K,第一代酷睿Ultra(Meteor Lake)手都還沒捂熱,新品就要來了?是的,它不僅要來了(下半年上市),而且還玩了把「再度顛覆」:

「低功耗小核」(LPE)又沒了,Lunar Lake僅使用大核+小核(P核+E核)結構;

取消了沿用多年的超線程技術;

核心數爆減到8個,4P+4E,一共也就8線程;

然後,把內存顆粒和處理器綁一起了——處理器整體封裝包含了內存!

這要換在七八年前,每一個變化都能支撐起一代更新,並號稱「革命性變化」,如今一口氣全祭出來,的確令人震驚——而且前提是,從代與代的變化來看,酷睿Ultra其實是相當成功的,集顯性能大漲,處理器日常應用功耗也降低不少進而帶來續航的明顯提升。Lunar Lake卻又來一次徹底顛覆,處理器核心數量和線程甚至「嚴重倒退」,英特爾是何用意呢?

先從技術層面說說Lunar Lake的設計方向,它是典型的為PC的AI應用大方向服務的,同時將帶來更低的日常應用功耗,整機續航會再度大幅提升!而且,以上變化有製程、工藝和架構的巨幅提升作為支撐!

先從最直觀的內存變化說起:把內存焊在處理器整體封裝上,好處是電路更短,且主板整體面積可減小250平方毫米。按照英特爾說法,可在「內存相關物理層省電最多40%」(很多媒體直接說「省電40%」是不準確的)。

另外,Lunar Lake支持的內存規格達到了驚人的LPDDR5X 8533,行業領先。容量方面則是16GB/32GB兩種容量可選——但我猜大部分機型都會選擇32GB,畢竟按正常邏輯來說,Lunar Lake輕薄本上將不會再有內存插槽可供升級了。

對了,八卦一嘴:其實「綁定內存」的做法並不是英特爾首創,大家可看看蘋果M2處理器的圖^__#。都說蘋果M處理器的筆記本續航長,這就是其中一個道理啦。

製程工藝再度提升!

英特爾酷睿處理器現如今還有不少是10nm製程,而輕薄本的第一代酷睿Ultra算是率先提升到了7nm+5nm+6nm的製程水平(CPU部分7nm(Intel 4),Arc Graphics集顯為台積電5nm,控制和IO模塊為台積電6nm)。

而Lunar Lake則再度巨變:一方面是全部採用台積電工藝;另一方面,製程再度提升:控制模塊依然採用6nm製程(台積電N6工藝),但CPU+GPU+NPU的計算模塊則採用了台積電的N3B工藝,也就是直接提升到了3nm製程!

而常識就是:製程的跨代提升,意味著可以設計全新的架構,帶來更強的性能,同時還能進一步降低功耗。實際情況也正是如此,讓我們繼續往下看:

這個大圖可以看清Lunar Lake的計算模塊內部結構。

大核(性能核)Lion Cove性能提升14%。

具體的內部架構變化、各種細部單元的提升就不贅述了,大家記住「效果」就好:按照英特爾的說法,相對於第一代酷睿Ultra的大核(Redwood Cove),Lunar Lake的大核(Lion Cove)的IPC性能平均提升了14%!

小核(能效核)Skymont性能提升68%!?

同樣,關於小核具體的內部架構變化、各種細部單元的提升就不贅述了,我們只看效果。按照英特爾的說法,相對於酷睿Ultra的小核(Crestmont),Lunar Lake的小核(Skymont)的整數IPC性能平均提升了38%!浮點IPC性能更是平均提升了68%之多!!

不過,這裡有個細節牛大叔要提醒大家:仔細看上面的官方PPT,會發現Lunar Lake的小核對比的其實並不是酷睿Ultra的小核,而是LPE核,即那兩顆「低功耗小核」(酷睿Ultra是P核+E核+2顆LPE核構成的)。圖片右側的「多線程整數性能對比」曲線圖,也提到了是「酷睿Ultra的2顆LPE核」對比「Lunar Lake的4顆E核」,所以,最大性能為4倍,集合上全新架構和製程的大幅提升,倒也不是太吃驚——但!在相同功耗上性能為2.9倍,以及在相同性能上,4個E核的功耗僅為酷睿Ultra 2顆LPE核功耗的1/3,這就相當厲害了!至少PPT是這樣展示的,實際效果如何,得等正式發布後測試!

總之,從目前公布的官方信息來看,Lunar Lake的CPU大核和小核,性能提升的幅度是非常明顯的,而且也明顯更省電,甚至可說是相當省電!

這裡又八卦一嘴,英特爾其實在英文資料中還公布了Lunar Lake的小核和Raptor Cove的對比,號稱平均IPC提升了2%!有興趣的朋友可以查一下Raptor Cove是什麼^__#。再度提示:Lunar Lake僅是輕薄本處理器。

必須提到的性能調度模式變化:先小核再大核。

有大核,有小核,就存在「如何調度,才能提升性能或能效」的問題。這裡就涉及到英特爾的硬體線程調度器。具體的細節不解釋了,只從宏觀思路上給大家梳理一下:

·以前的各代大小核酷睿,思路往往是「有負載了,大核先上,求得最高性能和效率;如果有更多任務並行,再考慮把不那麼緊急或低負載應用轉移到E核或LPE核上」。

·而Lunar Lake由於E核夠強,所以把思路「倒了過來」:有負載首先調用的是單個E核,如果能正常完成工作就用它了;如果需要更多性能時,則調動其他E核一起幹活兒;如果需要強力並行計算時,再轉向大核!這樣做的指導思路就是儘可能降低處理器的整體功耗——畢竟,以輕薄本而言,絕大部分是輕量級的網頁、多媒體和辦公應用,其實無需大核出手!用E核又高效又低功耗地完成是更好選擇!

集顯性能提升,效能似乎驚人!?

隨著大量日常應用利用GPU加速,甚至乾脆是GPU運算,硬體廠商都意識到,在輕薄類機型上,提升集顯(GPU)的性能和功能,價值非常顯著!所以,Lunar Lake上,全新的Xe2 GPU誕生了。

這裡我們依然不贅述細節,只看性能呈現。但大家要注意,官方PPT中「優於第一代酷睿Ultra GPU性能1.5倍」,並沒明確說是酷睿Ultra H還是酷睿Ultra U——要知道這兩者的GPU性能相差巨大,前者的Xe核心為7個和8個,而後者只有4個。

另外還有個點牛大叔有點吃不准——雖然集顯製程從第一代酷睿Ultra平台的5nm提升到了3nm,核心也是新的Xe2,但官方對比曲線中,Xe2和酷睿Ultra H(Xe1)的「同性能下功耗差異」會不會過於誇張了呢?畢竟酷睿Ultra的GPU跑滿也就20多W,難道Xe2隻要一半功耗就能追平?會不會過分優秀了(當然我倒是期待如此優秀^__^)?最終答案只有等到上市後測試來解答啦。

視頻解碼能力增強,Youtube超清視頻功耗近減半!

這裡還要提到全新的媒體和顯示(成像)引擎。和絕大部分消費者緊密相關的是多媒體解碼部分,也就是媒體引擎。Lunar Lake優化了AV1的硬體編碼解碼能力,並提供了VVC的硬解碼能力。

DEMO區的視頻播放功率對比,同樣播放AV1編碼的視頻,Lunar Lake的功耗(我猜是整機除了螢幕外的功耗)比Meteor Lake幾乎低一半!那麼現實應用中的意義是什麼呢?答案是:Youtube上,8K視頻(比如很多風景片)都採用AV1編碼,如果你用筆記本在線看,整機的續航可以大幅提升!

而VVC解碼則實現了「從軟解到硬解的質變」。會場中演示了對應的功率差異:第一代酷睿Ultra靠CPU軟解,處理器封裝功耗高達37.4W;而切換到Lunar Lake的硬解碼後,CPU功耗狂降10多倍至2.8W!

性能提升至四倍的NPU。

這兩年AI應用被熱炒,英特爾也祭出了AI PC概念,並宣布2024為AI PC元年。而從目前的情況來看,業界似乎認定NPU是AI PC的重要一環——因為它可以用更低的功耗代替CPU和GPU實現特定的AI應用。

但坦率說,第一代酷睿Ultra平台的NPU性能孱弱,基本是「結構性存在」。但在Lunar Lake上,NPU得到了大幅加強!

注意,當前市面上的第一代酷睿Ultra的NPU被稱為NPU3(有興趣的朋友可以去查一下NPU1和NPU2是什麼,這裡不介紹了),所以,Lunar Lake的NPU被稱為NPU4。相對於NPU3,它的一個巨大變化是採用了三倍的神經計算引擎,即6個神經計算引擎(NPU3為2個),而其整體AI算力提升到了48TOPS(每秒可進行48萬億次操作)。

這個曲線對比很直觀:同功耗下,NPU4相對NPU3有兩倍性能;而最高性能達到了NPU3的四倍。

而提到AI算力,這裡再總結一下Lunar Lake的平台整體AI算力:CPU的AI算力5 TOPS,GPU 67 TOPS,NPU 48 TOPS,平台合計AI算力達到了120 TOPS。

至於Lunar Lake的其他特性,諸如整合WiFi7、多達3個雷電4接口、4個PCIe5.0和4個PCIe4.0等,這裡就不贅述了。下面這張圖比較好的歸納了Lunar Lake的特性

簡單總結Lunar Lake要點如下:

·將內存封裝進了處理器單元,最大32GB容量LPDDR5x 8533;

·取消了超線程,4大核+4小核/8線程;

·大小核都採用了全新設計,性能增幅大,且在對比上代產品時,相同性能時功耗大幅降低;

·全新的調度器進一步提升了效能,降低了日常應用的平台功耗;

·當然還有更多設計服務於功耗的降低:比如更小的外頻單位;以及全新的PMIC供電架構。

·新款Xe2核心集成顯卡,性能提升,功耗降低;

·多媒體解碼性能進一步提升,也有助於功耗的降低;

·全新NPU的規格和AI性能大幅提升,相比上一代,同功耗下實現兩倍TOPS性能,最大TOPS性能達到4倍。

全面解讀Lunar Lake的「技術層面」後,接下來的問題就是,英特爾為什麼要採用這樣顛覆性的設計?畢竟核心數量大減和取消超線程,從宏觀來看,在大眾消費層面的解釋成本極高!

雖然定義為輕薄本處理器,並非性能向的產品,但在這個「16線程都嫌少,(CPU線程)框框越多越令人興奮」的大環境中,大刀猛砍處理器數量,還取消超線程,給普通消費者解釋起來是比較痛苦的——因為在普通消費層面,複雜的電腦配置往往會簡化為「14核/20線程(或12核/16線程、24核/32線程)+32GB+16』』2.5K高刷」一句話。現如今變成了「8核8線程」,不懂的人肯定會覺得「這是啥超低端配置啊」……

而以下內容,就屬於牛大叔「八卦」範疇啦,並非「官方標準答案」!

牛大叔認為英特爾這一顛覆性設計的主要原因是「基於競爭大環境的考量」。

正如前面提到的,採用「P核+E核+LPE核+NPU複雜架構」的Meteor Lake,即第一代酷睿Ultra其實從GPU性能提升、整體平台功耗的降低、整機續航的提升上,相對於之前各代酷睿其實是非常顯著非常成功的!正常情況下,按部就班的推進就好。而Lunar Lake完全顛覆,必然是基於「更大的狀況」,即競爭大環境——高通進軍筆記本尤其是AI PC的力度非常大(有興趣的朋友可自行了解下),而老對手AMD的步伐也相當快!誰都不想在全新的AI PC較量中落後!

也正因為這樣,Lunar Lake放棄了英特爾自造,直接沖了台積電3nm工藝;也正因為這樣,Lunar Lake將更多精力放在了「降低功耗、提升能效」上,製程的提升,砍掉超線程,都有助於「節能」或者說「提升能效比」。畢竟,高通的處理器是ARM架構,功耗低續航長是先天優勢——x86處理器要想在功耗和續航上與它正面剛,必須有所捨棄!

很顯然,在大量日常應用都開始利用GPU加速甚至GPU運算的當下,穩定提升GPU的性能是非常重要的;而高性能的NPU則是「戰未來」,所以,Lunar Lake對CPU部分「下狠手」就容易解釋了。

那為什麼要大幅提升NPU性能呢?「戰未來」的說法有依據嗎?

之前牛大叔曾經說過,基於小規模獨立軟體開發商的AI應用推廣是相當難的。當下國內有不少特定領域的AI應用,但因為都是基於雲端的,且沒有大資金用於宣傳,所以「大眾看不到,不知道」。那部署在電腦上做成本地化AI呢?就更難了!電腦上能部署的AI模型不可能太大,效果可能會打折扣,還存在難以升級的問題!另一方面,即便本地部署,誰來買單?PC廠商預裝後用戶自己選擇訂閱付費?還是PC廠商買單後,以提升整機售價的形式轉嫁給消費者?那多少錢合適?另外,你占據了硬碟空間,消費者不喜歡用不著又咋辦?無論哪種形式,都有不完善和難以解決的問題!

但從全球宏觀層面來看,處於壟斷地位的微軟則絲毫沒有推廣問題!而它與AI大佬OpenAI的「深度綁定」(微軟的AI助手Copilot基於OpenAI的GPT,而GPT又是運行在微軟的Azure雲端算力上的),鑄就了Copilot AI功能的飛速發展,功能越來越強。加上Office 365也可調用Copilot進行各種辦公智能輔助,所以,微軟Copilot正在成為全球(尤其是已開發國家和地區)越來越多PC用戶的AI應用首選——實際上用戶根本不用選,因為新款筆記本上就自帶Copilot按鍵,一鍵直達!

再說簡單點就是:在PC的通用型AI應用層面,從目前的趨勢來看,Copilot大機率是最大贏家!所以,英特爾AMD高通,都得與微軟深度合作。而微軟定義的Copilot+ PC,就提到了必須採用CPU+GPU+NPU的硬體形態。

且恰好,在與高通合作的Copilot+ PC上,微軟推出了多款強勢的本地AI應用,包含「Recall」(見上圖)、「進階版畫圖」和「實時字幕」——這仨應用都可離線運行,且都是運行在NPU上的。而一個官方宣傳視頻中,出現了「40TOPS算力的NPU」畫面(下兩圖),所以,業界也就將≥40TOPS默認為了「新一代AI PC的NPU算力標準」(貌似微軟並未官方宣布過這個標準)。

而未來PC的大部分AI應用,大機率也是「雲端+本地」結合的形式,而本地的AI應用,會有較大比例是微軟自家提供且基於NPU算力的——而這,就是英特爾Lunar Lake大幅提升NPU算力的主要原因!如果你再看看其他廠商的處理器新品,就很容易得出相同答案。

※TIPS:國內網絡環境暫時無法順利使用Copilot。

最後一個大家關心的問題是:在筆記本上,英特爾會放棄高性能處理器嗎?

答案顯然是:不會放棄。Lunar Lake是針對輕薄本的處理器,其實它有個「宏觀定位」,是處理器封裝功耗17W-30W的輕薄機型和超輕薄機型(繼續八卦一下:別看Lunar Lake是8核8線程,但它最高功率可跑到90W!說不定功率上去了依然是一員猛將)。

而根據牛大叔了解的信息,採用多核架構的高性能移動處理器酷睿H和HX也將繼續保留——當然啦,新品最好是提升一下製程啦!

文章來源: https://twgreatdaily.com/zh-sg/fb8961d2addcd6be90542b8fddd3cb52.html