英偉達捅了AMD一刀

2023-11-14     市界

原標題:英偉達捅了AMD一刀

「我在不停打仗」,在晶片界鐵娘子蘇姿豐(Lisa Su)的職業生涯里,有兩場至關重要的戰役。

第一場,是在2014年接手AMD(美國超威半導體),以力挽狂瀾之勢讓AMD從深陷財務危機到一舉成為英特爾最強勁對手,股價上漲了40倍。另一場則是在當下,今年6月,AMD發布了針對AI需求的最新款晶片Instinct MI300,這是其狙擊英偉達最強勁的一個武器。

在GPU晶片領域,AMD與英偉達的緣分妙不可言。英偉達與AMD長期以「八二開」的比例瓜分著全球市場份額,在圖形顯示等市場並稱雙雄。而媒體則樂於炒作二者更私人的關係——比如,英偉達CEO黃仁勛與蘇姿豐可能存在的「表親關係」,當然,雙方從未在任何場合正式回應過這些話題。

無論關係如何,黃仁勛一點都不手軟,他對鐵娘子蘇姿豐的第二場戰役迅速展開了雷霆反擊。

北京時間11月13日晚間,英偉達發布了全球最強AI晶片H200,其性能較H100直接翻倍。打了搶先發布MI300的AMD一個措手不及。此前,AMD表示,公司正在今年第三季度向客戶提供樣品,產量將在第四季增加。原本MI300將有望成為AMD最快銷售額破10億美元的產品。

英偉達稱H200將在2024年第二季度開始交付,留給AMD搶跑的時間不多。

AMD開打第二場「翻身仗」

AMD還是樂觀了。

今年Q3財報發布之際,AMD曾大膽給出業績預期:四季度營收將達到58億美元至64億美元之間,預計為61億美元,同比增長9%——這也將是AMD自2022年第三季度以來,最高的季度收入。

這種預期也可以理解,2023年第三季度,AMD營收58億美元,凈利潤2.99億美元——是連續7個季度的凈利潤同比下滑之後,首次實現季度凈利潤的同比正增長。

而AMD幾乎將自己未來業績強勁增長的底牌,全部押注在了一款產品上:

今年6月份,AMD專門針對AI大模型訓練需求發布的Instinct MI300系列晶片。這幾乎是全球範圍內,第一款能夠直接對標英偉達大模型訓練晶片H100的產品。

根據AMD官方信息,MI300在部分技術指標上相比英偉達的H100更具優勢,比如MI300提供的HBM(高帶寬內存)密度是H100的2.4倍,HBM帶寬是H100的1.6倍。這意味著AMD可以運行比英偉達H100更大的模型。

驚艷四座的ChatGPT大模型大部分基於英偉達2020年發布的A100晶片進行訓練。而在2022年3月份,英偉達面向AI大模型訓練需求專門發布了H100晶片。

從亮相開始,H100就迎頭趕上了「百模大戰」的風口,成為了被各方力量爭奪的寶貴算力資源。據坊間傳聞,早在今年第三季度時,英偉達H100的訂單就已排到了2024年,至今產品稀缺程度有增無減。

儘管如此,在發布會上蘇姿豐還是表現得十分有信心:「我們認為,數據中心人工智慧加速器(市場)將以超過50%的復合年增長率,從今年的300億美元左右增長到2027年的1500億美元以上。」

AMD計劃在第四季度量產MI300。在此基礎上,公司預計在第四季度,包含MI300在內的數據中心GPU業務營收將達到4億美元;而在整個2024年,公司數據中心GPU產品有望實現20億美元的銷售額。

AMD數據中心GPU產品的下游市場既包括科學計算等高性能計算領域,也包括AI領域,但蘇姿豐認為後者才是業績的主要增長動力:「隨著2024年的到來,我們預計收入將繼續按季度增長,而且,這將主要來自人工智慧。」

而其中MI300被寄予厚望,將成為該公司「有史以來最快達成10億美元銷售額的產品」。

此前,AMD雖然在GPU市場名列第二,但主要應用於圖形處理、消費級產品等傳統GPU應用場景,在AI和高性能計算領域始終存在感較低。

從MI300的性能指標而言,AMD本來已經幾乎具備了與英偉達叫板的能力,直到H200橫空出世。在H200發布會結束結束後,AMD收盤股價下跌1.52%。

在未來,AMD想要在如火如荼的AI技術市場中搶得一席之地,面前的壓力仍毋庸多言。

至今AMD尚未公布MI300的官方定價,但市場預計,為了增加與英偉達的競爭籌碼,AMD MI300或許不得不延續其在傳統GPU市場的性價比路線。

不僅如此,為了完成預期業績,AMD還於10月份在上海啟動了一輪裁員「瘦身」。

據一位AMD前員工對「市界」透露,本次AMD給出的賠償條件是「N+3」倍的月工資,主要涉及的部門為SoC(系統級晶片技術部門)和RTG(Radeon系列顯卡技術部門)。

一步慢,步步慢

大模型時代,AMD等來了一個翻身機遇,只是對這份機遇AMD做出的反應還是晚了。

一位在國內高校任職的AI研究人員告訴「市界」:「除了媒體報道的韓國(指該國電信運營商』KT』)使用AMD Instinct平台運行了AI大模型的新聞,在日常研究里,我還沒有接觸或了解到使用AMD晶片訓練的項目。」

這種情況也反映在了市場數據上,據IDC調研,2022年中國AI加速卡(即AI訓練晶片)出貨量約為109萬張,其中英偉達在中國AI加速卡市場份額為85%,華為市占率為10%,百度市占率為2%,寒武紀和燧原科技均為1%。根據這組數據,AMD的AI訓練晶片在國內市場甚至「沒有姓名」,淪為其他。

不僅如此,亞馬遜AWS、谷歌、騰訊雲等全球主要雲廠商的AI晶片也大多來自英偉達及自研,採用AMD產品的占比較小。

追溯形成顯著市場差距的原因,可以將目光轉向多年之前。

英偉達創始人黃仁勛曾這樣總結:「我們很早地,大約在10年前就發現,(AI)這種製作軟體的方式可以改變一切。我們從底層一直到頂層,從各個角度改變了公司。」

在一家美國GPU獨角獸企業擔任市場總監的Lee告訴「市界」:「早在2012年,英偉達就開始投入在深度學習的計算了,而且是在全公司範圍內貫徹執行。」而這相較業內普遍意識到AI晶片的重要性,至少早了四五年的時間,領先一個身位。

從2016年開始,英偉達旗下的加速計算GPU產品線(代號「Tesla」)開始專門針對AI訓練任務進行設計。這一年推出的晶片型號為P100,同時配備有英偉達新研發的高速互聯技術「NVLink」。而NVLink能夠允許CPU、GPU晶片間進行高速交互,進一步提升了運算效率,至今仍是英偉達AI晶片中的核心技術之一。

還是在這一年,英偉達向後來推出了ChatGPT的OpenAI捐出了一台搭載了8塊P100晶片、價值百萬的超級計算機「DGX-1」。在這台超算的機箱上,黃仁勛親手寫道:「為了計算和人類的未來,我捐出世界第一台DGX-1。」

後來的種種跡象都表示,這段時間正是人工智慧的黃金髮展期。正是在2016年,谷歌Alpha go擊敗了圍棋大師李世石,被視為AI技術邁上新台階的重要標誌。不僅如此,AI相關產品、硬體、軟體等的市場規模已經超過80億美元,紐約時報評價稱「AI已經到達了一個熱潮」。

反觀同一時期的AMD,雖然同樣試圖在AI方面有所布局,但彼時其重心更多放在CPU業務線上,並未像英偉達一樣全面押注。

2016年,AMD正式推出Radeon Instinct系列產品線,旨在加速深度學習、神經網絡和高性能計算等方面應用。

然而從產品更新情況而言,AMD對旗下AI晶片的設計顯然不夠「上心」。在之後的4年間時間裡,Radeon Instinct系列雖然不斷更新,但始終與AMD的消費級顯卡Radeon公用基礎架構,在計算方面缺乏針對性和高效率,難以滿足AI訓練的需求。

直到2020年,這種情況才有所轉變。這一年,AMD將AI晶片產品線更名為「Instinct」,並首次拋棄了以往的消費級顯卡架構,為其採用了專門設計的CNDA計算架構。

在此之後,AMD連續更新了三代產品MI100、MI200,以及最新發布的MI300。憑藉全新的技術路線,以及採取高性價比的市場策略,AMD才開始在AI訓練市場中有人問津。

只是,在AMD「缺席」AI市場的幾年裡,英偉達已經建立起了極強的生態壁壘。

英偉達建築的高牆

Lee這樣向「市界」描述英偉達在AI領域樹立的優勢:「真正難的並不是說比別人跑的多快,而是圍繞著這一個主題,進行全方位點點滴滴的下注,從語言設計到開發者工具這些周邊的東西才是最難得的。」

而周邊工具一旦被用戶所接受,「客戶技術遷移的成本將會是難以想像的高」。

資深AI從業者路雲的說法也從側面印證了這一點,據其回憶:「早在大約10年前,我們學校就給高性能計算相關專業的學生開設了基於CUDA的課程。」

CUDA是英偉達在2006年推出的通用並行計算架構,藉助CUDA提供的編程接口和工具集等,開發者可以基於GPU晶片編程、運行複雜的AI算法等等。

全球頂尖AI學者、前百度首席科學家吳恩達曾這樣評價CUDA:「CUDA出現之前,全球能用GPU編程的可能不超過100人,有了CUDA之後使用GPU就變成了一件非常輕鬆的事情。」

這樣一代代的開發者和研究者,用汗水澆灌出了英偉達的強大生態。換句話說,即使AMD MI300的官方性能指標相比英偉達H100體現出優勢,後者的生態壁壘仍舊難以逾越,更別提H200展現出了更強的性能指標。

這樣的背景下,AMD想要逆風翻盤,除了著力補上生態差距,還不得不在市場策略上別出心裁。

生態方面,2016年,AMD推出了對標英偉達CUDA的ROCm架構。據東吳證券研報,由於ROCm平台起步晚,其對於GPU加速庫的支持沒有英偉達CUDA全面。CUDA的應用場景基本能夠覆蓋全場景,但ROCm更多用於高性能計算領域,對AI的覆蓋稍顯不足。

至今,AMD ROCm平台的工具鏈已經相對完善,並且能夠兼容英偉達的CUDA平台。此外,為了進一步優化軟體生態,AMD還在2023年10月份官宣收購了AI軟體企業Nod.ai。

對此東吳證券研報評論道:AMD的軟體生態在公司大力投入和其它廠商積極扶持下,有望徹底改善。

(英偉達與AMD軟體生態工具鏈完善程度對比。圖源/東吳證券)

另一方面,AMD高性價比的市場策略將是其在AI領域的另一大優勢。聯博資產管理公司的分析師Stacy Rasgon認為,提供』平替版的英偉達』,將是AMD爭取市場支持的關鍵。

AI研究公司Cambrian AI Research則分析稱,大公司需要「第二供應商」的戰略將為AMD提供機遇:「像OpenAI和微軟這樣的公司需要有一個能替代英偉達產品的選擇,AMD可能會給他們一個無法拒絕的提議,但不要指望能從英偉達那裡搶走很多份額。」

無論如何,大模型產業疾速發展帶來了巨大的算力缺口:根據OpenAI 數據, 模型計算量增長速度遠超人工智慧硬體算力增長速度,兩者之間存在萬倍差距。

對於長期在AI領域缺乏存在感的AMD而言,它正迎來了最好時機。

參考文獻:

《「饑渴」的AI時代:AMD Instinct加速器面前是一條「星光大道」》,快科技

作者 | 董溫淑

編輯 | 董雨晴

運營 | 劉 珊

文章來源: https://twgreatdaily.com/zh-cn/afb8e39771dbf74eeb4c1a31e7e1ee8b.html