英偉達斷供提前,國產大模型失去30天搶貨期

2023-10-26     AI狐頭條

原標題:英偉達斷供提前,國產大模型失去30天搶貨期

原創 | 字母榜

國產大模型預想中的30天英偉達晶片囤貨窗口期,被美國政府關上了。

當地時間10月23日,英偉達向美國證券交易委員會(SEC)更新了8-K文件,其中提到美國政府提前了對英偉達旗下A100、A800、H100、H800和L40S等五種GPU晶片的禁令生效時間,從原本的11月底更正為立即生效。

上述新變化也意味著,今年8月份百度、騰訊、阿里、位元組等向英偉達下訂的約10萬個A800晶片,很可能無法順利交付。

一芯難求之下,英偉達晶片在國內的價格隨之水漲船高。從事大模型開發的國內創業者李鵬,最近就切身感受了一把AI晶片行業的瘋狂。

今年4月份,李鵬以單個近8萬元的價格,下單了上千英偉達A800晶片,10月中旬收到貨後,隨即迎來美國對高性能AI晶片的進一步限制。國內A800晶片價格應聲上漲,至10月20日,其單個價格已經漲至約30萬元。這意味著,李鵬手裡這批A800晶片,浮盈已經破億元。

英偉達晶片價格暴漲的背後,離不開美國商務部工業與安全局(BIS)出台的AI晶片出口管制新規定。美東時間10月17日,BIS在去年10月對AI晶片帶寬速度做出限制的基礎上,正式公布了把性能密度作為限制新標準的相關要求,並提供了30天緩衝期。

在新規影響下,英偉達原本針對中國市場推出的A100/H100的定製版晶片A800/H800,因為超標也將被全面禁售。

除此之外,BIS還希望藉助對晶片性能密度的新限制,防止中國廠商通過Chiplet封裝技術進行多個晶片的拼接,從而達到提升晶片整體性能的目的。華為在Mate 60 Pro上回歸的5G晶片,就曾一度被外界揣測為是通過Chiplet封裝技術實現了媲美7nm的工藝性能。

按照美國商務部長雷蒙多的說法,AI晶片的出口管制規定將至少每年更新一次,以便儘可能封堵中國獲取先進AI晶片的漏洞。

在李鵬見證A800晶片價格暴漲之際,英偉達針對遊戲市場發行的RTX 4090顯卡,也走上了身價暴漲之路。

作為全球消費級產品界配置最高、性能最強大的顯卡,RTX 4090因為性能密度超標而被列入禁售名單。受此消息影響,從10月18日開始,國內電商渠道的RTX 4090顯卡一度顯示缺貨,價格更是從原本的15000元左右,快速飆升至3萬-5萬元。

不過,在美國繼續執行「小院高牆(small yard, high fence)」方針之下,BIS將限制鎖定在了有限範圍內,仍然允許出口用於筆記本、智慧型手機、遊戲應用等消費類應用的晶片,但對於少量高端遊戲晶片則制定了許可通知要求。

英偉達能否順利申請到RTX 4090顯卡的出口許可,眼下仍存在變數。字母榜就此向英偉達在國內的合作商之一七彩虹求證,後者表示暫時還不清楚後續能否繼續售賣RTX 4090顯卡產品。

但市場已經率先給出了樂觀反饋。到10月20日,國內電商渠道RTX 4090顯卡已經很少顯示缺貨狀態,價格也回落到2萬-3萬元。

相比有可能「虛驚一場」的RTX 4090顯卡被禁風波,英偉達A800/H800晶片被禁,幾乎已是板上釘釘的事實。

在回應美國升級對中國AI晶片監管措施的影響時,英偉達在公告中提到,「考慮到全球對英偉達產品需求強勁,預計不會對財務業績產生短期有意義的影響。」

但長期來看,中國市場的缺失,將對英偉達造成無可避免的衝擊。在今年二季度財報會上,英偉達CEO黃仁勛就曾對此表態,認為一旦長期向中國銷售數據中心GPU的禁令實施,將導致英偉達產業失去在全球最大市場之一競爭和領先的機會。

將要遭遇長期陣痛的不止英偉達。對於一眾國內大模型廠商而言,英偉達晶片的斷供,或將成為其追趕ChatGPT乃至GPT-4的最大阻力。

A

儘管有部分聲音認為巨型人工智慧模型的時代正在走向終結,但在OpenAI CEO奧特曼看來,模型性能的縮放法則(scaling laws)仍然有效,增加模型的大小將繼續提高性能,奧特曼甚至提出了晶片需求每三四個月就要翻一番的大模型時代「摩爾定律」。

根據DeepMind聯合創始人、現Inflection AI CEO穆斯塔法・蘇萊曼爆料,OpenAI正在秘密訓練的GPT-5,其所需英偉達晶片數量預估在30000—50000個H100。

哪怕國內大廠如阿里、騰訊、百度等都表態稱在新規出台之前,已經提前採購了一批晶片且部署到位,但面對仍在大模型技術上持續疊代中的OpenAI,不想在大模型競爭中掉隊的國內大廠,其晶片儲備是否足夠應付未來的競爭,仍是個問題。

8月份,百度、騰訊、阿里、位元組被爆出向英偉達下了一筆累計達10億美元的交付訂單,總共採購約10萬個A800晶片,明年交付的AI晶片價值更是達到40億美元。明年的訂單大機率已經沒有指望,即便年內的10萬個A800晶片順利交付,分攤下來每家大廠的份額也只有2.5萬個,遠不足以支撐它們跟上GPT-5的腳步。

英偉達晶片禁令的提前生效,進一步切斷了國內大廠趕在30天窗口期內搶購一波的幻想。

更糟糕的情況還在於,英偉達還將繼續在「黃氏定律」指導下,每六個月推出一款新AI晶片,屆時,連定製版都無法獲取的國內大廠,在硬體配置上與美國競爭對手的差距可能越拉越大。

一旦英偉達晶片全面斷供成真,留給大廠的替代方案或許只剩更換國產GPU廠商這一條路。

近期三季度財報發布會上,科大訊飛副總裁江濤就對此表示,訊飛星火大模型不受英偉達晶片斷供影響,其採用的華為昇騰910B能力已經基本做到可對標英偉達A100。

但頭部雲廠商大模型研發工程師吳偉告訴字母榜,從單一晶片來看,部分國內GPU晶片或許已經可以媲美A800乃至A100,但在多卡串聯的並行計算環節,仍然存在較大差距。

微軟大中華區Azure事業部總經理陶然同樣秉持這樣的觀點,認為很多廠商沒有能力去實現多卡連接,但多卡並行運算卻直接決定著大模型訓練所需花費的時間成本,「同樣的一套模型,如果訓練一次需要花費一周成本為100萬美元,但如果帶寬太小最終耗時兩周,那成本就將乘以2。」

在崇尚效率的大模型賽道,時間有時比金錢更重要。使用大廠自研晶片,同樣存在類似的費效比問題。

在實際應用中,據吳偉介紹,大廠自研晶片更多被用來執行推理任務,即在由英偉達晶片訓練好的大模型上,大廠藉助自研晶片,保證大模型的日常運行。

即便是在更換國產GPU的過程中,大廠眼下也面臨無法使用更先進位程工藝晶片的挑戰。BIS已經將壁仞、摩爾線程等國產GPU公司列入實體清單,這意味著在沒有獲得許可情況下,它們既不能進口含有美國公司的任何技術或產品,也不能通過台積電等代工廠生產14nm以下的先進晶片。

另一個不容忽視的影響是,更先進晶片往往還會通過不斷的技術疊代,幫助降低大模型的運行成本。黃仁勛就曾表示,「H100可以將大語言模型的處理成本降低一個數量級。」

一旦大模型訓練成本變得更低,客戶調用大模型API接口的價格也將變得更便宜。屆時,國內大廠不僅要直面晶片性能落後的現實,還將承擔起比海外競爭對手更加高昂的大模型運行成本。

B

國內大廠並不是英偉達晶片斷供風波中受影響最大的一方。相比大廠藉助充沛資金提前儲備晶片的舉措,國內大模型創業者所要迎接的震盪,將更為劇烈。其中,又以研發通用大模型的創業者受衝擊更重。

近期,部分立志做通用大模型的創業公司,紛紛宣布融資消息:百川智能宣布完成3億美元新融資;智譜AI宣布完成超25億元累計融資。但眼下,這些原本可能用來購買英偉達晶片的融資款,一時間沒了用武之地。

即便是那些盯著垂直領域研發行業大模型的創業公司,也同樣會受到波及。據李鵬介紹,部分參數量維持在數十億級別的行業大模型,理論上購買大廠雲資源就足以滿足需求。但對於想做出極致體驗的創業公司來說,穩定的算力仍是必不可少的條件。購買大廠雲資源,很可能遭遇公司算力需求擴大而對方無法及時支援的情況。

但相比大廠,大模型創業公司在更換到國產GPU的過程中,除了需要付出更多時間成本的代價外,還可能因為在算法方面的短板,人為製造出更大的追趕差距。

在人工智慧專家丁磊博士看來,相比耗時一個月還是三個月訓練好大模型,更大的挑戰在於當前部分大模型創業公司「還不是那麼會訓練大模型……如果訓練方法錯的話,你有再多的GPU也沒用。」

在模型層創業之外,基於大模型的應用層創業也可能會因為美國政府新的制裁措施,影響到業務發展。

據媒體爆料,美國政府還在考慮限制向中國AI公司出租雲服務,以堵上這些公司通過租賃微軟雲的方式,從而規避對先進位程晶片的出口禁令。

C

在國內一眾大模型廠商業務遭遇衝擊或挑戰之際,作為風暴中心的英偉達,同樣難逃損失。

在美國政府傳出將對半導體技術實施新的出口限制,進一步限制中國市場獲取A800和H800時,黃仁勛曾在7月份接受採訪中表示,「如果我們被剝奪了中國市場,我們沒有應急措施。因為世界上沒有其他中國,只有一個中國。」

2022年,中國市場的營收占到英偉達的約四成。美國半導體行業協會數據更是顯示,2022年,中國半導體採購額為1800億美元,占全球半導體採購總額5559億美元的三分之一以上,是最大的全球單一市場。

為了儘可能挽回損失,黃仁勛一度嘗試遊說美國政府改變策略。今年7月份,黃仁勛曾連同英特爾CEO基辛格、高通CEO阿蒙與美國政府官員在華盛頓舉行會談。這些晶片巨頭們希望美國政府應該進一步評估「限制對華半導體出口」的影響,認為出口管制將有損於美國在半導體行業的領導地位,希望停止實施新的對華限制。

黃仁勛

黃仁勛更是直言,「限制英偉達在華晶片銷售,只會給其他品牌提供機會。」在黃仁勛看來,中國占據了美國科技產業約三分之一的市場,令其作為半導體零部件來源地和產品終端市場的地位無可取代,退出中國市場不是一種可行選項。

儘管這場遊說活動在某種程度上推遲了美國政府對華晶片出口新規的出台時間,但最終卻未能徹底讓美國政府改變心意。

待30天公示期結束,留給黃仁勛的挑戰之一,將是如何解決晶片重回中國市場的問題。

考慮到去年10月美國政府頒布出口禁令後,英偉達迅速調整了晶片帶寬速度,及時發布了符合禁令規定的定製版晶片A800。Spear Invest創始人Ivana Delevska認為:「隨著時間的推移,會出現某種與此類似的解決方案,而不是完全禁止它們。」即英偉達或許會再次通過微調其晶片來滿足新的禁令要求,從而緩和這項AI晶片禁令帶來的營收下滑等一系列影響。

受新規影響,英偉達股價已經從10月17日的446美元,一路下跌至10月20日的414美元,總市值三天內暴跌769億美元(約合人民幣5600億元)。

不過,一旦在A800/H800的基礎上再次進行性能閹割,屆時英偉達推出的AI晶片,在中國市場是否還具備相當程度的競爭力,就要看「皮衣刀客」黃仁勛的刀法,這次精不精準了。

文章來源: https://twgreatdaily.com/zh-tw/8e5918ed62884eebdc1e5c0345dadbe0.html