英偉達RTX 4090禁運真相?實際零售影響有限,國內代工生產受阻

2023-10-19     芯東西

原標題:英偉達RTX 4090禁運真相?實際零售影響有限,國內代工生產受阻

頭圖圖源:Dexerto

芯東西(公眾號:aichip001)

作者 | ZeR0

編輯 | 漠影

芯東西10月19日報道,在美國商務部工業和安全局(BIS)周二公布了先進計算晶片出口管制新規(美國升級AI晶片和半導體設備禁令,壁仞科技、摩爾線程被列入實體清單)後,英偉達RTX 4090顯卡禁運風波鬧得沸沸揚揚。

根據英偉達發布的最新公告,臨時最終規則對超過某些性能閾值的晶片出口到中國等地施加了額外的許可要求,包括但不限於A100、A800、H100、H800、L40、L40S、RTX 4090。英偉達DGX、HGX系統等任何包含一個或多個涵蓋上述晶片的系統也適用於新的許可要求。

此消息一出,遊戲圈氣氛剎時變得緊張起來。因為這次不僅是用在數據中心的AI計算晶片,就連英偉達的消費級旗艦顯卡GeForce RTX 4090也被限制之列。而如果後續限制規則不變或進一步升級,影響範疇可能擴大至更多英偉達下一代旗艦及高端消費級顯卡。

不知是被搶購一空還是囤貨炒價,很快國內主流電商平台上的RTX 4090公版/非公版顯卡已經奇貨可居,絕大部分顯示「缺貨」狀態。

不過關於RTX 4090的「禁運」問題,影響還未一錘定音,目前看主要影響的不是零售,而是國內相關代工生產。根據出口新規,美國商務部工業和安全局(BIS)引入了一項豁免,允許出口用於消費應用的晶片。新規也對少量高端遊戲晶片制定了「通報要求」,以提高出貨量可見度。

另據港媒HKEPC報道,美國商務部就出口管制文件作出澄清,關於RTX 4090禁令,出口消費級應用可申請作出豁免,因此RTX 4090可以在中國零售市場售賣,只是不能用作商用及生產,中國代工廠不能生產RTX 4090。但由於該消息並未標註明確來源,真實性尚待考證。

一、更改受限晶片性能紅線,影響英偉達/英特爾/AMD多款晶片出口

為什麼RTX 4090會受影響?這與先進計算晶片出口管制新規的調整有關。

去年10月7日實施的出口管製版本,主要是限制「處理性能」和「互連帶寬」,處理性能限制閾值是所有處理器單元的「位寬x算力(bits x TOPS)」總和≥4800,互連帶寬的限制閾值是總雙向傳輸速率達到或可編程到≥600Gb/s。

為了合規,英偉達、英特爾都採取了向中國市場推出「降速版」AI晶片的措施:英偉達將對華銷售的H800/A800互連帶寬速度從H100/A100的600Gb/s降到400Gb/s,英特爾將對華銷售的AI訓練晶片Gaudi2集成乙太網埠數量從國際版的24個降至21個。

此次新規進一步收緊,不限制「互連帶寬」了,改為限制「性能密度」,並用「總處理性能(TPP)」來取代之前的「位寬x算力」。根據ECCN 3A090修正,滿足以下任一條件,就會受出口限制:

1、3A090a:針對最高性能晶片

(1)TPP≥4800。

(2)TPP≥1600,且性能密度≥5.92。

受限於這一區間的晶片預估包括:英偉達的H100、H800、A100、A800,英特爾的Max 1100、Max 1550、Gaudi2、Gaudi3,AMD的MI250、MI250X、MI300、MI300X、MI388等。

2、3A090b:針對次高性能晶片

(1)2400≤TPP<4800;且1.6≤性能密度<5.92。

(2)TPP≥1600,且3.2≤性能密度<5.92。

受限於這一區間的晶片預估包括:英偉達的L40、L40S、A30、RTX 4090,英特爾的Flex Series 170,AMD的MI210、MI220等。

此外,一些性能略低於上述限制閾值的晶片出口,屬於「灰色地帶」,也要向美國政府通報,由美國政府決定本次出口是否需要申請許可證。

任何包含≥500億個電晶體並採用高帶寬內存(HBM)的晶片或計算機,都需要先獲得許可證,才能向中國等地出口。

二、TPP、性能密度怎麼算?

根據注釋,3A090規定的晶片類型包括圖形處理器(GPU)、張量處理器(TPU)、神經處理器、存內處理器、視覺處理器、文本處理器、協處理器、自適應處理器、現場可編程邏輯器件(FPLD)、專用集成電路(ASIC)

具體計算方法為,「總處理性能(TPP)」是2 ×「MacTOPS」×「操作位長度」,在集成電路上的所有處理單元上相加。對於3A090規定的同時提供稀疏矩陣和密集矩陣處理的晶片,「TPP」值是處理密集矩陣(如無稀疏性)的值。

「性能密度」即TPP除以「適用die面積」。「適用die面積」以mm²為單位測量,包括使用非平面電晶體架構的工藝節點製造的邏輯die的所有die面積。

「MacTOPS」是用於乘法累加計算(D=AxB+C)的每秒Tera(10^12)操作的理論峰值數。「TPP」公式中的2基於將一次乘法累加計算(D=AxB+C)作為2次操作的行業慣例。

因此,2 × MacTOPS可能對應於數據表上報告的TOPS或FLOPS。乘法累加計算的「操作位長度」是乘法操作輸入的最大位長度。

「MacTOPS」的比率應按理論上可能的最大值計算,被假定是製造商在年度或集成電路宣傳冊中宣稱的最高值。例如,「TPP」閾值4800可通過8位600tera整數運算(或2×300MacTOPS)或16位300teraFLOPS(或2×150MacTOPS)來實現。如果晶片設計用於MAC計算,具有實現不同「TPP」值的多個位長度,則應根據3A090中的參數評估最高的「TPP」值。

出口管制新規還為具有AI功能的消費級晶片增加了經通報的先進計算許可例外(NAC)。此許可例外適用於3A090.b和3A090.a規則下的晶片,即在收到向中國等地出口、再出口及轉運的通報後,美國政府將決定是否可以適用該許可例外或需要許可證。

結語:新規直衝AI大模型訓練,短期內不會對晶片巨頭業績造成衝擊

《先進計算晶片規則(AC/S IFR)》將在1個月內的11月16日生效,公眾評論的截止日期為規則公開展示之日起60天。而英偉達2024財年第三季度截至2023年10月29日。也就是說新規實施不會對英偉達最新第三季度的財務業績產生影響。不排除英偉達重施故技,再度為中國市場設計「閹割版」晶片的可能性。

新規進一步擴大對先進計算晶片出口管制範圍的深度和廣度,表面上說是為了「國家安全」,實際上是對中國的AI和高性能計算產業圍追堵截、設置重重阻礙。新規還尋求涉及基於硬體的技術解決方案的額外豁免建議,以限制具有受關注能力的大型兩用AI基礎模型的訓練。

文章來源: https://twgreatdaily.com/zh-my/bcadbc60b88dbb0b2b89e2966de84789.html