原創 | 酷玩實驗室
10月17日,有一隻靴子落地了,美國正式宣布了新一輪針對中國半導體發展的限制和制裁。
根據美國商務部最新出台的文件:
「Implementation of Additional Export Controls: Certain Advanced Computing and Semiconductor Manufacturing Items; Supercomputer and Semiconductor End Use; Entity List Modification」(實施額外出口管制:某些先進計算和半導體製造項目;超級計算機和半導體最終用途;實體列表修改)。
英偉達公司超過某些性能閾值的晶片,包括但不限於 A100、A800、H100、H800、L40、L40S 和 RTX 4090,將不再被允許出口到我國。同時包含 NVIDIA DGX 和 HGX 系列AI計算機等,也不能被出口到我國。當然未來或已經出現的更加高級的AI晶片、計算機也在禁售之列。
而且這些產品不光是不能出口到我國,處在美國商務部D1、D4 和 D5 國家組的國家和地區同樣不能進口上述晶片,這些國家和地區包括:
阿富汗、亞美尼亞、亞塞拜然、巴林、白俄羅斯、緬甸、柬埔寨、中非共和國、中國、剛果民主共和國、古巴、賽普勒斯、埃及、厄利垂亞、喬治亞、海地、伊朗、伊拉克、約旦、哈薩克、朝鮮、科威特、吉爾吉斯、寮國、黎巴嫩、利比亞、中國澳門、摩爾多瓦、蒙古、阿曼、巴基斯坦、卡達、俄羅斯、沙烏地阿拉伯、索馬利亞、南蘇丹、蘇丹共和國、敘利亞、塔吉克、土庫曼、阿拉伯聯合大公國、烏茲別克、委內瑞拉、越南、葉門、辛巴威。
此外我國的壁仞科技、摩爾線程等13家GPU和AI相關的企業被加入了商務部制裁的實體清單。加上之前的華為、寒武紀等公司,我國的高科技發展進步又一次讓美國官方感到了威脅。
這對我們是壞事麼?短期看是的,我們的國產AI大模型原本就受到算力瓶頸的限制,現在變本加厲了。
但是長期來看呢?
早在8月24日香港《南華早報》就報道過,美國晶片製造巨頭英偉達方面表示,如果美國收緊對中國的晶片出口管制,實施更為嚴格的制裁措施,英偉達乃至整個美國產業界都將在全球最大半導體市場「永久失去商機」。
雖然說,後面有消息傳出,美國方面可能會調整一下限制令,讓4090不能在中國大陸生產,但是能向普通消費者進行銷售。這個消息倒似乎有點爭議,到19號為止,我還沒看到英文網際網路傳播這一消息。
美國商務部官網上刊登的相關內容也只是提到了,官方允許對消費者應用的晶片進行出口豁免,而並不確定是否包含4090。
退一萬步說,即使包含也並不影響美國相關禁令對於中國半導體產業是個巨大的利好。
01
對於絕大多數科技從業者和觀察者來說,隨著華為推出自己的手機晶片之後,美國人這次將限制範圍從A100和H100擴展到A800和H800是沒有任何超預期的。
A800和H800其實就是A100和H100的降級產品。或者更直白點,A800和H800就是是A100和H100一條生產線下來,只不過A100和H100是良品,A800和H800系列是次品,甚至是同規格降級升價的產物。
(據業內人士說的,H100的良品率只有百分之十幾的樣子,於是老黃把剩下的晶片修理成H800,往中國賣。)
路透社2022年11月份的一篇報道「獨家:英偉達為中國提供符合美國出口管制的新型先進晶片」(Exclusive: Nvidia offers new advanced chip for China that meets U.S. export controls)中,就援引了一些觀察家的評論,提到了這個現象:
CCS Insight 分析師 Wayne Lam 表示:「A800 看起來是重新包裝的 A100 GPU,旨在避免最近商務部的貿易限制。」他還表示,A800 的晶片間通信能力明顯降低了性能。
因為A100與 A100的晶片功能比較表明,A800晶片的晶片間數據傳輸率為每秒 400 GB,低於A100的每秒 600 GB。而當時的規則是限制傳輸速率在每秒 600 GB 及以上的晶片出口給中國。
今年3月的路透社報道(Nvidia tweaks flagship H100 chip for export to China as H800)也提到,H800也做了和A800類似的操作以符合對中國大陸的出口禁令。
所以英偉達公司在2022年相關晶片限制出台之後,似乎很是高興,畢竟中國的AI晶片依舊是英偉達在壟斷。甚至英偉達都不用怎麼調整生產線,還能把殘次品尾貨高價賣給中國,這簡直是雙贏啊,英偉達贏兩次。
但是美國政府和立法機構的人就不怎麼乾了,因為他們是真心想限制中國的AI發展,這種打著各種旗號實質上把他們當傻子玩的手段,一旦上位者想較真,老黃就要難受了。
所以A800這種東西剛出來之後,美國那邊關於限制類似A800這種晶片的討論就沒停過。然後憋了一年就憋出了我願稱之為最傻半導體政策,限制中國大陸購買RTX4090晶片的禁令。
說實話,我是真沒想明白,為啥會限制一個頂級消費級遊戲卡。首先作為遊戲卡,這種東西偷運的難度相比於專業的AI晶片物理難度就小了很多,畢竟尺寸小了。作為一種toC的晶片,相比於A100這種專注toB端的晶片,4090更難追查,賣出去都不知道誰買的。
從AI大模型的角度來說,雖然應用台積電5納米工藝的4090的單卡運算能力已經反超了前輩A100,但是它由於是為遊戲設計。所以更多的是考慮單卡和少量卡組合。
而現在大模型的計算,最重要的恰恰是晶片集群組合能力,因為這考驗的是大量數據來回搬運以及計算帶來的巨大緩存需求和能量消耗。A100針對性設計優化使得其顯存、功耗、帶寬等都特別適合這種集群運算。而4090在進行AI運算的時候就會出現了一種,單卡訓練傳統模型性能過剩,而多卡訓練大模型則能力不足的窘境。
最後是4090以及之後的5090等等如果真的不能在國內大量流通,那就相當於是給中國的AI晶片和GPU晶片廠商留下了一個巨大的前置市場。
因為這次封鎖毫無疑問的會影響國內,以及其他被制裁國家地區遊戲佬的顯卡升級體驗,當年礦難的痛苦回憶與被傷害的民族感情一齊湧上心頭,必然會加速國產遊戲晶片的商業模式完整閉環。
當年黃老闆從遊戲卡向AI晶片轉型的前置市場就是各種遊戲晶片,通過在遊戲晶片上賺到的錢去補貼AI晶片的發展。本來這條路已經很難走了,因為消費電子領域贏家通吃的特點太強了。
但是新的禁令一出來,我們國家未來補貼的財政壓力也小了,國內潛在市場空間也大了,類似華為這種雖然質量差一點,但是會有很多人買的報復性購買的需求預期也上來了,這樣資本未來也願意投錢了。
這一下給我們解決了好幾個難題,並且給我們國家半導體發展一個巨大的確定性:不需要你做到AI晶片和對面對齊,只需要你遊戲晶片做到比如英偉達5年前的水平,做好適配能流暢玩3A,我們國內就會有大量遊戲佬願意支持你。這個潛在的功德那可是無量的。
有很多人就在問,美國人為什麼對AI晶片那麼上心呢?畢竟摧毀一個國家工業最好的方法是傾銷,你這樣不是逼著我們中國人自己搞半導體升級嗎?
02
這就要說到美國人一些對於AI領先之後可能的政策預期了。
對於美國來說,現在政策目標可能主要集中在以下幾點,1)確保軍事領先;2)壟斷AI發展;3)壟斷下一次工業革命;卡中國半導體的脖子,可能會放在政策考慮的最後。
首先是軍事,AI在軍事上的應用我在7月6日的推文「AI時代,軍事教科書已經在重寫了」中已經提到了不少。這裡我重點提一些其他內容。
在小模型時代,AI是很容易被人欺騙的。比如在軍事演習中,就很經常會出現,你一個人套個紙殼子,然後從對面AI攝像頭面前大搖大擺地走過去,對面就不會把你當作威脅的情況。
這次在巴以戰爭的第一天,哈馬斯抵抗組織就用無人機,帶著炸彈把以色列的遙控機槍塔給炸了。
如果它的早期警戒用的是AI進行掃描的,那麼機槍塔被炸的時候毫無反應的情況可能有兩種,一種是AI識別到了,但是以色列人不在。另一種就是AI識別不出來大疆無人機在這種情況下靠近是種威脅。
這些情況對人來說很好解決,把情況跟他說一下就行。但是AI不行,它需要大量的數據訓練,大量的數字孿生強化對抗,才能認識到,這種情況要拉警報。
就像現在全球幾乎只有華為系和特斯拉的車,能比較好地面對道路上的異型障礙物一樣。更加複雜的陸地戰場環境下,如何訓練機器識別一個完全無法預料的偽裝威脅,那可是非常難的。
而一旦突破那就是決定性的,擁有這一技術的軍隊就可以用自己的機器人去碾壓對面的血肉之軀。用工業幾小時最多兩三年的生產周期去碾壓對面從出生到訓練二十年生產周期的精銳士兵。
而這種訓練,似乎只有大模型有這個潛力,因為目前看來,只有大模型最像人,也有潛力做出和人類似的近直覺性判斷。所以美國希望能拿住這個優勢,試圖重建類似他有核武器別人都沒有的那種優勢。
而在這個時代,在半導體工業和AI兩個領域唯一有潛力能跟上它發展步伐的只有中國。
第二是美國希望壟斷AI發展,這方面我想從一個大家可能並不熟悉的領域說起。
AI應用的風潮變化很快,導致不同時間段的最優硬體變化很大。我聽業內人士歸納說,早期的AI比較小,設計的時候沒有那麼多圖形計算之類的,CPU就搞定了。
後面圖形計算多了點,各個地方又開始卷GPU。然後阿爾法狗把卷積神經網絡帶火起來了,於是各家開始搞什麼各種專用集成電路ASIC,現在我們很多工業上本地AI也會配專門的ASIC,手機晶片上的NPU也是屬於ASIC。
結果大參數的AI出來了,ASIC反而不如GPU好用了。於是以英偉達為首,各家又開始發展GPU來適應AI需求。
但是走這條路是否能到終點,現在其實說不準。今年早些時候,Chatgpt創始人說 Sam Altman就曾表示,他認為我們正處於巨型模型時代的盡頭,並認為AI技術進一步的進展將不會來自於將模型做大,人類需要將以其他方式使AI變得更好。
這也意味著可能未來對於AI的硬體需求可能不再是單純的GPU,而是其他更新的東西。比如在HBM(高帶寬內存)上的突破可以預見對於AI將會是一個巨大的助力。一旦晶片的方向改變,這時候掐斷中國的最先進的晶片供給,就可能實現接下來一段時間斷層領先的效果。
這一點,最有力的例子就是基辛格在2021年發布的新書《人工智慧時代與人類未來》,基辛格博士在寫書的當時就體驗到了gpt-3帶來的震撼,然後寫在了書里。
而我們大多數人直到2022年底甚至2023年才感受到了Chatgpt帶來的震撼,然後引發了國內大模型的風潮。
這個時間差距就是客觀的,也是美國想竭力保住的最後領先和產業壟斷的資源。
第三點就是美國人希望用AI引領工業革命,或者避免在中國先發生下一次工業革命。
長期以來,有很多人尤其是美國方面的人認為,AI是引發下一次工業革命的關鍵,或者說美國只能賭AI可以引發下一次工業革命。這是因為我國在工業體量上的優勢太大了,時至今日中國的工業增加值早已經超過美日德這三個西方大國之和。
而歷史上,前三次工業革命都是基於產業鏈和科技的融合,並且由當時的世界最強的一個或者兩個工業國引領。而現在美國國內製造業和科技產業鏈情況不容樂觀,僅僅在科研上占優勢是不行的,最近這十多年往往出現,美國出現科技突破,最終跑到中國落地的情況。
所以美國希望在一個不那麼依賴產業鏈優勢的領域引發工業革命,或者用一種他們能控制的方法延緩中國。而他們選擇的就是AI。
從美國的角度,他們覺得AI以及背後的半導體,是他們和他們的國家,最後的可以形成對中國降維打擊的產業,同時AI的發展並不完全依賴產業鏈和體量優勢。
這樣一來可以嘗試自己能不能通過AI在實驗室或者小規模生產領域的先發優勢,在沒有產業化基礎的情況下引發工業革命,然後通過外資控制的印度、墨西哥等地,進行產業化,來對抗我國的體量甚至質量優勢。
即使這樣不行,也能為美國進行緩衝,避免在美國「準備好」之前中國提前發生產業革命。
但是我客觀的說,不是我不看好美國,而是歷史一再證明,期待用一兩件奇蹟武器打贏戰爭那是不可能的。何況AI真的是下一次引發產業革命的領域嗎?
且不說從傳統角度,工業革命一般伴隨著能源利用能力的質變。就算AI能夠顛覆包括生物、工業、農業等方方面面。但是AI引發工業革命的前提是你的工業能用AI。這裡就有個問題了:工會與失業。
工會勢力對於美國政治的影響程度是不可小覷的。美國推進工業AI有一個巨大的問題,那就是美國相關政治勢力會出於失業問題進行反對。
我們堅定地執行推進產業升級的路線,全國這幾十年雖然經歷過幾次失業潮,但是整體持續在工業化道路上狂奔,人民相對於幾十年前乃至幾年前生活水平都有明顯改善。美國,與我們是不同的。
美國由於採用金融引導的去工業化,落實到工人頭上主要效果就是產業轉移。甚至很多人這一代的工資購買力還不如幾十年前上一代人,這使得美國人對於中底層工作裁員潮會非常敏感。
再考慮到在美國現在經歷通脹,生活成本普遍比三年前高了40%以上,美國從歐巴馬到現在三屆政府的產業回流政策效果並不顯著這些背景。如果現在推進AI並帶來明確的裁員尤其是藍領工人裁員預期的話,這對於政策制定者無疑是個巨大的政治挑戰。
更重要的是,AI如果要引發工業革命,前提條件就是要有足夠多的機器人來配合AI的工作,而這方面我們現在的準備比美國更足。
根據IFR統計,亞洲的平均機器人密度自 2016 年以來以 18% 的復合年增長率 (CAGR) 飆升至 2021 年每一萬名員工 156 台。歐洲機器人密度在同一時期以8%(CAGR)的速度增長,達到129台。在美洲,這一數字為117。
如果單獨進行國家和地區的比對,中國是增速上是世界上機器人增長最快的市場,中國每一萬名員工操作機器人數量在2021年達到了322台,超過了了美國的274台。
考慮到我國的增速,至少從硬體角度,我國是更加容易使用AI配合工業機器人引發工業革命的。
另外一個更重要的現實是,在AI時代對於工人的素質要求應該是更高而不是更低了,畢竟之後工作不僅是要和各種零件打交道,還要和各種數字化裝備程序打交道。未來的工人不僅是打螺絲,很可能是要成為半個工程師。
而在這方面我國基礎教育的紮實程度相比於美國已經崩潰的K12公立教育要領先太多了,這個我相信有出國留學經驗的朋友應該都有感觸。
甚至我可以這麼說,AI在美國甚至很難引發軍事裝備領域的系統革命,因為在很多人認為最關鍵的軍事工業和裝備生產領域,我們中國同樣也是世界上軍事裝備更新速度最快,新裝備技術水平前二的軍隊。
而在俄烏戰爭之後,大家都應該可以很明顯的感覺到,在俄國表現低於很多人想像的情況下,美國現在的軍工系統表現出相比於俄國更加超乎想像的費拉不堪,時至今日依舊不能提供足夠的裝備產能。
而且我們要有一個意識,那就是在2020年以前設計的武器,在硬體上就不可能支持大家想像中的基於大模型指揮的軍事行動。
比如美國現在最先進的F35定型在2000年代,而一般認為F-35的中央處理器是基於PowerPC G4的第四代32位PowerPC微處理器,而它的水平大概相當於上世紀九十年代到00年代早期的先進水平。
而等到全面大改版的F-35Block4服役的時候,已經至少要到2028年了。這還是美國最先進的戰鬥機。
如果說內置計算機本地帶大模型不可行,那使用雲端數據通路連接行不行呢?很遺憾,軍用數據鏈帶寬也不夠。現在大多數軍用數據鏈的定型時間都比較早,他們可以保持很遠距離內的低速穩定溝通。
但是大家想像中的大模型所需要的數據溝通能力,至少美國人公開使用的軍用數據鏈並不支持。
更何況美國裝備平均年齡沒有40也有30年了。
在大規模生產、裝備年齡、機器人化程度等方面都比不過中國的美國,想用AI引發工業革命或者軍事裝備革命,很藍的啦。
所以從政策效果推演的角度來說,這種脫鉤屬於那種我不知道該干點什麼,但是總得干點什麼,不然我焦慮呀!
03
這種政策的制定絕對是對中國半導體產業的巨大利好。首先美國現階段的政策議題就是基於主觀意願和政治正確制定的。在經歷了數年的政策薰陶和規訓之後,限制中國半導體發展和AI發展已經成為了美國絕對的政治正確。
但是這有個巨大的政治正確就必然意味著一個巨大的漏洞,因為還是那句話:摧毀一國工業的最好方法永遠是傾銷。
這一下美國主動停止了對我們的高端半導體傾銷。如此一來為了自保,國內公司不論願不願意買國產貨,都會增加國產高端半導體的訂單。
工業最重要的是一個穩定的預期,穩定的次等貨源好過十全十美的不穩定貨源,這句話即使是到了AI時代也是至理名言。
而中國的高端AI晶片市場有多大呢?我們先看美國的數據,根據statista,美國AI晶片的市場容量在2022年是200億美元,到2030年大概是1650億美元,年復合增長預計是30%。
基於我們其他產業的體量推算,中國對AI晶片的需求,應該至少不會低於美國的,畢竟我們無論是汽車,還是鋼鐵,或者手機什麼的,產能和需求量都是美國的數倍乃至十倍以上。
美國既然從零和博弈的角度,從A100和4090都開始限制起來,那就不會短時間解禁並且傾銷的。中國這未來萬億人民幣級別的AI晶片市場,我國晶片廠商只要突破高端,就能拿到千億級別的潛在營收。
而這個空間是有來自世界帝國政治限制帶來的商業空間確定性,以及最強工業國出於國家安全和全國對美不信任心理的第二重政策保證。這個誘惑真的太大了。
對英偉達和英特爾他們來說,這本來應該是他們公司吃大頭的地方。所以老黃他們才會堅定地反對相關政策。
在7月18日,耶倫訪華後,英特爾、英偉達和高通三巨頭就傳出要求美國政府放寬對華晶片出口,甚至有紐約時報的記者透露:英特爾的高管當面質疑美國國家安全顧問傑克·沙利文「懂不懂半導體」。
當然感謝美國人,在三巨頭大鬧之後。美國眾議院直接打臉,對高通的子公司高通創投發了一封正式函,要求高通創投交出在AI,半導體和量子領域投資的信息。然後就是針對中國半導體封鎖的升級。
這裡還有一個網傳的趣事。喜歡軍事的朋友應該對美國一個著名智庫:戰略與國際研究中心,CSIS,並不陌生,這是一家偏重國家安全的智庫(筆者之前申請過實習,沒有過)。
最近有一則消息傳了出來,由於這家智庫不停的遊說美國政府推進相關禁令升級,英偉達老總,老黃,就打算和這家智庫「贊助」一下,然後想要CSIS換掉支持晶片禁令的研究負責人Gregory C. Allenx。
然後這哥們急了,就寫小作文,把事兒鬧大,英偉達就換不了,還被迫向CSIS捐了6.5萬美元,換取對方在報告裡面寫上一句「英偉達沒有不當行為」。
對於美國來說,從半導體開始,中美在高科技領域全面脫鉤,乃至經濟循環逐步脫鉤已經成為了一種華盛頓共識,同時他們也正在做著準備。今年早些時候被提出的S686法案就是一個典型。
我在中美脫鉤的文章中就提到了S686法案這種口袋罪,就是在為未來潛在的顛覆性對華脫鉤行動做準備,同時也在威懾當下對華的信息和高科技交流活動。這部法律如果走完全流程,會為未來美國搞事情留下巨大的法律空間。
比如他們對於外國對手控股信息和通信技術產品和服務中「控股」的定義就很逆天:
控股指的是擁有決定、指導或決定影響實體的重要事項的權力,無論是直接還是間接,無論是否行使。
( The term 「controlling holding」 means a holding with the power, whether direct or indirect and whether exercised or not exercised, to determine, direct, or decide important matters affecting an entity.)
哪怕你沒有持有一股股票,只要你能影響,你就是控股!我說的!
然後,只要定義中的外國實體「控股」了或者受制於外國對手的法律,只要涉及信息和通信技術行業,那就在S686法案的控制範圍之內。
然後更逆天的是,它的追溯時間範圍是:
包括當前、過去或潛在的未來交易。
這可以理論上無限追溯啊。
與上述東西相比,其他的,比如法案涵蓋範圍可以包括所有硬體、軟體、運營超過100萬個人信息、氪金之類的交易之流已經算是半常規操作,已經變得不那麼逆天了。
04
有很多人在擔心,我們現在最大的問題是產能不夠,美國斷供,我們不光尖端AI發展不了,未來其他都發展受限,畢竟如果有限的光刻機都去給手機供貨了,那留給AI晶片的高端光刻機就不多了。
這是我們的一個難點,現在我們也說不清楚中國大陸境內有多少光刻機能給高端晶片供貨。但是這裡我必須說但是。
在華為開售Mate60系列之前,我們也沒想到中國大陸的企業能這麼快量產高端晶片,而且現在據說已經將Mate60系列銷售量預期提高到了5000萬台以上。
這也就意味著,我們可能會做到,年產5000萬塊左右高端手機晶片的能力。
這給中國AI算力底座的國產供應能力帶來了無限遐想。而且另一個對於中國來說,有個好消息是AI大模型的晶片,單卡性能不必須特別好。就像4090和A100一樣,單卡性能肯定是4090強,但是A100設計上更加適合多卡集群工作。
也就是說抓大放小,專門設計,優化特定性能的AI大模型訓練理念是可以做到大力出奇蹟的。
而且2020年推出的A100這種門檻級晶片用的是和n+2工藝類似的台積電第二代7nm工藝製造。理論上來說,我國麒麟9000S的工藝已經摸到了製造A100級別晶片的門檻。
所以近期科大訊飛董秘、副總裁江濤,才在公司三季度業績說明會上再次確認,「當前華為昇騰 910B 能力已經基本做到可對標英偉達 A100。"
而華為也在各種場合不停地表達,自己將為中國AI發展提供的算力底座。
9月20日,在華為全聯接大會2023期間,華為常務董事、ICT基礎設施業務管理委員會主任、企業BG總裁汪濤發表了「加速行業智能化」主題發言,並正式發布了全新架構的昇騰AI計算集群Atlas 900 Super Cluster,這個全新的AI訓練集群可支持超萬億參數大模型訓練的,已經達到了世界頂級行列。
當然,即便是這樣,我們也會有不少的懷疑,就像我在mate60系列發售之前提到華為5G回歸和高端晶片回歸的時候,也會有很多人質疑我們能不能做到一樣。
我相信在中美兩國政策和市場的保駕護航之下,在中美兩國領導的鼎力支持下,在中美兩國人民的精誠合作下,我們半導體發展,雖然當下的過程是曲折的,但是未來的前途是光明的。
參考文獻:
美國商務部,「Commerce Strengthens Restrictions on Advanced Computing Semiconductors, Semiconductor Manufacturing Equipment, and Supercomputing Items to Countries of Concern 」
美國商務部,「Implementation of Additional Export Controls: Certain Advanced Computing Items; Supercomputer and Semiconductor End Use; Updates and Corrections"
路透社,「Exclusive: Nvidia offers new advanced chip for China that meets U.S. export controls」
路透社,「Nvidia tweaks flagship H100 chip for export to China as H800」
國際機器人聯合會 IFR,"China Overtakes USA in Robot Density"