超越4090一萬倍！英偉達的GPU強大到讓人害怕

從最開始的AI繪圖到如今的語言大模型、chatGPT等等，AI人工智慧已經是各大網際網路企業的新發展方向。借著AI浪潮，英偉達也順利成為新興行業的領軍人物。近兩年英偉達憑藉著數據中心業務，從一家開發遊戲硬體的企業變成了全球最大的算力供應商。今年英偉達也召開了多場發布會，但黃仁勛提到最多的不是遊戲，而是生成式AI、數據中心、加速計算等新名詞。

數據中心業務崛起並不代表英偉達放棄了遊戲業務。目前英偉達的RTX 4090依然是頂級消費級GPU顯卡，性能遠超AMD和英特爾，而英偉達占據了80%以上遊戲市場份額，遊戲玩家的首選顯卡依然是NVIDA。

筆者了解到，英偉達當前市值已突破1.1萬億，全球第一家市值突破萬億美元的晶片公司，也是當前市值僅次於蘋果、微軟、Alphabet、亞馬遜的美股第五大科技股。

英偉達的計算卡已經成為衡量企業實力的標準之一，誰擁有NVIDA的計算卡越多，證明這家企業算力越強，開發資源就豐富，潛力越大。

例如我們所熟知的微軟、Meta、亞馬遜、騰訊、網易等網際網路大廠都在爭搶英偉達的H100、A100、A800等計算卡。

因為英偉達的產品性能過於強大，導致美國政府推出限制出口政策，當年國內市場已經出現一卡難求，部分顯卡價格瘋漲。

針對龐大的市場需求，英偉達已經加大產能，並且持續更新換代產品。今年5月的台北電腦展上，英偉達展示了用256個GH200 Grace Hopper超級晶片組成的超級計算機DGX GH200。DGX GH200人工智慧超級計算平台所提供的AI算力是RTX 4090的一萬倍！

筆者了解到， Grace Hopper超級晶片已經全面投產，這是DGX GH200超算平台和MGX系統的核心組件，專為處理海量的生成型人工智慧任務而設計。

Grace Hopper 超級晶片是英偉達開發的基於Arm架構的CPU+GPU集成方案，將72核的Grace CPU、Hopper GPU、96GB的HBM3和512GB的LPDDR5X集成在同一個封裝中，共有 2000億個電晶體。這種組合提供了CPU和GPU之間驚人的數據帶寬，高達1TB/S，為某些內存受限的工作負載提供了強大的性能。

目前最新的DGX GH200超算平台搭載HBM3e內存，內存容量從每個GPU96GB擴展到144GB，增加了50%。筆者了解到，HBM3e內存是一種新型的高帶寬內存技術，在運算速度上HBM3e能比HBM3運算速度快50%，提供最高5TB/秒的傳輸速率。新內存讓新GH200運行AI模型的速度提高了3.5倍。

DGX GH200超算平台內存能達到282GB，相比上代產品，容量增加了3.5倍，帶寬增加了3倍。GH200還支持英偉達的NVLink，可以根據企業的需求組合成不同規模的形態，單卡、雙卡、多卡伺服器、機櫃，甚至是超級計算機。

GH200可以組合成256張卡的DGX GH200SuperPod超級計算機，擁有144TB的快速內存，每秒可以執行10的18次方次浮點運算。如果單個DGX GH200超算平台還不能滿足需求，英偉達還有專門的伺服器機櫃，官方人員會上門調試安裝，一站式服務。總之，企業想要提升運算速度，只需要增加更多的伺服器機櫃就行。

按照官方說法，曾經1億美元預算，只能建設一個小的數據中心，而且還需要購買800個×86GPU，耗費5兆瓦的電力。如果選擇英偉達Grace Hopper計算方案，成本僅800萬美元就能達到同等工作量。如果預算是1億美元，選英偉達的Grace Hopper僅耗費3兆瓦的電力，而且數據吞吐量還能提高一個數量級。總之，同樣的預算，英偉達的方案更省電，而且算力更高。而同樣的算力，英偉達的成本更低。

筆者了解到，新款HBM3e內存的DGX GH200超算平台需要等到2024年的第二季度上市。而搭載普通HBM3內存的GH200按原計劃在今年下半年正式發售。

針對個人開發者和小型企業，英偉達推出了新一代工作站顯卡：RTX 5000、RTX 4500以及RTX 4000。RTX 5000採用了第4代Tensor Core和第3代RT Core，相比上一代GPU，單精度浮點運算性能提升了2倍，達到了90TFLOPS的峰值，配備高達32GB的GDDR6視頻內存，支持ECC錯誤校驗，適用於高端工作站、數據中心和雲遊戲。

RTX 4500配備24GB GDDR6視頻內存，也支持ECC校驗。光線追蹤性能提升1倍，AI處理性能提升2倍，適合創意專業用戶、小型工作站。RTX 4000是相同的GPU核心，配備20GB GDDR6視頻內存，光線追蹤和AI計算性能都有大幅提升。全新的RTX 5000已經發售，其餘兩款產品將在下半年陸續上市。

雖然AI的功能很強大，但部署AI大模型非常繁瑣，門檻過高。為了降低門檻，英偉達將推出AI Workbench工具包。筆者了解到，AI Workbench提供配置AI模型所需框架、工具開發包等環境。開發人員能夠在PC或工作站上快速創建、測試和自定義預訓練的生成式AI模型，然後擴展到數據中心、公共雲或NVIDIA DGX雲。

如果你想使用AI模型來繪圖，但沒有強大的硬體提供算力，也不懂如何部署模型，但有了AI Workbench，只需要選擇一個4個RTX 6000雲工作站，然後就能一鍵配置AI模型。如果對生成圖片不滿意，還可以自己上傳圖片，重新訓練模型後再生成。

過去，由於硬體算力的限制，訓練AI模型需要成千上萬張A100顯卡才能完成，不僅成本過高，而且難度也很大，效率較低。但現在有了DGX GH200，企業就不需要部署龐大的計算機集群，僅需要一套超算平台，就能完成工作任務。

筆者認為，英偉達的產品極大降低了AI行業門檻，無論你是個人，還是小微企業，只需要一個工具包，就能自己部署、訓練AI模型，成功跨入AI時代。

超越4090一萬倍！英偉達的GPU強大到讓人害怕

為何現在的電腦大都沒有光碟機？光碟會不會像軟盤一樣被淘汰？

高通要放大招了！驍龍8 Gen3還真有點實力

23億美元造價！拉斯維加斯球體LED建築何時才能賺回成本？

給AMD一點震撼！酷睿Ultra架構又要增加「小小核」

系列首款曲面屏手機！紅米Note 13 Pro+值得買嗎？

智慧型手機出貨量屢創新低，為何大家對華為、蘋果新機卻熱情高漲？

都是5999元，華為Mate 60和iPhone 15怎麼選

面對資本不斷擴張，B站的初心還在嗎？10年老粉有話說

AMD學壞了！對標4070的顯卡敢賣4099元

功能強大而且持久，OPPO的智能手錶竟然還能體檢！

讓我看看究竟還有誰願意花3000多塊錢買iPhone SE？

相差四百元，一加Ace 2 Pro和紅米K60至尊版選哪個？

1000元預算，哪部手機才是性價比之王？

憑什麼？英特爾顯卡竟然是亞運會硬體供應商！

三星14寸平板很厲害，倘若小米賣3599，閣下又當如何應對？

12代之後，再無賽揚奔騰！G6900和G7400究竟啥水平？

生死之戰！做高端摺疊屏手機，小米這次成了嗎？

小米這款新產品，你閉著眼睛買，都不會後悔！

小米太狠了，完全不想掙錢！新機賣2599元，其他廠商怎麼活？

我家狗會後空翻，你要不要來看看？

我找到了一款最適合學生黨的千元安卓平板！

蘋果電腦又降價了！搭載M2晶片，怎麼就沒人買？

超越4090一萬倍！英偉達的GPU強大到讓人害怕

RTX 4060 Ti到底是不是「智商稅」顯卡？