超越4090一萬倍!英偉達的GPU強大到讓人害怕

2023-08-11     科研市

原標題:超越4090一萬倍!英偉達的GPU強大到讓人害怕

從最開始的AI繪圖到如今的語言大模型、chatGPT等等,AI人工智慧已經是各大網際網路企業的新發展方向。借著AI浪潮,英偉達也順利成為新興行業的領軍人物。近兩年英偉達憑藉著數據中心業務,從一家開發遊戲硬體的企業變成了全球最大的算力供應商。今年英偉達也召開了多場發布會,但黃仁勛提到最多的不是遊戲,而是生成式AI、數據中心、加速計算等新名詞。

數據中心業務崛起並不代表英偉達放棄了遊戲業務。目前英偉達的RTX 4090依然是頂級消費級GPU顯卡,性能遠超AMD和英特爾,而英偉達占據了80%以上遊戲市場份額,遊戲玩家的首選顯卡依然是NVIDA。

筆者了解到,英偉達當前市值已突破1.1萬億,全球第一家市值突破萬億美元的晶片公司,也是當前市值僅次於蘋果、微軟、Alphabet、亞馬遜的美股第五大科技股。

英偉達的計算卡已經成為衡量企業實力的標準之一,誰擁有NVIDA的計算卡越多,證明這家企業算力越強,開發資源就豐富,潛力越大。

例如我們所熟知的微軟、Meta、亞馬遜、騰訊、網易等網際網路大廠都在爭搶英偉達的H100、A100、A800等計算卡。

因為英偉達的產品性能過於強大,導致美國政府推出限制出口政策,當年國內市場已經出現一卡難求,部分顯卡價格瘋漲。

針對龐大的市場需求,英偉達已經加大產能,並且持續更新換代產品。今年5月的台北電腦展上,英偉達展示了用256個GH200 Grace Hopper超級晶片組成的超級計算機DGX GH200。DGX GH200人工智慧超級計算平台所提供的AI算力是RTX 4090的一萬倍!

筆者了解到, Grace Hopper超級晶片已經全面投產,這是DGX GH200超算平台和MGX系統的核心組件,專為處理海量的生成型人工智慧任務而設計。

Grace Hopper 超級晶片是英偉達開發的基於Arm架構的CPU+GPU集成方案,將72核的Grace CPU、Hopper GPU、96GB的HBM3和512GB的LPDDR5X集成在同一個封裝中,共有 2000億個電晶體。這種組合提供了CPU和GPU之間驚人的數據帶寬,高達1TB/S,為某些內存受限的工作負載提供了強大的性能。

目前最新的DGX GH200超算平台搭載HBM3e內存,內存容量從每個GPU96GB擴展到144GB,增加了50%。筆者了解到,HBM3e內存是一種新型的高帶寬內存技術,在運算速度上HBM3e能比HBM3運算速度快50%,提供最高5TB/秒的傳輸速率。新內存讓新GH200運行AI模型的速度提高了3.5倍。

DGX GH200超算平台內存能達到282GB,相比上代產品,容量增加了3.5倍,帶寬增加了3倍。GH200還支持英偉達的NVLink,可以根據企業的需求組合成不同規模的形態,單卡、雙卡、多卡伺服器、機櫃,甚至是超級計算機。

GH200可以組合成256張卡的DGX GH200SuperPod超級計算機,擁有144TB的快速內存,每秒可以執行10的18次方次浮點運算。如果單個DGX GH200超算平台還不能滿足需求,英偉達還有專門的伺服器機櫃,官方人員會上門調試安裝,一站式服務。總之,企業想要提升運算速度,只需要增加更多的伺服器機櫃就行。

按照官方說法,曾經1億美元預算,只能建設一個小的數據中心,而且還需要購買800個×86GPU,耗費5兆瓦的電力。如果選擇英偉達Grace Hopper計算方案,成本僅800萬美元就能達到同等工作量。如果預算是1億美元,選英偉達的Grace Hopper僅耗費3兆瓦的電力,而且數據吞吐量還能提高一個數量級。總之,同樣的預算,英偉達的方案更省電,而且算力更高。而同樣的算力,英偉達的成本更低。

筆者了解到,新款HBM3e內存的DGX GH200超算平台需要等到2024年的第二季度上市。而搭載普通HBM3內存的GH200按原計劃在今年下半年正式發售。

針對個人開發者和小型企業,英偉達推出了新一代工作站顯卡:RTX 5000、RTX 4500以及RTX 4000。RTX 5000採用了第4代Tensor Core和第3代RT Core,相比上一代GPU,單精度浮點運算性能提升了2倍,達到了90TFLOPS的峰值,配備高達32GB的GDDR6視頻內存,支持ECC錯誤校驗,適用於高端工作站、數據中心和雲遊戲。

RTX 4500配備24GB GDDR6視頻內存,也支持ECC校驗。光線追蹤性能提升1倍,AI處理性能提升2倍,適合創意專業用戶、小型工作站。RTX 4000是相同的GPU核心,配備20GB GDDR6視頻內存,光線追蹤和AI計算性能都有大幅提升。全新的RTX 5000已經發售,其餘兩款產品將在下半年陸續上市。

雖然AI的功能很強大,但部署AI大模型非常繁瑣,門檻過高。為了降低門檻,英偉達將推出AI Workbench工具包。筆者了解到,AI Workbench提供配置AI模型所需框架、工具開發包等環境。開發人員能夠在PC或工作站上快速創建、測試和自定義預訓練的生成式AI模型,然後擴展到數據中心、公共雲或NVIDIA DGX雲。

如果你想使用AI模型來繪圖,但沒有強大的硬體提供算力,也不懂如何部署模型,但有了AI Workbench,只需要選擇一個4個RTX 6000雲工作站,然後就能一鍵配置AI模型。如果對生成圖片不滿意,還可以自己上傳圖片,重新訓練模型後再生成。

過去,由於硬體算力的限制,訓練AI模型需要成千上萬張A100顯卡才能完成,不僅成本過高,而且難度也很大,效率較低。但現在有了DGX GH200,企業就不需要部署龐大的計算機集群,僅需要一套超算平台,就能完成工作任務。

筆者認為,英偉達的產品極大降低了AI行業門檻,無論你是個人,還是小微企業,只需要一個工具包,就能自己部署、訓練AI模型,成功跨入AI時代。

文章來源: https://twgreatdaily.com/049d74cec5b015e3386b0a4cf096c84e.html