GPU決戰新時代,本土廠商加速入局

2020-11-30     半導體行業觀察

原標題:GPU決戰新時代,本土廠商加速入局

在英偉達於2000年收購3DFX,以及AMD在2006年收購ATI之後,桌面GPU這個市場本來就已經塵埃落定。

英偉達是GPU市場當之無愧的巨頭,AMD的GPU則掙扎前行,而Intel則依靠其CPU的號召力,在集成顯卡市場擁有絕對的號召力,但在獨立顯卡市場,無論是之前的Intel 740還是後續的Larrabee都無疾而終。

但在Alex Krizhevsky使用英偉達GPU成功訓練出了深度卷積神經網絡AlexNet,並憑藉該網絡在圖像分類識別領域大幅提升了性能之後。人工智慧新時代正式開啟。也正是從這個時候開始,GPU市場開始進入了一個新階段。英偉達則成為這個時代當之無愧的大贏家。

英偉達從2012年到現在的股價走勢

英偉達叱吒AI時代的兩大利器

回看圖形處理器的發展史,據相關資料顯示,MIT在1951年製造的Whirlwind也許是世界上第一個3D圖形系統,但這不是現代GPU的基礎。據報道,現在的GPU雛形是基於上世紀70年代中期的所謂視頻移位器(video shifters)和視頻地址生成器(video address generators)組成的。

在歷經大型系統、小型工作站的發展後,圖像處理器在90年代中後期於PC上的3D遊戲而發揚光大,在此期間,不少公司湧入其中,英偉達也是其中的一家。據英偉達官網介紹,在他們成立的1993年,全球有超過二十家的圖形晶片公司,到1997年,這個數字猛增至70家。但到2006年,英偉達是唯一仍在運營的獨立公司,他們也成為最後的贏家。被其衝上沙灘的前浪包括了ATI、S3 Graphics和3DFx等競爭對手。

和其他玩家一樣,英偉達最初成立的時候也只是聚焦於顯卡市場,最初推出的兩款產品NV1和NV2也市場反響平平平。但英偉達不氣餒,投入大量的經歷去研發NV3,並在1997年推出。作為全球首個128位3D處理器,NV3在推出四個月後的出貨就突破一百萬。因為NV3能對OpenGL的良好支持,英偉達自NV3開始,逐漸打敗了當時市場占比高達85%的3DFx,成為了顯卡市場的霸主。

值得一提的是,英偉達表示,他們在1999年發明了GPU( 這是NVIDIA首創的詞彙,GPU即是Graphics Processing Unit的縮寫),而當年推出GeForce 256就是全世界第一款GPU。

如果英偉達接下來,還是只盯著圖形市場,那麼他們的充其量就就只是下一個3DFx,但黃仁勛有更大的野心,那就是把GPU推到通用市場,這就是大家所熟悉的GPGPU。

據半導體行業觀察之前的報道:「在2000年左右,學術界對於使用GPU做通用計算(GPGPU)產生了興趣。當時,主要面向執行通用算法的CPU是執行科學計算的主力,但是CPU為了能在通用算法上都有較好的性能,因此很多晶片面積事實上用在了片上內存和分支預測等控制邏輯,而真正用於計算的單元並不多。相反,GPU架構中的控制邏輯較為簡單,絕大多數晶片面積都用於渲染、多邊形等計算。學術界發現,科學運算中的矩陣等計算可以很簡單地映射到GPU的處理單元,因此能實現非常高的計算性能。」

報道進一步指出,當時,GPGPU最主要的瓶頸在於難以使用。由於GPU是面向圖像應用而開發,因此要在其編程模型中支持通用高性能計算並不容易,需要許多手工調試和編碼,因此造成了很高的門檻,能熟練使用的人並不多。

為了讓GPU從軟硬體都走向通用,英偉達在2006年推出了Tesla架構,一改之前使用矢量計算單元做渲染的做法,而是把一個矢量計算單元拆成了多個標量計算渲染單元。這就使得基於這個架構的GPU除了渲染能力強以外,還適合做通用計算。

也就是在這一年,英偉達推出了CUDA。按照他們的說法,這是一種用於通用GPU計算的革命性架構。CUDA將使科學家和研究人員能夠利用GPU的並行處理能力來應對其最複雜的計算挑戰。

正是得益於這兩個方向的布局,英偉達在AI時代如魚得水。

據行業專家所說,現在的雲端AI晶片市場,除了谷歌自用的TPU外,其他絕大多數的廠商都是使用英偉達的GPU來做相關的模型訓練,這讓英偉達在雲端AI晶片的市場居高不下。這也讓英偉達的業績在過去幾年屢創新高。根據賽迪顧文的預測數據顯示,光是國內的雲端AI晶片市場,在2019年到2021年間的累計增長將高達152%,麥肯錫也預測,在未來幾年,訓練市場將成長迅猛,且在未來十年,這還將是英偉達GPU的天下。

看到這個數據需求和預測,國外就湧現出了類似Graphcore IPU和Google TPU等ASIC產品,計劃在訓練市場挑戰英偉達。Intel和AMD則希望在GPU硬扛英偉達。

AMD和Intel的蠢蠢欲動

其實早在英偉達進軍GPGPU的前後,AMD也有了相應的計劃。但和英偉達屬在過去多年裡大力投入推行CUDA開發環境不一樣,AMD將雞蛋都放在了「OpenCL」這個籃子裡面,這就導致即使他們在2017年發布了ROCm平台來提供深度學習支持,但也改變不了他們GPU在AI時代幾無所獲的結局。

但AMD不甘心。為了與Nvidia競爭,AMD在今年三月份推出了新的CDNA架構。據介紹,這是AMD針對數據中心和其他用途的,專注於計算的GPU體系結構。AMD針對CDNA的目標既簡單又直接:構建一個大型的,功能強大的GPU系列,這些GPU針對一般的計算和數據中心使用進行了優化。

據介紹,新架構中很大一部分的性能提升將會體現在機器學習方面,這意味著支持更快地執行較小數據類型(例如INT4 / INT8 / FP16),而AMD在介紹新架構的時候也明確提到了張量運算。此外,新架構可以通過Infinity Fabric互連總線靈活設計性能,並支持增強的企業級RAS特性、安全、虛擬化技術,還將提供更高的能效比,從而降低企業TCO成本。

基於這個架構,AMD在本月中發布了新一代的Instinct MI100計算卡。數據顯示,新的架構可提供高達11.5 TFLOPS的FP64峰值吞吐量,這使其成為第一個在FP64中突破10 TFLOPS的GPU。與上一代MI50相比,新加速卡的性能提高了3倍。它還在FP32工作負載中擁有23.1 TFLOPS的峰值吞吐量。數據顯示,AMD的新加速卡在這兩個類別中都擊敗了Nvidia的A100 GPU。

Instinct MI100還支持AMD的新Matrix Core技術,該技術可提高FP32,FP16,bFloat 16,INT8和INT4等單精度和混合精度矩陣運算的性能,還可將FP32性能提高到46.1 TFLOPS。

為了更好地與英偉達競爭,AMD還表示,其開源ROCm 4.0開發人員軟體現在具有開源編譯器,並統一支持OpenMP 5.0,HIP,PyTorch和Tensorflow。

除了AMD外,Intel在最近幾年也加大在其GPU的投入,想在AI這個市場分一杯羹。

據英特爾介紹,公司的Xe架構GPU將覆蓋從集成顯卡到高性能計算的所有範圍。其中代號為Ponte Vecchio的獨立GPU則是公司面對HPC建模和仿真以及AI訓練而推出的設計。Ponte Vecchio將採用英特爾的7納米技術製造,並將成為英特爾首款針對HPC和AI工作負載進行了優化的基於Xe的GPU。但直到目前為止,尚未看到Intel的這款新品。

此外,為了更好地在包括AI在內的應用市場中發揮其包括CPU、GPU、FPGA和AISC在內的晶片的為例,方便開發者編程,Intel還推出了擁有遠達理想的OneAPI。在開發者看來,這是一個不錯的規劃,但同時也是一個極具挑戰的任務。

中國廠商加速入局

在GPU重要性日益凸顯的今日,國內越來越多的廠商開始投入到這個市場中去。這些廠商中除了有之前一直在這個市場布局的景嘉微、兆芯和航錦外,還有一些新進入這個領域的企業。當中尤其以壁仭、沐曦、海飛科、芯瞳最為知名。

首先看壁仞科技,據官網介紹,該公司創立於2019年,團隊由國內外晶片和雲計算領域核心專業人員、研發人員組成,在GPU、DSA(專用加速器)和計算機體系結構等領域具有深厚的技術積累和獨到的行業洞見。

在產品方面,壁仞科技致力於開發原創性的通用計算體系,建立高效的軟硬體平台,同時在智能計算領域提供一體化的解決方案。從發展路徑上,壁仞科技將首先聚焦雲端通用智能計算,逐步在人工智慧訓練和推理、圖形渲染、高性能通用計算等多個領域趕超現有解決方案,實現國產高端通用智能計算晶片的突破。

再看沐曦,則是由AMD前高管離職創立的公司。據介紹,沐曦集成電路成立於2020年9月,核心團隊來自世界一流的GPU晶片公司,平均擁有15年以上高性能GPU晶片設計經驗和豐富的5nm流片和7nm晶片量產經驗。公司致力於研發生產擁有自主智慧財產權的、安全可靠的高性能GPU晶片,服務數據中心、雲遊戲、人工智慧等需要高算力的諸多重要領域,填補國內高性能GPU晶片自主可控的空白。

海飛科(Hexaflake)則成立於2019年,是一家高科技初創公司,致力於AI高性能處理器晶片和軟硬體全棧系統解決方案的研發,是能夠在該領域與國際巨頭並駕齊驅的頭部AI通用型處理器公司。主要創始人及核心團隊匯聚中美各地多位國際頂級資深專家;專長涵蓋並行計算與AI處理器體系架構、GPU等超大規模SoC晶片以及處理器系統軟體的研發;並曾在國際領先企業核心研發部門長期任職,成功研製多款晶片和系統產品。他們公司成立的目的是共同打造新一代通用型AI處理器晶片及其軟硬體生態環境。

芯瞳半導體成立於2018年。在接受媒體採訪的時候,他們表示公司的GPU瞄準的應用領域有三個方面:嵌入式、辦公PC和雲遊戲。此外,還有授權了Imagination IP的芯動、繼承了相關GPU專利的兆芯以及一直做國產CPU的龍芯也是GPU市場的玩家。

考慮到國內的GPU現狀和中美之間的貿易狀況,上述GPU廠商除了有看中AI市場的玩家外,也有希望在圖形GPU市場有突破的創業者。

不過正如行業專家告訴筆者,無論是在圖形還是通用計算市場,對於GPU而言,更重要的是軟體和開發者生態。只有做好了這個,才是GPU能夠商用的前提。國內廠商中何時會有廠商能夠真正突圍成功的?這值得我們觀望。

文章來源: https://twgreatdaily.com/M1cNGXYBjdFTv4tAnElY.html