芯東西(公眾號:aichip001)
作者 | ZeR0
編輯 | 漠影
芯東西5月29日消息,繼上周因遠超預期的財報業績預測引得股價和市值飆漲後,今日,英偉達(NVIDIA)創始人兼CEO黃仁勛穿著標誌性的皮衣,意氣風發地出現在台北電腦展COMPUTEX 2023上,在主題演講期間先是現場給自家顯卡帶貨,然後一連公布涉及加速計算和人工智慧(AI)的多項進展。
面向生成式AI歷史性浪潮,英偉達的一系列發布包括:推出大內存生成式AI超級計算機DGX GH200,可加速生成式AI設計的Grace Hopper超級晶片GH200已全面投產,推出全新加速乙太網平台Spectrum-X,為遊戲提供定製化AI模型代工服務,與全球最大的營銷服務機構WPP合作打造生成式AI內容引擎。
英偉達還發布了MGX伺服器規範,為系統製造商提供快速高效構建100多種伺服器配置的模塊化參考架構。在製造業,多家世界頂級電子製造商採用英偉達生成式AI工具與Omniverse平台構建先進的數字工廠。
黃仁勛說,有超過1600家生成式AI公司採用了英偉達技術。
目前,英偉達最新市值為9632億美元,離「萬億市值俱樂部會員」只差臨門一腳。一旦突破萬億大關,英偉達將成為美股市值第五大公司、第七家市值越過1萬億美元的美國上市公司,以及第一家由華人創立的萬億美元市值公司。
一、生成式AI超算堪比「巨型GPU」:E級算力,谷歌雲、Meta、微軟首批試用
首先來看下英偉達今日推出的採用英偉達最新GPU和CPU的系統巔峰之作——新型大內存AI超級計算機DGX GH200。
這台超算預計今年年底問世,旨在為生成式AI語言應用、推薦系統、數據分析工作負載開發大型下一代模型。黃仁勛認為,生成式AI、大型語言模型和推薦系統是現代經濟的數字引擎。
據他介紹,DGX GH200 AI超級計算機集成了英偉達最先進的加速計算和網絡技術。
DGX GH200是首款將Grace Hopper超級晶片與英偉達NVLink Switch系統搭配的超級計算機,通過採用新互連方式,將256個Grace Hopper超級晶片連接在一起,使它們能像單個巨型GPU一樣協同運行,從而提供了1EFLOPS的性能和144TB的共享內存,比2020年推出的上一代DGX A100 320GB系統的內存多出近500倍。
谷歌雲、Meta、微軟等是首批獲得DGX GH200訪問權限、用於生成式AI工作負載的公司。英偉達也打算將DGX GH200設計藍圖提供給雲服務商及其他超大規模計算廠商,以便他們可以進一步為其基礎設施定製DGX GH200。
此外,英偉達正在打造自己的基於DGX GH200的大型AI超級計算機NVIDIA Helios,以支持其研究和開發團隊的工作。它採用4個DGX GH200系統,每個都將與英偉達Quantum-2 InfiniBand網絡連接,帶寬高達400Gb/s,以提高訓練大型AI模型的數據吞吐量。Helios將包括1024顆Grace Hopper超級晶片,將於今年年底上線。
DGX GH200超級計算機包含英偉達軟體,可為AI和數據分析工作負載提供全套解決方案。英偉達Base Command軟體提供AI工作流管理、企業級集群管理、加速計算、存儲和網絡基礎設施的庫,以及為運行AI工作負載而優化的系統軟體。英偉達AI平台的軟體層AI Enterprise提供了100多個框架、預訓練模型和開發工具,以簡化AI生產的開發和部署。
二、生成式AI的引擎: GH200 Grace Hopper超級晶片全面投產
英偉達宣布,GH200 Grace Hopper超級晶片已全面投產,將為運行複雜的AI和高性能計算工作負載提供動力。
基於GH200的系統加入了全球系統製造商基於英偉達最新Grace、Hopper、Ada Lovelace架構的400多個系統配置。
GH200 Grace Hopper超級晶片採用NVIDIA NVLink-C2C互連技術,將基於Arm的英偉達Grace CPU和Hopper GPU架構組合在同一封裝中,提供了高達900GB/s的總帶寬——比傳統加速系統中的標準PCIe Gen5通道帶寬高7倍,互連功耗降低到原來的1/5,能夠滿足苛刻的生成式AI和高性能計算(HPC)應用。
位於歐美的幾家全球超大規模計算企業和超算中心客戶將可使用GH200驅動的系統。採用GH200的系統預計將於今年晚些時候上市。
三、推出新型加速乙太網平台,正打造數億美元生成式AI超算
黃仁勛還宣布推出NVIDIA Spectrum-X,這是一個旨在提高基於乙太網的AI雲的性能和效率的網絡平台。
它基於網絡創新,將英偉達Spectrum-4乙太網交換機與英偉達BlueField-3 DPU緊密耦合,實現了相比傳統乙太網結構1.7倍的整體AI性能和能效提升,並通過性能隔離增強了多租戶功能,在多租戶環境中保持一致、可預測的性能。
Spectrum-X具有高度通用性,可用於各種AI應用。它使用完全基於標準的乙太網,並可與基於乙太網的堆棧互操作。該網絡平台由英偉達加速軟體和軟體開發工具包(SDK)進行增強,支持開發者構建軟體定義的雲原生AI應用程式。端到端功能的交付減少了大規模基於Transformer的生成式AI模型的運行時間。
該平台支持256個200Gb/s埠,通過單個交換機連接,或在兩層leaf-spine拓撲中提供16000個埠,以支持AI雲的增長和擴展,同時保持高水平的性能並最大限度地減少網絡延遲。
全球領先的雲計算提供商正在採用Spectrum-X平台擴展生成式AI服務。Spectrum-X、Spectrum-4交換機、BlueField-3 DPU等現已在戴爾、聯想、超微等系統製造商處提供。
作為Spectrum-X參考設計的藍圖和測試平台,英偉達正在其以色列數據中心構建一台超大規模生成式AI超級計算機Israel-1。
這台AI超算價值數億美元,將採用戴爾PowerEdge XE9680伺服器、英偉達HGX H100超級計算平台、內置BlueField-3 DPU和Spectrum-4交換機的Spectrum-X平台。
四、發布MGX伺服器規範,提供模塊化參考架構
為了滿足各種規模的數據中心的需求,黃仁勛發布了NVIDIA MGX伺服器規範,為系統製造商提供了模塊化參考架構。系統製造商可使用它快速且經濟高效地構建100多種伺服器配置,以適應廣泛的AI、HPC及NVIDIA Omniverse應用。
MGX支持英偉達全系列GPU、CPU、DPU和網絡適配器,以及各種x86及Arm處理器。其模塊化設計使系統製造商能夠更有效地滿足每個客戶的獨特預算、電力輸送、熱設計和機械要求。
永擎(ASRock Rack)、華碩(ASUS)、技嘉(GIGABYTE)、和碩(Pegatron)、QCT、超微(Supermicro)等將採用MGX構建下一代加速計算機,可將開發成本削減多達3/4,並將開發時間縮短2/3至僅需6個月。
有了MGX,製造商可以從為其伺服器機箱加速計算優化的基本系統架構開始,然後選擇GPU、DPU和CPU。AI訓練和5G等多項任務可以在一台機器上處理,升級到下一代硬體也很方便。MGX還能輕鬆集成到雲和企業數據中心中。
不同於英偉達HGX,MGX提供了與英偉達產品靈活的多代兼容性,以確保系統構建者可以重用現有設計並輕鬆採用下一代產品。同樣MGX也提供英偉達完整軟體堆棧的支持。
QCT和超微將率先進入市場,MGX的設計將於8月面世。超微今日公布的ARS-221GL-NR系統將採用Grace CPU,而QCT的S74G-2U系統將採用Grace Hopper。
黃仁勛還宣布,英偉達與日本電信巨頭軟銀合作,在日本建立一個分布式數據中心網絡。它將在一個共同的雲平台上提供5G服務和生成式AI應用。
數據中心將在模塊化MGX系統中使用Grace Hopper、BlueField-3 DPU以及Spectrum乙太網交換機,以提供5G協議所需的高精度定時。該平台將通過提高頻譜效率來降低成本,同時降低能耗。
這些系統有助於探索自動駕駛、AI工廠、AR/VR、計算機視覺和數字孿生等領域的應用。未來的用途可能包括3D視頻會議和全息通信。
五、ACE代工服務:用生成式AI激活遊戲角色生命,支持雲端及PC低成本部署
生成式AI將改變玩家與遊戲角色間的互動方式,並極大提高遊戲的沉浸感。對此,黃仁勛宣布推出面向遊戲的NVIDIA Avatar雲引擎(ACE)。
這是一項定製AI模型代工服務,中間件、工具和遊戲開發者可以使用它來構建和部署定製的語音、對話和動畫AI模型。它能賦予非玩家角色(NPC)更智能且不斷進化的對話技能,使其能夠以栩栩如生的個性來回答玩家的問題。
基於英偉達Omniverse,ACE for Games為語音、對話和角色動畫提供了優化的AI基礎模型,包括:英偉達NeMo,使用專有數據,構建、定製和部署語言模型;英偉達Riva,用於自動語音識別和文本轉語音,以實現實時語音對話;英偉達Omniverse Audio2Face,用於即時創建遊戲角色的表情動畫,以匹配任何語音軌道。
開發人員可以集成整個NVIDIA ACE for Games解決方案,也可以只使用他們需要的組件。
英偉達與專注於為虛擬遊戲世界開發先進對話AI的英偉達Inception初創公司Convai合作,展示了如何快速用英偉達ACE for Games來構建遊戲NPU。在一款名為Kairos的演示中,玩家與拉麵店的供應商Jin互動。基於生成式AI,Jin雖是個NPC,卻能擬真地回答自然語言問題,且回答內容與敘述的背景故事一致。它是在虛幻引擎5中使用最新光線追蹤功能和英偉達DLSS渲染的。
支持英偉達ACE for Games的神經網絡針對不同的功能進行了優化,有不同的大小、性能和質量折中。ACE for Games代工服務將幫助開發者為其遊戲重新調整模型,然後通過英偉達DGX Cloud、GeForce RTX PC或本地部署進行實時推理。這些模型針對延遲進行了優化,有助於優化遊戲的沉浸式交互體驗。多家遊戲開發商和初創公司已採用英偉達的生成式AI技術。
黃仁勛還介紹了英偉達和微軟如何在生成式AI時代合作推動Windows PC的創新。
新的和增強的工具、框架和驅動程序使PC開發者更容易開發和部署AI。例如,用於優化和部署GPU加速AI模型和新圖形驅動程序的微軟Olive工具鏈將提高帶有英偉達GPU的Windows PC上的DirectML性能。此次合作將增強和擴展搭載RTX GPU的1億台PC的安裝基礎,可提升400多個AI加速的Windows應用程式和遊戲的性能。
六、英偉達與WPP合作,為數字廣告打造生成式AI內容引擎
生成式AI也正為價值7000億美元的數字廣告行業帶來了新機遇。基於NVIDIA AI和Omniverse的突破性引擎將來自領先軟體製造商的創意3D和AI工具連接在一起,以大規模革新品牌內容和體驗。
全球最大的營銷服務機構英國WPP集團正與英偉達合作,在Omniverse Cloud上構建首個生成式AI內容引擎,使創意團隊能夠更快、更高效、更大規模地製作高質量的商業內容,同時與客戶的品牌保持完全一致。
新引擎連接了3D設計、製造和創意供應鏈工具的生態系統,包括來自Adobe和Getty Images的工具。在演講中,黃仁勛展示了創意團隊如何將他們的3D設計工具連接起來,在Omniverse中構建客戶產品的數字孿生。生成式AI的內容經過負責任的數據來源訓練,並與英偉達Picasso一起構建,將使其能快速生成虛擬集。然後WPP客戶可使用完整的場景生成大量廣告、視頻和3D體驗,供全球市場和用戶在任何網絡設備上體驗。
WPP執行長馬克·里德(Mark Read)說,生成式AI正以驚人的速度改變營銷世界,WPP與英偉達合作所提供的獨特競爭優勢是當今市場上其他客戶無法獲得的,這項新技術將改變品牌為商業用途創建內容的方式,並鞏固WPP在為世界頂級品牌創造性應用AI方面的行業領導者地位。
七、電子製造商採用生成式AI,實現數字化的智能工廠
全球電子製造商正在使用一種全新的綜合參考工作流程推進其工業數字化工作,在廣泛合作夥伴網絡的支持下,該工作流程結合了英偉達用於生成式AI、3D協作、仿真和自主機器的技術,可幫助製造商規劃、構建、運營和優化其工廠。
這些技術包括:英偉達Omniverse,它連接了頂級計算機輔助設計應用以及生成式AI的API和前沿框架;用於模擬和測試機器人的英偉達Isaac Sim應用程式;英偉達Metropolis視覺AI框架,用於自動光學檢測。
「世界上最大的工業生產物理產品。先用數字化構建它們可節省大量成本。」他談道,英偉達使電子製造商能輕鬆構建和運營虛擬工廠,將其製造和檢驗工作流程數字化,並大大提高質量和安全,減少代價高昂的最後一刻意外和延誤。
黃仁勛現場展示了一個完全數字化的智能工廠的演示。
富士康工業網際網路、宜鼎國際、和碩、廣達和緯創正在使用新的參考工作流程,以優化他們的工作單元和裝配線運營,同時降低生產成本,具體用例包括電路板質保檢測點自動化、光學檢測自動化、建設虛擬工廠、模擬協作機器人、構建及運營數字孿生等。
英偉達正在與幾家領先的製造工具和服務提供商合作,構建一個全棧、單一的架構,每個架構都適用於每個工作流程級別。
在系統層面,英偉達IGX Orin提供了一個一體化的邊緣AI平台,將工業級硬體與企業級軟體和支持相結合。IGX滿足邊緣計算獨特的耐用性和低功耗要求,同時提供開發和運行AI應用程式所需的高性能。其製造商合作夥伴們正在開發IGX驅動的系統,以服務於工業和醫療市場。
在平台層面,Omniverse連接了世界領先的3D、模擬和生成式AI提供商。團隊可在他們最喜歡的應用程式之間構建互操作性,比如來自Adobe、Autodesk和Siemens的應用程式。
結語:生成式AI正催生大量加速計算需求
生成式AI等變革性技術正滲透到消費者的生活方式中,並在醫療、金融、商業服務等許多行業催生新的商機,隨著越來越多企業加入AI競爭,數據中心性能正邁向下一個階段。訓練AI大模型是一項資源和時間密集型任務,需要強大、綠色、可擴展的基礎設施,以滿足不斷增長的加速計算能力、減少碳排放、控制成本等多方面的需求。
英偉達今日發布的一系列硬體基礎設施及軟體工具,目的性非常明確地圍繞企業開發和部署生成式AI應用的核心痛點,通過先進互連技術和共享內存設計突破大規模AI的算力瓶頸,提供更快的計算性能、更高的能效以及加速開發流程的工具。這將幫助企業及研究機構節省大量時間和成本,將生成式AI用於解決科研挑戰、優化工作流程和增強商業競爭力。