「應對生成式AI的發展和挑戰，應該從算力系統、AI Infra、算法模型、產業生態四個層面創新，通過大模型算力效率、模型算法等創新有效提升基礎大模型能力，以健康產業生態助推『百模千行』應用落地。」浪潮信息高級副總裁劉軍在以「智算力系統創新，加速生成式AI的產業發展」為題的演講中表示。

該演講來自於11月29日在北京舉辦的2023人工智慧計算大會。會上，國際數據公司（IDC）與浪潮信息聯合發布《2023-2024中國人工智慧計算力發展評估報告》（以下簡稱《報告》）。

圖丨劉軍（來源：資料圖）

聯合IDC發布《2023-2024中國人工智慧計算力發展評估報告》

據了解，自2018年以來，該《報告》已連續發布六次。其以洞察AI算力發展趨勢為宗旨，從算力發展、地域分布、行業AI算力對比等維度出發，對中國人工智慧計算力的發展進行了綜合評估，以期為行業客戶和技術提供商提供更加具有針對性的行動建議。

生成式AI，是今年《報告》的核心主題。其指出，在生成式AI的帶動下，人工智慧計算力的發展趨勢迎來三大變化。首先是計算範式的改變。生成式AI的發展，驅動了算力基礎設施的建設，也推進人工智慧在雲、邊、端的覆蓋。同時，應用場景的多樣化，讓底層基礎設施呈現多元化發展態勢。其次是產業動量的改變。生成式AI會重構人們的生活和生產方式，給自動駕駛、醫療等領域帶來深入影響；AI算力、算法等產業變量也會助力算力生態鏈繁榮。最後是算力服務格局的改變。生成式AI與雲計算的服務方式不同，企業在對其進行訓練時，除了可以自行構建訓練平台，還能通過租賃算力服務的方式滿足訓練需求，這為算力服務市場帶來了新機會。

中國人工智慧計算力城市排行，是該《報告》中值得關注的一大亮點。最新排行榜單顯示，北京、杭州、深圳、上海和蘇州排名前5位，廣州、濟南、合肥、重慶和成都則位列前十名。可以看出，排名的背後，是生成式AI對於不同區域在算力投資上的重要拉動。排名靠前的城市，不管是大模型企業的生態發展，還是包括智算中心平台的算力基礎設施建設，都處於領先水平。

（來源：資料圖）

中國人工智慧應用場景的發展情況，則是該《報告》中的又一關鍵內容。目前，生成式AI應用正在快速發展，並進一步賦能到各行各業。從領域來看，知識管理、對話式應用、代碼生成將是企業應用生成式AI的主要領域；從行業來看，網際網路仍是生成式人工智慧技術應用和研發的主戰場，金融業較早使用生成式AI，製造業還處於早期階段，醫療業的應用正在加速進行，能源、零售、教育等行業在不斷推進。

總結該《報告》可以得出，生成式AI為我們帶來了很多新機會。同時，也不可避免地會有新的挑戰不斷產生。那麼，該如何從智算力系統層面上，應對生成式AI帶來的發展和挑戰呢？如上所說，浪潮信息認為應該從算力系統、AI軟體基礎設施、算法模型和產業生態這四個方面進行綜合考慮。

基於計算、存儲和網絡開展算力系統創新

算力系統方面，主要在計算、數據和互聯上存在挑戰。基於此，浪潮信息提供了如下解決之道。

其一，打造開放多元的AI算力平台。最新發布的G7新一代多元算力平台，可兼容國內外高端AI訓練晶片，能應對目前的算力多元化趨勢，為客戶的AI業務提供良好的算力支撐。

其二，研發開放加速的計算架構，可實現896GB每秒的互聯帶寬，整個集群的性能加速比超過90%，能保障更大規模的集群擴展性能。

其三，開發一套能同時支持文件、大數據等非結構化協議的集群系統，滿足AI時代的數據存儲需求。另外，為保障數據的存取效率和質量，自研了SSD存儲介質。

其四，打造支持51.2T交換容量的核心交換機。其性能與InfiniBand技術接近，但比後者具備更好的與企業級乙太網兼容的特性。相較於傳統的RoCE，網絡帶寬利用率能從60%提升到95%，滿足生成式AI計算可靠運行的需求。

創新AI Infra以提升大模型算力效率

除了算力系統，也需要對AI Infra進行創新。

在這方面，浪潮信息開發了大模型智算軟體棧OGAI「元腦生智」（Open GenAI Infra），以提升大模型訓練和推理的效率，加速模型研發與落地應用。

事實上，目前行業還沒有對AI Infra進行明確定義，只是形成了其是位於AI硬體之上的軟體層的共識。對此，浪潮信息又持有怎樣的觀點呢？

「我們認為硬體之上、應用之下的都屬於AI Infra層。」浪潮信息人工智慧與高性能應用軟體部AI架構師Owen ZHU表示，「它會是比較厚的軟體技術棧，可能不僅僅是一層。」

浪潮信息將OGAI定義為五層，分別是L0基礎設施層（智算中心OS）、L1系統環境（PODsys）、L2調度平台（AIStation）、L3模型工具（YLink）和L4多模納管（MModel）。

此外，需要說明的是，AI Infra並非僅用於支撐大模型的訓練和推理。「訓練是第一步，也是最重要的一步。有了基礎大模型之後，可能還要對它做微調，接著要對模型做管理、評估和對比分析，之後還要做應用開發等，這都需要AI Infra層的一些軟體來支撐。」Owen ZHU說。

全面開源千億參數「源2.0」基礎大模型

基礎大模型的關鍵能力，是大模型在行業和應用落地表現的核心支撐。日前，浪潮信息正式發布「源2.0」基礎大模型，包括1026億、518億、21億三種不同參數規模，在編程、推理、邏輯等方面表現突出。

據了解，該模型主要具備以下三方面的優勢。

算法上，在源2.0中引入了一種名為局部注意力過濾增強機制的新型注意力算法結構。該結構與經典的Attention結構相比，模型精度有明顯提升，也大大加強了模型的學習能力。

（來源：資料圖）

數據上，由於模型能力的提升在很大程度上取決於它所訓練的數據，因此源2.0在數據構建方面做了諸多工作。據浪潮信息人工智慧軟體研發總監吳韶華介紹，源2.0的數據來源包含三個部分，分別是業界的開源數據、從網際網路上清洗的數據和模型合成的數據。模型團隊不僅對2018年至2023年的網際網路數據進行了清洗，從總量12PB左右的數據中僅獲取到約10GB的中文數學數據；為進一步彌補高質量數據集的匱乏，還基於大模型構建了一批多樣性的高質量數據，並將其補充到訓練數據集當中。

（來源：資料圖）

算力上，提出了非均勻流水並行的高性能訓練方法，能顯著降低經典大模型在訓練過程中，對AI晶片之間的通訊帶寬需求，即便AI晶片間的通信帶寬很低，也能獲得較好的性能。

（來源：資料圖）

目前，該模型已經實現全面開源。吳韶華指出：「在開源上強調的一點是，完全免費、完全可商用、不需要授權、最徹底的開源。我們鼓勵用戶去商用，去做各種各樣的應用。」

此外，在11月29日的AICC 2023人工智慧計算大會上，浪潮信息還公布了源大模型共訓計劃：針對開發者自己的應用或場景需求，通過自研數據平台生成訓練數據並對源大模型進行增強訓練，訓練後的模型依然在社區開源。開發者只需要提出需求，說清楚具體的應用場景、對大模型的能力需求以及1～2條示例，由源團隊來進行數據準備、模型訓練並開源。

其實，早在2021年，浪潮信息就發布了參數規模為2457億的中文巨量模型「源1.0」。從數據選擇的層面上說，源2.0相比源1.0實現了較大的進化，對數據質量的把控更加嚴格。具體來說，首先，在構建源2.0數據集時，不再一味追求體量，而是注意控制數據質量；其次，會採用大模型生成一批高質量數據，並將其用到模型預訓練中。

「我們認為，在數據多樣性能夠滿足的前提下，數據的質量越高，訓練的效果就越好。而且，當數據質量足夠好的時候，哪怕用相對較少的數據量，也能訓練出能力非常強的模型。」吳韶華表示。在這方面，業界已有不少研究成果能夠證明，比如，一些小模型基於高質量數據，在代碼、數學上訓練出的結果，超過了比其參數量大10倍的模型。

談到浪潮信息發布的模型，便不能不提起如今「百花齊放」的大模型發展態勢。在此背景下發展大模型，需要注意的關鍵是什麼呢？

浪潮信息認為，基礎大模型是大模型變革中的核心內容，並始終選擇在基礎大模型上投入。吳韶華說：「只有先提升基礎模型的能力，再將其應用到行業中，才能得到比較好的回報。試想一下，當基礎模型能力不夠時，就直接把它拿到行業里，其實很難解決行業中大場景碎片化的問題，依然會導致落地難。」

此外，在「百花齊放」的過程中，也可能出現重複建設大模型的情況，這是否有必要？吳韶華給出了自己的觀點，其認為在OpenAI引領大模型發展浪潮的當下，業界其他參與者沿著不同的方向和路徑對大模型進行探索，是值得被鼓勵和支持的。「因為只有這樣才有可能快速接近，甚至超越OpenAI的GPT4。」他說。

聯合生態夥伴構建健康產業生態

有了基礎大模型，還需要進一步深入到應用場景，把大模型的能力賦能到具體的產業環節之中。但這很難由一家廠商獨立完成，必須有更多廠商來深度協同配合。對此，浪潮信息提出元腦生態，致力於通過技術支持、方案聯合和平台共享，來實現不同廠商之間的優勢互補。

作為一家平台廠商，浪潮信息不僅依託自身在算力、算法、平台方面的積累，為生態夥伴提供適配、測試等支持，還聯合生態夥伴構建生成式AI解決方案。據了解，元腦生態已經對接了超40家AI晶片商、超400家算法廠商和超4000家系統集成商。

綜上來看，目前浪潮信息正以大模型應用為導向，從計算、存儲和網絡等方面開展算力系統創新，從AI軟體基礎設施出發提升大模型算力效率，從模型算法、數據質量和算力等方面提升基礎大模型的能力，並攜手生態夥伴營造健康的產業生態。正如劉軍所言，「我們希望聚集業界最豐富最優質的資源，來助力千行百業加速生成式AI的產業創新，進而高效釋放生產力」。

AI大模型時代，浪潮信息「四管齊下」

聯合IDC發布《2023-2024中國人工智慧計算力發展評估報告》

基於計算、存儲和網絡開展算力系統創新

創新AI Infra以提升大模型算力效率

全面開源千億參數「源2.0」基礎大模型

聯合生態夥伴構建健康產業生態

清華AI學者趙昊署名文章：為什麼2024物理諾獎頒給兩位神經網絡先驅？

SpaceX發射載人龍飛船，旨在解救被困國際空間站的兩名NASA太空人

清華學者多維度探索晶片基礎問題，基於新材料研發全適配器件

科學家造出纖維素光學超材料，實現低於環境溫度5.7℃的製冷效果

美國國防部資助私密邊緣計算，與EnCharge AI開發超強邊緣計算晶片

OpenAI推出「全能模型」GPT-4o，支持語音、視頻、文字實時交互

科學家為集體智能制定理論框架，助力社交媒體信息傳播的發展

上海交大團隊研發通用人工智慧，解決傳統蛋白質工程難題

南科大團隊實現無擴散的單光子波包，或實現更複雜的量子系統

耶魯揭示自注意力結構的上下文學習機制，證明梯度流算法的收斂性

AI教母李飛飛創辦空間智能公司，力圖克服大模型AI技術的現有局限

北大團隊研發硫化鈮納米片，能用於電解水制氫和氫燃料電池

美國約70家公司正在發展先進核反應堆，其中六七家已與監管機構合作

95後南非非裔女子建立城鎮地圖數據集，用AI對抗空間種族隔離

新型固態鋰電池面世，兼具快充能力，有望用於手機和汽車等

史丹福團隊研發光上轉換薄膜，可用於打造新型夜視儀

專訪史丹福做飯機器人背後團隊：未來將研發摺疊褶皺衣物新功能

DeepMind開發AutoRT新系統，用AI大模型為機器人「發號施令」

科學家開闢物理研究新方向，為探索光與手性體系的作用提供新方法

歐美鈣鈦礦公司加速競賽，專家：鈣鈦礦電池商業化在於矽的背面

美國FTC對數據代理商採取懲罰，後者曾以低廉價格出售用戶隱私

科學家製備油水分離膜，能處理石化行業和油氣開採的廢水

吉大團隊研發碳點自組裝新材料，有望用於光學塗層和軟體機器人

歐盟制定《人工智慧責任指令》，讓被AI技術傷害的人獲得經濟補償