AI大模型時代,浪潮信息「四管齊下」

2023-12-01     DeepTech深科技

原標題:AI大模型時代,浪潮信息「四管齊下」

「應對生成式AI的發展和挑戰,應該從算力系統、AI Infra、算法模型、產業生態四個層面創新,通過大模型算力效率、模型算法等創新有效提升基礎大模型能力,以健康產業生態助推『百模千行』應用落地。」浪潮信息高級副總裁劉軍在以「智算力系統創新,加速生成式AI的產業發展」為題的演講中表示。

該演講來自於11月29日在北京舉辦的2023人工智慧計算大會。會上,國際數據公司(IDC)與浪潮信息聯合發布《2023-2024中國人工智慧計算力發展評估報告》(以下簡稱《報告》)。

圖丨劉軍(來源:資料圖)

聯合IDC發布《2023-2024中國人工智慧計算力發展評估報告》

據了解,自2018年以來,該《報告》已連續發布六次。其以洞察AI算力發展趨勢為宗旨,從算力發展、地域分布、行業AI算力對比等維度出發,對中國人工智慧計算力的發展進行了綜合評估,以期為行業客戶和技術提供商提供更加具有針對性的行動建議。

生成式AI,是今年《報告》的核心主題。其指出,在生成式AI的帶動下,人工智慧計算力的發展趨勢迎來三大變化。首先是計算範式的改變。生成式AI的發展,驅動了算力基礎設施的建設,也推進人工智慧在雲、邊、端的覆蓋。同時,應用場景的多樣化,讓底層基礎設施呈現多元化發展態勢。其次是產業動量的改變。生成式AI會重構人們的生活和生產方式,給自動駕駛、醫療等領域帶來深入影響;AI算力、算法等產業變量也會助力算力生態鏈繁榮。最後是算力服務格局的改變。生成式AI與雲計算的服務方式不同,企業在對其進行訓練時,除了可以自行構建訓練平台,還能通過租賃算力服務的方式滿足訓練需求,這為算力服務市場帶來了新機會。

中國人工智慧計算力城市排行,是該《報告》中值得關注的一大亮點。最新排行榜單顯示,北京、杭州、深圳、上海和蘇州排名前5位,廣州、濟南、合肥、重慶和成都則位列前十名。可以看出,排名的背後,是生成式AI對於不同區域在算力投資上的重要拉動。排名靠前的城市,不管是大模型企業的生態發展,還是包括智算中心平台的算力基礎設施建設,都處於領先水平。

(來源:資料圖)

中國人工智慧應用場景的發展情況,則是該《報告》中的又一關鍵內容。目前,生成式AI應用正在快速發展,並進一步賦能到各行各業。從領域來看,知識管理、對話式應用、代碼生成將是企業應用生成式AI的主要領域;從行業來看,網際網路仍是生成式人工智慧技術應用和研發的主戰場,金融業較早使用生成式AI,製造業還處於早期階段,醫療業的應用正在加速進行,能源、零售、教育等行業在不斷推進。

總結該《報告》可以得出,生成式AI為我們帶來了很多新機會。同時,也不可避免地會有新的挑戰不斷產生。那麼,該如何從智算力系統層面上,應對生成式AI帶來的發展和挑戰呢?如上所說,浪潮信息認為應該從算力系統、AI軟體基礎設施、算法模型和產業生態這四個方面進行綜合考慮。

基於計算、存儲和網絡開展算力系統創新

算力系統方面,主要在計算、數據和互聯上存在挑戰。基於此,浪潮信息提供了如下解決之道。

其一,打造開放多元的AI算力平台。最新發布的G7新一代多元算力平台,可兼容國內外高端AI訓練晶片,能應對目前的算力多元化趨勢,為客戶的AI業務提供良好的算力支撐。

其二,研發開放加速的計算架構,可實現896GB每秒的互聯帶寬,整個集群的性能加速比超過90%,能保障更大規模的集群擴展性能。

其三,開發一套能同時支持文件、大數據等非結構化協議的集群系統,滿足AI時代的數據存儲需求。另外,為保障數據的存取效率和質量,自研了SSD存儲介質。

其四,打造支持51.2T交換容量的核心交換機。其性能與InfiniBand技術接近,但比後者具備更好的與企業級乙太網兼容的特性。相較於傳統的RoCE,網絡帶寬利用率能從60%提升到95%,滿足生成式AI計算可靠運行的需求。

創新AI Infra以提升大模型算力效率

除了算力系統,也需要對AI Infra進行創新。

在這方面,浪潮信息開發了大模型智算軟體棧OGAI「元腦生智」(Open GenAI Infra),以提升大模型訓練和推理的效率,加速模型研發與落地應用。

事實上,目前行業還沒有對AI Infra進行明確定義,只是形成了其是位於AI硬體之上的軟體層的共識。對此,浪潮信息又持有怎樣的觀點呢?

「我們認為硬體之上、應用之下的都屬於AI Infra層。」浪潮信息人工智慧與高性能應用軟體部AI架構師Owen ZHU表示,「它會是比較厚的軟體技術棧,可能不僅僅是一層。」

浪潮信息將OGAI定義為五層,分別是L0基礎設施層(智算中心OS)、L1系統環境(PODsys)、L2調度平台(AIStation)、L3模型工具(YLink)和L4多模納管(MModel)。

此外,需要說明的是,AI Infra並非僅用於支撐大模型的訓練和推理。「訓練是第一步,也是最重要的一步。有了基礎大模型之後,可能還要對它做微調,接著要對模型做管理、評估和對比分析,之後還要做應用開發等,這都需要AI Infra層的一些軟體來支撐。」Owen ZHU說。

全面開源千億參數「源2.0」基礎大模型

基礎大模型的關鍵能力,是大模型在行業和應用落地表現的核心支撐。日前,浪潮信息正式發布「源2.0」基礎大模型,包括1026億、518億、21億三種不同參數規模,在編程、推理、邏輯等方面表現突出。

據了解,該模型主要具備以下三方面的優勢。

算法上,在源2.0中引入了一種名為局部注意力過濾增強機制的新型注意力算法結構。該結構與經典的Attention結構相比,模型精度有明顯提升,也大大加強了模型的學習能力。

(來源:資料圖)

數據上,由於模型能力的提升在很大程度上取決於它所訓練的數據,因此源2.0在數據構建方面做了諸多工作。據浪潮信息人工智慧軟體研發總監吳韶華介紹,源2.0的數據來源包含三個部分,分別是業界的開源數據、從網際網路上清洗的數據和模型合成的數據。模型團隊不僅對2018年至2023年的網際網路數據進行了清洗,從總量12PB左右的數據中僅獲取到約10GB的中文數學數據;為進一步彌補高質量數據集的匱乏,還基於大模型構建了一批多樣性的高質量數據,並將其補充到訓練數據集當中。

(來源:資料圖)

算力上,提出了非均勻流水並行的高性能訓練方法,能顯著降低經典大模型在訓練過程中,對AI晶片之間的通訊帶寬需求,即便AI晶片間的通信帶寬很低,也能獲得較好的性能。

(來源:資料圖)

目前,該模型已經實現全面開源。吳韶華指出:「在開源上強調的一點是,完全免費、完全可商用、不需要授權、最徹底的開源。我們鼓勵用戶去商用,去做各種各樣的應用。」

此外,在11月29日的AICC 2023人工智慧計算大會上,浪潮信息還公布了源大模型共訓計劃:針對開發者自己的應用或場景需求,通過自研數據平台生成訓練數據並對源大模型進行增強訓練,訓練後的模型依然在社區開源。開發者只需要提出需求,說清楚具體的應用場景、對大模型的能力需求以及1~2條示例,由源團隊來進行數據準備、模型訓練並開源。

其實,早在2021年,浪潮信息就發布了參數規模為2457億的中文巨量模型「源1.0」。從數據選擇的層面上說,源2.0相比源1.0實現了較大的進化,對數據質量的把控更加嚴格。具體來說,首先,在構建源2.0數據集時,不再一味追求體量,而是注意控制數據質量;其次,會採用大模型生成一批高質量數據,並將其用到模型預訓練中。

「我們認為,在數據多樣性能夠滿足的前提下,數據的質量越高,訓練的效果就越好。而且,當數據質量足夠好的時候,哪怕用相對較少的數據量,也能訓練出能力非常強的模型。」吳韶華表示。在這方面,業界已有不少研究成果能夠證明,比如,一些小模型基於高質量數據,在代碼、數學上訓練出的結果,超過了比其參數量大10倍的模型。

談到浪潮信息發布的模型,便不能不提起如今「百花齊放」的大模型發展態勢。在此背景下發展大模型,需要注意的關鍵是什麼呢?

浪潮信息認為,基礎大模型是大模型變革中的核心內容,並始終選擇在基礎大模型上投入。吳韶華說:「只有先提升基礎模型的能力,再將其應用到行業中,才能得到比較好的回報。試想一下,當基礎模型能力不夠時,就直接把它拿到行業里,其實很難解決行業中大場景碎片化的問題,依然會導致落地難。」

此外,在「百花齊放」的過程中,也可能出現重複建設大模型的情況,這是否有必要?吳韶華給出了自己的觀點,其認為在OpenAI引領大模型發展浪潮的當下,業界其他參與者沿著不同的方向和路徑對大模型進行探索,是值得被鼓勵和支持的。「因為只有這樣才有可能快速接近,甚至超越OpenAI的GPT4。」他說。

聯合生態夥伴構建健康產業生態

有了基礎大模型,還需要進一步深入到應用場景,把大模型的能力賦能到具體的產業環節之中。但這很難由一家廠商獨立完成,必須有更多廠商來深度協同配合。對此,浪潮信息提出元腦生態,致力於通過技術支持、方案聯合和平台共享,來實現不同廠商之間的優勢互補。

作為一家平台廠商,浪潮信息不僅依託自身在算力、算法、平台方面的積累,為生態夥伴提供適配、測試等支持,還聯合生態夥伴構建生成式AI解決方案。據了解,元腦生態已經對接了超40家AI晶片商、超400家算法廠商和超4000家系統集成商。

綜上來看,目前浪潮信息正以大模型應用為導向,從計算、存儲和網絡等方面開展算力系統創新,從AI軟體基礎設施出發提升大模型算力效率,從模型算法、數據質量和算力等方面提升基礎大模型的能力,並攜手生態夥伴營造健康的產業生態。正如劉軍所言,「我們希望聚集業界最豐富最優質的資源,來助力千行百業加速生成式AI的產業創新,進而高效釋放生產力」。

文章來源: https://twgreatdaily.com/zh-hk/f9dca381c5cd5aed376dd1b256616573.html