「對京東來說,技術永遠只是手段,而不是目的。」
作者|劉楊楠
編輯|栗子
過去半年,如果要問:訓練一個大模型需要幾步?你可能會得到兩種答案。一種是「找人、買卡、拉投資」;另一種是「找落地場景、找垂直數據、找大模型和場景的結合點」。
兩種答案分別代表了大模型江湖的兩大「派別」——前者是理想派,試圖復刻、甚至超越OpenAI,在中文世界重現大模型神話;後者則是務實派,瞄準場景痛點,從需求出發,倒推一套技術架構,不求最好,只求最「適合」。
起初,一些已經入局,或正在入局的玩家對新技術的狂熱蓋過理性思考,一切行動對標OpenAI。但當一項突破性技術走入更大的商業世界,總逃不過如何賺錢的問題。就連OpenAI也不例外。
此刻,大模型拼算力、拼資源的階段已經告一段落,來到更務實的階段。提高大模型性價比,是更要緊的任務。
在大模型的訓練過程中,人力成本和算力基礎設施成本是兩大主要支出。其中,人力成本很難降低。因此,如何將有限的算力資源「壓榨」出最大的能量,就成了提高大模型性價比的關鍵命題。
9月26日下午,在2023京東雲城市大會(西安站)上,京東雲推出了「數智算力矩陣」,從硬體基礎設施、到智算集群,再到MaaS服務,提供一站式的大模型服務能力。
「大模型的價值,一定要和實體產業結合。」京東集團技術委員會主席、京東雲事業部總裁曹鵬表示,「大模型不會只是一個聊天工具,而是會逐漸發展成一個智能生產力工具,深刻地改變產業鏈的各個方面。」
大模型對產業鏈的變革會如何改變數字基礎設施?京東雲的數智算力矩陣又有何特別之處?「甲子光年」深度對話京東雲IaaS產品研發部負責人龔義成及京東雲數據中心技術部高級專家王強,聊了聊京東雲的數智算力矩陣,以及京東雲對大模型產業化的暢想。
1.「我們造一輛好車,但路不行,車也跑不起來」
經過半年發酵,大模型玩家已經來到了更務實的階段,開始探索商業化落地。
行業大模型,被認為是目前大模型落地產業的最佳形態,也是很多大模型企業的商業化選擇。其中,一個可能存在的誤區是,「通用模型+行業數據=行業大模型」。但事實上,訓練行業大模型面臨著和訓練通用大模型一樣的「工程化難題」。
數據方面,不同行業的數據呈現不同的集中度和分散狀態,數據準備周期和處理難度也各不相同。對於多模態數據而言,如何在訓練時高效加載,也是目前十分棘手的問題。
訓練和部署環節,如何高效地進行算力調度,提升算力資源利用率,也是企業必須考慮的成本問題。對於中小企業而言,面對全新的技術變革,更是每一分錢都要花在刀刃上。此外,大模型訓練環境的穩定性,故障斷點恢復及接續訓練的處理,也對訓練效率產生很大影響。
因此,行業大模型的挑戰不僅在技術本身,如何將技術與行業應用場景相結合,並在結合的過程中平衡成本、效率、體驗等多重因素,才是大模型行業落地的真正挑戰。
人工智慧發展歷程中,產業落地是一個持續已久的「歷史性難題」。
2016年,DeepMind攜AlphaGo在國際圍棋比賽上大殺四方,一舉擊敗天才少年李世石。一石驚起千層浪,國內大批人工智慧初創企業乘勢而起,喊出口號,要做「中國的DeepMind」。但在此後幾年,大量企業卻陷入了大筆燒錢、持續虧損、繼續燒錢、虧損擴大的怪圈,最終只能靠資本持續輸血。
人工智慧商業化窘境背後,很大一部分原因是,一些人工智慧企業忽視了技術之外,配套基礎設施的重要性。
企業在決策是否採購全新的技術方案時,往往會綜合考量多種因素。技術本身的能力只是其一,配套基礎設施的效率、成本等因素同樣重要。例如,在人臉識別的場景中,即使AI識別技術已經足夠準確,但如果搭載AI識別技術的攝像頭成本過高,企業也很難採購。
如今,大模型落地依然遵循相似的邏輯。
儘管開源大模型已經大大拉低了整個市場的入局門檻,但企業想要真正訓練自己的大模型,依然需要投入建設相應的基礎設施,否則無法充分釋放大模型的產業價值。「就好比我們造了一輛跑得很快的車,但路不行,車也跑不起來。」京東雲IaaS產品研發部負責人龔義成打了一個形象的比喻。
因此,大模型要真正落地產業,需要一套包含IaaS、PaaS到MaaS完整架構的新型數字基礎設施。
2.到產業中汲取靈感
打造大模型落地配套基礎設施的關鍵前提,是足夠了解產業需求本身。談到對產業的了解,京東無疑是一個不可或缺的存在。
背靠京東的產業稟賦,京東雲已經深入布局產業供應鏈多年,並逐漸圍繞產業鏈搭建起一套基礎設施,其中便包含了大模型布局。
回看京東大模型的布局歷程——
- 2020年,京東基於全棧自研AI技術,推出了言犀人工智慧應用平台;
- 2021年,京東全球首個超算中心落戶重慶,圍繞人工智慧、量子計算等方向進行科學研究探索;同年,京東自主研發的大模型,達到10 億級參數;
- 2022年,京東的織女模型參數達到百億級,在全球自然語言處理領域頂級測試中,以總平均分91.3分位居榜首,刷新自然語言理解技術世界紀錄。
今年7月,京東發布面向產業「言犀大模型」,預訓練參數達到千億級。目前,京東雲言犀大模型,擁有語音識別、計算機視覺、機器學習、知識圖譜、語義理解、多輪對話6大關鍵技術,50餘個成熟API日均調用量達百億次。目前言犀已經在京東零售、物流、健康、工業等領域實現落地應用,為超5.8億用戶、數十萬商家提供服務。
在多年布局中,京東雲也看到了來自產業最真實的需求和痛點。
當前有一個行業共識是,將來每個行業都會有自己的行業大模型。但並非每家企業都有獨立開發大模型的能力,中小型企業尤其如此。就算企業們有能力獨立建設,重複的模型建設也會浪費大量資源和人力。
於是,一些網際網路企業已經開始發揮「平台」的力量,推出各自的大模型開發平台,賦能中小企業。
但面對各式各樣的大模型開發平台,需求端企業該怎麼選?
在和客戶交流的過程中,龔義成發現,企業選擇大模型開發平台主要關注兩大維度——
首先,平台方對場景Know-How的理解是否深刻。「今天我們很多客戶雖然知道大模型很火,但具體怎麼結合他的業務落地,是大家都會提的問題。」龔義成表示。
其次,訓練行業大模型的整體性價比是否合適。在訓練大模型的過程中,算力無疑是最大的成本項。這其中算力基礎設施平台的建設及運行成本占到了很大部分的比重,因此對於硬體、網絡及數據機房的配置解決方案就成了提高大模型性價比的關鍵命題。
京東雲結合多年技術積累,已經打磨出一套完整高效的數智算力基礎平台設施解決方案。
3.一份來自京東雲的答卷
站在京東雲的視角,大模型的訓練與應用,對數字基礎設施提出了更高的要求——更強算力、更大存力、更加易用、更低門檻的數字基礎設施,是建好大模型、用好大模型的前提。
因此,在9月26日舉辦的2023京東雲城市大會(西安站)上,京東雲推出了「數智算力矩陣」。從硬體基礎設施到智算集群,再到MaaS服務,京東云為千行百業不同需求的客戶,打造一站式大模型服務,為孕育大模型提供「肥沃土壤」,築牢產業發展的數字基底。
具體來看,在硬體基礎設施層,京東雲「阿爾法」智能算力模塊解決方案包括風冷型智能算力模塊及液冷型智能算力模塊兩個產品系列,實現智能算力應用業務的安全、穩定、高效部署運行。
在智算集群層,京東雲高性能計算集群主要面向大模型訓練、工業製造、氣象電力、生物醫藥、晶片設計、教育科研等行業,這些行業需要大量的CPU、GPU等異構硬體的計算能力,需要高性能的存儲資源,在海量計算過程中往往需要涉及多節點協同,又依賴高性能的RDMA網絡。
在MaaS層,京東雲將京東大模型能力開放出來,通過將開發大模型的底層能力解耦,推出了「言犀AI開發計算平台」,可以為客戶的大模型開發和行業應用,提供一站式的解決方案。
在眾多網際網路大廠中,京東自研AI全棧技術的動作不算最早的,但路徑卻十分明確——從京東內部需求出發,落地內部場景後,開始對外賦能,深入挖掘產業需求,並最終服務於大模型產業落地。
據了解,阿爾法智能算力模塊最初孕育在京東雲支持內部算力需求的過程中,在對外服務前,已經經過大量技術篩選、評估,最終形成產品,對外賦能,這便大大減少了客戶的擔憂。「對於一種全新的解決方案,大家最初很容易擔心沒人用過,而我們內部已經規模化應用過,可以保證客戶使用的安全性。」京東雲數據中心技術部高級專家王強表示。
在對外服務的過程中,京東雲也不斷發掘客戶需求,靈活調整解決方案來適配客戶多元的需求,並最終整合到解決方案中交付客戶。
在全面滿足高算力密度部署的同時,阿爾法智能算力模塊解決方案已經從三個方面控制成本。
首先,依託供應鏈資源降本。全部採用京東自研產品,以供應鏈優選為基礎,依託規模化供應鏈採購,能夠將產品價格降低至行業水平之下。
其次,在技術層面,依據京東雲多年設計規劃、建設、運營和維護經驗,在整個設備產品規格開發過程中,不斷實現技術創新優化。
最後,在算力模塊外部的配套基礎設施方面,京東雲也將綜合評估算力硬體網絡配置、建築環境、電力資源以及地區氣候等因素條件,提供完整算力中心供電及製冷系統解決方案,降低算力中心整體PUE,控制算力中心的運行成本。
類似的,言犀AI開發計算平台也經歷了這樣一個「由內向外」的蛻變。
起初,言犀AI開發計算平台的出現是為了滿足京東內部零售、健康等場景開發人員的工作需求。在落地內部場景的過程中,京東雲結合開發人員的實際需求,補充了平台的低代碼能力,降低開發人員使用門檻。今天的言犀AI開發計算平台,已經能夠完全可視化操作,零算法基礎的應用人員也能使用。
當前,言犀AI開發計算平台已全面開放,基於京東豐富的內外部應用場景,包括零售、物流、健康、金融等,可以為平台上的基礎大模型提供大量行業應用場景。
言犀AI開發計算平台瞄準三類典型用戶需求。一類是言犀MaaS服務,開發者可以通過API按量付費;另一類是公有雲SaaS版,用戶可以通過平台提供的一站式模型開發、訓練和部署的能力;另外,京東雲也提供私有化交付版本的言犀平台,數據完全本地化部署。
在「甲子光年」看來,數智算力矩陣是京東雲站在產業視角給出的大模型建設階段性答卷。與此同時,部分傳統產業也開始由於大模型的推動而發生新的變化。產業的大模型與基礎設施,正在「從產業中來,到產業中去」。
4.從產業中來,到產業中去
如今,「大模型會把所有行業重做一遍」的判斷已經屢見不鮮。在眾多產業中,零售行業是對大模型比較「友好」的產業之一。
零售產業複雜的營銷和供應鏈環節,足以讓大模型在零售行業大展拳腳。當下,整個產業鏈已經開始思考,如何把大模型應用在品牌營銷、用戶運營過程中。
京東科技副總裁母小海曾表示,隨著大模型的持續落地,通過智能交互來選擇商品的消費習慣正在形成,這勢必推動用戶對品牌價值理解的轉變。而企業可以通過數據的智能應用,不斷構建品牌專業性,這將成為品牌持續增長的關鍵。
但大模型最終能否順利落地零售產業,還需要依託一個關鍵要素——零售行業的高質量數據。
這要求零售企業持續積累高質量行業數據,同時以更實時的消費數據,構建更適合大模型模式的消費習慣,最終實現垂直行業的「智能湧現」。
其中,兩大能力為產業大模型的「智能湧現」保駕護航。首先,企業需要強大的數據平台,支持更多維度行業數據的管理;其次,企業要有更強的智能交互能力,加速積累各自行業的專有數據。
數據平台不斷實現知識輸出,智能平台不斷反饋高質量協同數據——二者形成正循環的增長飛輪,才能實現高質量的行業智能應用。
因此,只有自己的場景,才能培養出適合自己的大模型應用。
京東服務千萬自營商品SKU,5000萬工業品SKU,超800萬家活躍企業客戶,全國超2000個產業帶的真實需求,圍繞這些場景訓練的大模型更適合產業應用。
這些在實踐中積累的大量高質量數據也已經沉澱至言犀大模型中。除70%來自百度的通用數據外,其餘30%的數據均來自於京東特有的產業數據,二者相結合訓練大模型,也保證了模型有「常識」的同時,足夠的「專業」。
「大模型的價值,一定要和實體產業結合。」曹鵬表示。京東每年產生的數百億交互數據保證了模型的持續疊代和優化。
如今,大模型正在重構千行百業。在過去十餘年的布局中,京東無疑已經逐漸和數智供應鏈的夥伴們長成一體,成為最親密的合作夥伴。在大模型即將開啟的下一個十年,京東雲將繼續成為產業供應鏈最堅實的土壤,孕育出一個更加開放融合的大模型生態。
正如曹鵬在2023京東雲城市大會(西安站)上說的那樣:
「對京東來說,技術永遠只是手段,而不是目的。我們發展產業大模型,最終還是希望將產業實踐中凝聚出的數字化能力,開放出來服務社會,不斷提升產業效率。」
這絕非一句口號。如果說大模型是一輛高性能跑車,那麼京東就是這場大模型產業落地競賽的「造路者」。
無論是此次發布的數智算力矩陣,還是言犀大模型本身,京東都以終為始地從場景本身出發,不斷優化大模型落地產業過程中的可用性和性價比。
此刻,大模型落地產業的進程才剛剛拉開序幕,而京東,未來可期。
(本文圖片來源:京東)
END.