接下來,就看美團和位元組的行動了。
作者|劉楊楠
編輯|栗子
時隔半年之後,京東大模型終於來了。
7月13日,在2023京東全球科技探索者大會暨京東雲峰會上,京東雲終於正式發布了面向垂直行業的言犀大模型,並發布了配套的言犀AI開發計算平台。
今年2月ChatGPT大火之後,國內其他大廠還沒反應過來,京東就宣稱要做「產業版ChatGPT」,但隨後卻沒了聲音。經過半年的發酵,業內對大模型已經形成基本共識—— 通用大模型不是模型應用的唯一方向,面向垂直產業的模型會成為大模型價值的引爆點。
「專有模型、垂直行業模型的訓練成本和難度其實並不低。因為行業模型並不意味著小模型,也不意味著單獨某一個領域的數據,而是通用公域數據加上行業數據一起,構成了產業大模型的訓練數據來源。」京東探索研究院院長、京東科技智能服務與產品部總裁何曉冬此前對媒體表示。
這個思路也預示著,言犀大模型和京東打造多年的數智供應鏈有著深度綁定。
1.言犀大模型的四層架構
京東集團技術委員會主席、京東雲事業部總裁曹鵬首先發布了言犀大模型。
據介紹,2021年,京東便開始著手搭建大模型團隊;到了2022年,言犀大模型已經達到百億參數規模。而今天發布的言犀大模型,參數規模已達千億。
言犀大模型具備基礎層、模型層、MaaS、SaaS四層體系:
其中,基礎層提供公有雲、專有雲、混合雲三種雲計算部署方案。
模型層,言犀大模型的數據構成中有70%通用域數據、30%的數據來自京東數智供應鏈的產業數據、代碼數據、多語言數據。京東數智供應鏈已經服務超千萬商品SKU、800多萬家活躍企業客戶 (其中世界500強企業超90%、全國專精特新中小企業近70%)、全國2000多條產業帶,這些場景的真實數據都是其他公司難以短期複製的數據資產。
算法層面,言犀大模型採用分布式訓練框架(Megatron+DeepSpeed),京東自研向量資料庫Vearch為大模型提供長期記憶。據介紹,京東在2020年便注意到,基於Transformer架構、注意力機制訓練的大語言模型存在「一本正經地胡說八道」的情況。當時,京東便開始研究自己的算法,提出了知識注入的預訓練語言模型(K-Plug),並在2021年發表論文。
MaaS層,基於言犀大模型解耦出的底層能力,京東推出了「言犀AI開發計算平台」,內含多個行業知識庫,包括零售、物流、健康等十餘個產業Know-How,為企業提供百餘種訓練和推理優化工具,支持以少量企業數據精調出客戶專屬模型。
會上,京東工作人員現場演示了該平台將一個通用大模型轉換為健康產業大模型的全過程。據現場介紹, 模型訓練過程僅需幾個小時即可完成,部署過程僅需幾分鐘,整個過程推理成本可節省90%。完成部署後,平台會生成一個API供客戶使用。
整個演示過程中,操作人員幾乎全程採用「傻瓜式」操作,找到相應的菜單目錄,點擊需要的選項即可完成操作。以往,客戶要完成這套流程,從數據準備、模型訓練到模型部署,需要10餘名科學家花費一周時間才能搞定。
目前,言犀大模型已經在金融、健康、物流、營銷、內容生成、數字人六大內部場景落地實踐。
此次發布會上,除言犀大模型外,京東雲的三個核心產品也迎來升級:全新升級的混合多雲作業系統 雲艦,將GPU/NPU的資源成本降低50%,並提供行業最高的業務連續性承諾;高性能存儲平台 雲海,將單集群每秒讀寫性能提升5倍,達到千萬級;時延降低50%,達到百微秒級;使用成本則降低30%;軟硬一體的虛擬化引擎 京剛,將虛擬化卸載到智能網卡中,虛擬化損耗降至0,網絡性能提升高達4倍,並支持100Gb VPC網絡,雲硬碟單實例性能突破百萬IOPS。
值得注意的是,京東探索研究院院長、京東科技智能服務與產品部總裁何曉冬在演講最後放出了一個「小彩蛋」,公布了京東在具身智能方向的局部成果。
在現場播放的視頻中,何曉冬直接和一隻集成具身智能的機械臂進行了多輪對話,機械臂則在接收到消息後,流暢地幫何曉冬接了一杯咖啡。
如今,具身智能無疑是人工智慧領域最具有想像力的新地標。雖然僅憑現場播放的demo讓人很難完全看到京東在具身智能方向的真實實力,卻也吊足了觀眾的胃口。
2.大模型產業落地的「新三要素」
「大模型是實現產業價值的工具而不是目的。」京東集團CEO許冉表示。許冉進一步表示,產業數據和行業Know-How,是言犀大模型的兩大核心優勢。
基於這個底層邏輯,京東提出了一個大模型的價值評判公式:
大模型的價值=算法×算力×數據×產業厚度的平方。
拆解來看,數據方面,網際網路的公開數據大多為靜態數據,但如果企業要讓模型有更強的動態交互能力,比如人機對話,多輪博弈等能力,現有的偏靜態的數據則很難滿足。
算法方面,何曉冬認為 單點算法不足以撐起新的大模型。
ChatGPT的出現在全球人工智慧領域開啟了一輪產品層面的競爭。OpenAI以谷歌的Transformer架構為基礎,訓練了GPT系列模型,經過多次疊代,最終以對話機器人的產品形態推出ChatGPT,引爆了這次大模型的商業競爭潮。回看整個過程,某種意義上,AI企業之間 單點算法的競爭已經逐漸轉變為技術體系和產品形態的競爭。
「一旦你拿出一個產品,對手可能很長時間才能追趕上,產品會直接影響用戶體驗,形成用戶心智,形成以後再想扳回去就不容易了。」何曉冬表示。因此, 通過產品牽引成體系算法的創新和突破,將比原來單點的算法突破更重要。
算力方面,以往單卡算力的比拼已經在向集群算力比拼轉變。如今,大模型不可能在單卡上訓練,必須跨多卡多機訓練。
基於以上分析,京東提出了 大模型產業落地的「新三要素」:場景、產品、算力。即複雜的交互智能場景及其產生的動態數據、從單一算法競爭到形成可以牽引成體系算法創新與突破的產品和能支撐這樣的場景與系統的新型算力。
會上,京東還公布了言犀大模型將實施 「三步走」戰略:目前,京東雲已經基於內部實踐構建了通用大模型;到今年年底這段時間,京東將經由高複雜場景大規模錘鍊,疊代出紮實的產業服務;預計在2024年初,會將大模型能力向外部嚴肅商業場景開放。
以目前的進度看,京東的「三步走」戰略已經過半。或許等到明年,京東正式將言犀大模型的能力面向產業場景全面開放時,真正的挑戰才會到來。
3.京東奔向技術的六年
2017年京東戰略會上,劉強東高喊「技術、技術、技術」的戰略,給整個京東集團下了三道以技術為核心的「KPI」——解決京東內部大規模人力效率問題;組件化、模塊化技術服務對外輸出;對前沿技術進行探索。
5年之後的今天,「技術、技術、技術」的戰略依舊未變。
2017年年底,京東成立人工智慧研究院。過去幾年,京東人工智慧研究院陸續納入了幾員大將。據媒體報道,當前,京東AI研發團隊主要成員為 何曉冬、吳友政、張政臣和陳蒙。
其中,何曉冬算得上是京東AI研發團隊的靈魂人物。
陳蒙現為京東科技人機互動技術部負責人。2018年5月加入京東,現任京東科技人機互動技術部負責人。加入京東後,先後打造京東科技兩大旗艦型產品-京小智和言犀的核心算法引擎,所研發的人機對話產品服務於京東的商家和用戶。
就在研究院成立三年後,京東「技術、技術、技術」戰略布局和成果也逐漸浮出水面。
2020年,京東自研全棧AI技術,在JDD大會上正式發布言犀品牌。
同年11月25日,在JDDiscovery-2020京東全球科技探索者大會上,京東宣布成立京東探索研究院,未來將面向全世界延攬頂級人才。京東探索研究院號稱涵蓋「人工智慧」「量子計算」「數據科學、工程與管理」「去中心化計算」「倫理道德」「科學與藝術」六大數智技術領域。
2021年3月,陶大程在京東的邀請下出任京東探索研究院院長。陶大程帶隊京東探索研究院後,並不局限於學術研究,而是嘗試了許多可落地技術,如可信AI、「產業元宇宙」等。
但今年3月,陶大程不再擔任京東探索研究院院長。院長一職由何曉冬接任。
當時,對於陶大程離開的原因,外界有人猜測:隨著行業的探索深入,加上ChatGPT所代表的數字生成後浪將元宇宙前浪拍倒在沙灘上,產業元宇宙開始出現門檻高、投入成本大的短板。
不過,京東及時給予了官方回復,稱陶大程教授離開是個人意願,產業元宇宙產出Omniforce仍是集團重點科研項目。
真實情況到底如何,恐怕只有京東內部人員才知曉。不過,從外部來看,從2017年劉強東高喊「技術!技術!技術!」的戰略口號開始,京東一直在努力向技術的最前沿方向靠攏。
必須承認,如今的京東無疑已經反駁了早年間外界對京東技術薄弱的質疑,但和站在技術金字塔尖的企業相比,京東在技術上無疑還有更長的路要走。
如今,京東包括言犀大模型在內的全套技術體系都與其深耕20多年的供應鏈體系深度捆綁在一起。從這個角度出發,在產業大模型這條路上,京東依然未來可期。
在京東發布言犀大模型後,幾家大廠布局大模型的思路已經逐漸清晰。接下來,就看美團和位元組的行動了。
END.