近日有市場消息稱,「大模型六小龍」中至少有兩家公司已經放棄預訓練。10月16日,零一萬物CEO李開復闢謠稱,零一萬物絕不會放棄預訓練模型工作,並宣布推出最新旗艦模型Yi-Lightning。
預訓練是指在大規模數據集上對深度學習模型進行初步訓練的過程,是大模型訓練的第一步。從成本角度而言,預訓練模型耗資巨大,訓練成本近年來更是持續攀升。中國市場是否需要這麼多大模型,一直以來備受爭論。
在接受上海證券報等媒體採訪時,李開復表示,預訓練模型是一個技術活,而且對人才的要求頗高,需要懂晶片、模型、推理、架構、算法的人才通力合作。做這件事的成本也非常高,不是每家公司都可以做成,以後做預訓練的公司可能會越來越少。
不過他也表示,根據其所掌握的信息,「大模型六小龍」均有足夠的融資額度,付得起預訓練模型Production Run三四百萬美元一次的訓練成本。「我覺得中國的六家大模型公司只要有足夠好的人才和想做預訓練的決心,融資額跟晶片都不會是問題。」
定價0.99元/百萬tokens
零一萬物成立於2023年5月,由創新工場董事長、前微軟全球副總裁李開復創立。自創立以來,零一萬物已迎來多個重要節點:2023年11月6日,發布首款預訓練大模型Yi-34B;2024年5月,官宣一站式AI工作平台萬知;2024年6月,Yi-Large等系列大模型正式登陸阿里雲百鍊平台,這是零一萬物首次通過雲廠商提供API服務。
在10月16日的發布會上,李開復介紹道,在國際權威盲測榜單LMSYS上,最新發布的Yi-Lightning超越GPT-4o-2024-05-13、Claude3.5Sonnet,排名世界第六,中國第一。這是中國大模型公司目前在該榜單上取得的最好成績。
模型性能升級之餘,Yi-Lightning的推理速度也有大幅提升,首包時間(從接收到任務請求到系統開始輸出響應結果之間的時間)較上半年發布的Yi-Large提升一倍,最高生成速度提速近四成。
值得一提的是,零一萬物將Yi-Lightning的API價格降至極低水平,每百萬token僅收費0.99元。對於這一價格,李開復稱,零一萬物在Yi-Lightning的定價上並沒有虧本。從成立的第一天起,零一萬物就同時啟動了模型訓練、AI Infra、AI應用三大團隊,當三個團隊都成熟後,再對接到一起。零一萬物將這一模式總結為模基共建、模應一體兩大戰略——AI Infra能力助力模型訓練和推理,以更低的訓練成本訓練出性能領先的模型,以更低的推理成本支撐應用層的探索。
此前在回應行業價格戰問題時,李開復的回答是零一萬物不參與價格戰。李開復認為,要接入API,足夠好的模型性能很重要,不然產品無法達到PMF(產品市場契合點)。「另外很重要的一點是,0.99元/百萬token的價格很便宜,但如果一個應用里每個用戶每天調用十幾次,累積下來每年的成本還是不容忽視的。」
商業落地差異化布局
在大模型的商業落地上,零一萬物在to B和to C均有布局。李開復介紹,零一萬物在to B業務上找到了一些破局空間,比如用數字人來做零售、餐飲等,另外還有兩三個領域在探索中。「做to B就做國內,做to B就做有利潤的解決方案,而不只是賣模型,不只是做項目制。」
在10月16日的發布會上,零一萬物首度對媒體公布了全新to B戰略下的首發行業應用產品AI 2.0數字人,聚焦零售和電商等場景,將最新版旗艦模型Yi-Lightning實踐於具體行業解決方案。
目前,零一萬物的AI 2.0數字人解決方案涵蓋了AI伴侶、IP形象、電商直播、辦公會議等多個應用場景,合作案例包括全國某著名餐飲連鎖店、某頭部酒旅類客戶、全國某知名水果連鎖店等。其中,某頭部酒旅企業在接入Yi-Lightning全新加持的數字人直播後,GMV較此前上升170%。
很多中美公司都在往o1方向狂奔
9月13日凌晨,OpenAI發布新模型o1,其複雜邏輯推理能力、數理能力驚艷業界。李開復透露,根據他與OpenAI人員的交流,OpenAI內部在技術上還有所保留,不急於向市場公布。「因為他們領先行業足夠多,到了一定的業務節點才釋放出來,這是他們能做的而別人不能做的。」
李開復預計,五個月後就會有不少類似o1模型的能力出現在各個公司,包括零一萬物。「一年半以前,大家覺得大模型最厲害的地方就是預訓練,現在發現後訓練同樣重要,要感謝OpenAI點醒我們這一點,我相信很多中美公司都在往o1方向狂奔。」
與上一代大模型相比,零一萬物Yi Lightning追擊GPT-4o性能水平的周期從六個月縮短到了五個月,後續應如何進一步縮短時間差?
李開復對此表示,縮短時間差非常困難,雙方在算力資源、技術上的確存在差距。但中國大模型廠商在研發上有其特色,比如數據處理、訓推優化等。保持六個月左右的追趕周期,已經是很好的結果。
「千萬不要認為落後六個月是一個很羞恥的事情,或者一定是要追趕的事情。」李開復認為,如果要破局,可能需要一個前所未有的算法才有機會。
作者: 孫小程