李開復大模型向B端要效益

2024-10-16     北京商報

10月15日深夜,零一萬物的Yi-Lightning大模型在LMSYS盲測競技場的投票數超過一萬次,拿到了這個國際權威測試榜單的入場券,「出來的結果是,我們排在全球第六」,10月16日上午,零一萬物CEO李開復向媒體宣布時一字一頓。為了強調,他還補充,「我們和馬斯克(特斯拉CEO)的xAI Grok打平,並列第六,按公司算零一萬物排在全球第四名」。

當天,李開復還向媒體公布並演示了to B戰略下的行業應用產品AI 2.0數字人,這一產品聚焦零售和電商等場景。「to B就做國內,做有利潤的解決方案。」李開複目標明確,面對國內C端(用戶)市場,零一萬物則會非常謹慎,「先不推出中國本土新的to C的應用」。

訓練成本是對手的1%

「任何一個新的模型要有一萬次投票才會進入這個榜單,昨天(10月15日)晚上,Yi-Lightning模型在LMSYS上終於達到了一萬次以上的投票。」李開復邀請媒體體驗LMSYS這個大模型擂台。

作為一個公益項目,LMSYS被認為是「大模型最強盲測」,援引這一榜單的科技大佬不止Open AI的CEO山姆·奧特曼和谷歌首席科學家傑夫·迪恩。

根據李開復公布的總榜單,零一萬物的Yi-Lightning排在Open AI、Google和xAI的大模型之後,全球排名第六。具體到分榜,在中文分榜,Yi-Lightning與o1-mini等模型並列排名世界第二;在多輪對話分榜,排名第三;數學、代碼分榜上,Yi-Lightning分獲第三、第四名;艱難提問、長提問榜,Yi-Lightning都取得第四名。

據了解,Yi-Lightning是零一萬物開發的Yi系列大語言模型,支持上下文16K,是零一萬物最新高性能模型。根據內部評測數據,在8xH100算力基礎下,以同樣的任務規模進行測試,Yi-Lightning的首包(從接收到任務請求到系統開始輸出響應結果之間的時間)時間是Yi-Large的一半,最高生成速度提升近四成。

李開復介紹時,則向媒體重複強調了成本。

「我們知道xAI在訓練Grok時是幾萬張的GPU(圖形處理器),現在囤了10萬張GPU。我們這次預訓練只用2000張GPU訓練一個半月,花了300多萬美元,做出來的預訓練模型跟Grok打平,卻只花了它的1%或2%的成本。」李開復表示滿意。

他也再次重申,「零一萬物絕不放棄預訓練。做好預訓練是一個技術活,要非常多有才華的人在一起慢工出細活。如果一個公司有幸擁有懂晶片的、懂推理的、懂基礎架構的、懂模型的,有很多的做算法的人才能跨領域合作,我相信中國絕對可以做出世界排名前十的預訓練通用模型」。

把時間差保持在6個月

「但做這件事的成本比較高,以後可能做預訓練的大模型公司會越來越少。」李開復話鋒一轉,「據我所知,大模型『六小虎』(包括零一萬物、百川智能等六家獨立大模型初創公司)的融資額都是夠的,我們做一次300萬美元,這個錢頭部公司也付得起。」

還是圍繞著榜單做對比。GPT-4o是Open AI在5月14日推出的大模型,在最新的LMSYS總榜中,排在Yi-Lightning之後。「我們在10月把GPT-4o打敗了,所以零一萬物和美國頂尖模型的時間差只有5個月。」李開復說。

時間差是個老話題,從2023年初國內大模型扎堆上線,被一個又一個大佬回答過。這個問題重要與否見仁見智。不論得到的時間是多少,都證明了一點——差距依然存在。

「縮短時間差非常困難,畢竟人家10萬張GPU,我們2000張。能達到這個效果是因為團隊優秀、再加上研發有特色,用這套方法把時間差保持在6個月左右,已經是很好的結果了。如果要破局,可能需要一個前所未有的算法才有機會。」李開復同時告訴媒體,「千萬不要認為落後6個月是很羞恥的事情,如果用類似零一萬物的打法,我認為可能不只我們一家能把時間差控制在6個月,但難度不低。」

不參與價格戰

另一個層面的控制體現在價格上。目前,Yi-Lightning已在Yi大模型開放平台上線,0.99元/100萬Tokens。

一般來說,國內大模型企業普遍用1000Tokens定價。以科技大廠阿里云為例,官網列舉的通義千問系列大模型qwenturbo相對較低,營銷活動後的輸入價格是0.0003元/1000Tokens、輸出價格0.0006元/ 1000Tokens,即分別是0.3元/100萬Tokens、0.6元/100萬Tokens。

「這個定價確實具有顯著優勢,在競爭激烈的AI市場中,價格優勢往往能成為吸引用戶的關鍵因素。」北京市社會科學院副研究員王鵬向北京商報記者表示。

在和媒體溝通時,李開復三次提到這個價格,他承認這是白菜價,但也直言「零一萬物還是有利潤空間的,不參與價格戰」。

除了性能、價格,零一萬物對市場也有自己的堅持。

當天零一萬物推出to B新產品AI 2.0解決方案,把Yi Lightning實踐於具體行業解決方案。基於以Yi Lightning模型為代表的Yi模型,零一萬物搭建起了包含角色大模型、直播聲音大模型、電商話術大模型在內的一整套專用模型基座。

在回答to B、to C選擇的問題時,李開復告訴媒體,「一個大模型公司同時做to B、to C是很辛苦的,需要多元化的管理方式。選擇在國內做to B,是因為我們找到了一些破局的空間,比如用數字人來做零售、餐飲等,能做一個完整的解決方案。我覺得這樣的to B只能在中國做,to B就做有利潤的解決方案,而不只是賣模型,不只是做項目制」。

對於to C,零一萬物的主要布局在海外。在他看來,流量成本是大模型to C的很大問題,「在這樣的挑戰環境里我們會非常謹慎,先不推出中國本土新的to C的應用,已有的產品還會繼續維護」。

零一萬物的思路適合整個大模型行業嗎?「C端用戶沒有很強的付費需求和意願。想依靠他們來實現盈利,短期來看是不切實際的。」瑞達恆研究院經理王清霖告訴北京商報記者,「B端市場為了提高效率、跟上時代步伐、吸引投資人的注意力,可能有一些是相對剛需的購買意願。如真的能夠切入某一類或者某一個領域,了解他們的需求,是有可能搶占市場先機的。」

北京商報記者 魏蔚

文章來源: https://twgreatdaily.com/zh-tw/d075ed5970060dca57cc8c5d93deaf43.html














「法巴」魅影

2024-11-03