大逃殺里的中國AI大模型:大多數公司留不下來

2023-08-18     AI狐頭條

原標題:大逃殺里的中國AI大模型:大多數公司留不下來

原創 | 星海情報局

7月份,微軟公布了Office 365 Copliot的企業版價格,30美元/月,我看完第一個感覺是有點吃驚:外界沒那麼關心微軟的可能不太清楚,但懂To B業務基本都知道,微軟這些年B端定價慣常穩如老狗,割起各大公司的肉來刀法堪稱精準,它說敢賣30美元一個月,那就是確實能賣30美元一個月,而這已經明顯高於了此前外界所預估的價格。

換言之,微軟對Copliot的定價,從某種意義上說,就意味著AI應用落地的時代確實是來了,而且已經相當賣得上價。

相比之下,國內AI大模型的落地應用,明顯還缺乏成熟的市場化產品,但也基本都已經開始進入內測,只是因為用戶習慣不同而採取了不同的模式,走入收費階段的速度相對慢了一些。

關於中美AI大模型之間的差距和優劣,業界討論得很多,幾乎所有切入相關領域的人都會被問到這個問題,但大家的看法很難說得上統一。比如李彥宏曾經說文心一言離OpenAI只有兩個月差距,王小川對此的評價是:那估計我們沒在同一個世界。

根據星海的不完全統計,不到一年的時間,國內的大模型已經超過了120個,中美兩國大模型公司占了全球80%。中美AI大模型到底有幾年的差距,中國大模型真的落後了嗎?中美AI競爭的路線又有何不同?中國短短半年裡湧現出的百家大模型企業混戰,到底打到了什麼程度?

百模大戰沒有硝煙

我上半年參加過幾次AI的會,開門的閉門的都有,大家提的最多的前些年AI是真的不賺錢,連融都未必能融得到錢,有一點全跑自動駕駛那頭去了,其他的都已經死了不知道第幾輪。

但自從ChatGPT橫空出世,情況就不一樣了。爆火的大半年裡,AI大模型的技術水平未嘗就真的能有什麼大爆炸,但商業上的環境確實是有點「病樹前頭萬木春」的意思——活了。

但也沒想過,這麼快就能活得跟Copliot一樣賣出30美元一個月的價錢。

根據星海情報局不完全統計,中國目前已經有超過120家機構或企業發布了自己的AI大模型,其中10億參數規模以上的大模型就已經有79個,有20個是通用領域的大模型,基本來自網際網路大廠和科研院所,其餘均為垂直領域的產業應用大模型。毫無疑問,中國的AI產業正在進入一場名副其實的「百模大戰」,而且已經有了逐漸開始向垂直領域深入分化的趨勢。

這裡簡單做個科普,我們目前所說的大模型,通常來說的分類是兩種,一種是通用大模型,模板就是ChatGPT,可以聊天,問答、做題,特點是比較泛化,幹什麼都成,但相對來講不夠對某一個產業深入精通。

所以有了第二種,行業大模型,也叫垂直類大模型。典型的比如華為的盤古,京東的言犀,都是直接面向產業,更聚焦應用,強調幫助企業進行生產活動和降本增效能力的工具。從定位和特點上講,行業大模型更類似於我們所熟悉的企業服務軟體或工業軟體,只不過現在升級成行業AI了。

目前,針對金融、醫療、政務及公共服務、科研、工業、客服等領域服務的大模型數量相對較多。地域分布上,北京占了半壁江山,其次是上海、廣深、杭州和江蘇。

毫無疑問,這一輪AI大模型的發展已經形成了明確的產業趨勢。而根據這些大模型背後的研發團隊來看,也可以分為三類:

一是大廠自研。百度的文心一言,阿里的通義千問,華為的盤古,騰訊的混元,京東的言犀,位元組的火山方舟,螞蟻集團的貞儀,小米的MiLM-6B等等……都可算作此列。

網際網路浪潮里成長起來的科技大廠,包括軟硬體廠商,即便暫時還沒有,但也不可能永遠都不在大模型領域進行布局。還有通信業三巨頭,移動、聯通、電信都有自研大模型。很多大廠和巨頭出於自身的數據安全需求,只能走自研路線,這些廠商一遍要根據自身業務協同出發進行相關研發,另一邊也可以選擇直接收購。而收購的標的,則主要來源於下面的第二類。

二是獨立創業團隊。其中不乏頗具技術實力的明星創業者入局,還有一些是已經功成名就過的大廠背景連續創業者。比如搜狗創始人王小川,就在五道口的搜狐大廈二層對外官宣了「百川智能」。官宣的時間是2023年4月10日,如果你同時有王小川和王慧文的微信,就會發現僅僅四天之前,王慧文也在搜狐網絡大廈,他創辦的AI企業光年之外的新辦公室就在這裡,搬進來的第一天他發了一條朋友圈:「新辦公室第一天,切個蛋糕。」

王小川的人工智慧夢想大約萌芽於成都七中,他16歲參與老師謝晉超和當時中科院成都所的張景中一起組建的「幾何定理機器證明課題研究組」,做成了在計算機用吳文俊消元法實現初等幾何定理的全部機器證明,拿了「億利達青少年發明獎」,獎項發起人和最後給王小川頒獎的人,都是楊振寧。而王小川做成的這個證明,所涉及的是中國人工智慧領域最重要的基礎理論之一,他可能是如今功成名後再出發的企業家中,離人工智慧學院派們幾乎最近的一個「技術流」了,百川智能的背後也有著清華一脈力度不小的支持。

三就是學院派,無論是科研院所還是各大高校,都不可能不做這方面的研究,但這些團隊的組織構成和戰略目標大多更偏學術一些,偏向應用層面的則大多還會找大廠或其他創業團隊進行合作。其中比較引人注目的,比如今年初復旦大學計算機學院團隊發布的MOSS大模型,清華的ChatGLM,還有中科院自動化所的紫東·太初。

大模型爆火滿打滿算也就不到一年,但噼里啪啦出了一百多個團隊,百模大戰已經擺在檯面上了,即使遠沒有當初「百團大戰」那麼搞得沸反盈天,但也已經足夠讓有些人產生忐忑甚至不滿。

中國人這些年見了太多狂飆之後的落寞與一地雞毛,多少有點PTSD。但站在一個產業觀察者的角度來說,一個殘酷的事實是,任何國家的產業的競爭力從來就是這麼跑出來的,沒有這樣雨後春筍般冒出來的企業和密集的投資,哪裡來的產業崛起和龍頭騰飛?

往近了說,中國新能源汽車產業能有今天的成就,不知道埋了多少當年的「造車新勢力」,中國手機產業的騰飛也不知道一路死掉多少山寨機。而往遠了說,美國半導體產業浮沉小一百年,也絕對算得上一將功成萬骨枯。

任何產業想發展起來,最初的起點都是拿錢與人去堆,才留得下技術、經驗,和足以支撐起一個行業的人才。百模大戰能打起來,本身就已經是中國AI大模型競爭力的一種體現,如今中美兩國大模型公司加起來占了全球的80%還要多,絕大部分國家甚至已經沒有資格坐上這個牌桌。

巨頭的遊戲

AI大模型的創業團隊很多,但大多數可能留不下來。

——絕大多數人做出這個判斷的原因在於成本。國盛證券曾經估算,GPT-3訓練一次的成本約為140萬美元,對於一些更大的LLM模型,訓練成本介於200萬美元至1200萬美元之間。

按照今年1月的平均用戶訪問量計算,每天約有1300萬獨立訪客使用ChatGPT,對應的晶片需求大約是3萬多塊英偉達A100,僅這一項的初始投入成本就要8億美元,每天光電費至少5萬美元左右。而根據Analytics India Magazine的一份報告估算,ChatGPT的單日運營成本大約是70萬美元。

意思就是小公司根本燒不起這個錢。

而另外一個障礙是,小公司在產業化落地上能走的路也更少。

大模型的商業化終點是產業,這是已經不必過多解釋的行業共識。但落入產業的條件是:

1、本身自己有產業資源;

2、掌握著可以觸達產業資源的平台接口或渠道。

第一種,本身自己有產業資源。主要是通過將AI能力融入自身業務,進而影響產業上下游。

比如京東做言犀,側重的就是零售、金融和供應鏈物流,這些都是典型的京東自有業務,做出來直接有測試場景和落地應用的空間,根本不用假手於人,而且還能向上下游輻射拓展第一批種子用戶。螞蟻集團的「貞儀」和百度金融旗下的「軒轅」,也是類似邏輯。(恒生電子的LightGPT,學而思的MathGPT)

同理的還有網易有道的子曰,直接落地落到教育口,甚至還能配套自有硬體,比如有道的詞典筆。攜程的問道,閱文的妙筆,用友的YonGPT,這些在各自領域舉足輕重的垂類巨頭親自下場做閉源大模型,從戰略上來講進可攻退可守,先期的獲客、訓練成本,適配、調整效率,都有顯而易見的優勢。

怎麼都比小公司吭哧吭哧做出來個普適款的大模型,再吭哧吭哧追在產業後面玩命推銷,然後一點一點做產業接入和適配的模式,要省力氣得多。

網易有道「子曰發布會

第二種,掌握著可以觸達產業資源的平台接口或渠道。這種模式基本上是將AI大模型接入自身平台,讓平台獲取AI能力後,能夠更好地服務原有的產業端客戶。

這裡最典型的,軟體層面比如阿里釘釘搭載的通義千問,位元組跳動未來要做的火山方舟;而硬體層面則比如華為要接入工業系統和整個鴻蒙的盤古系列,還有小米初具雛形的MiLM-6B等等。

根據 C-Eval 給出的信息,MiLM-6B 模型已經在計量師、物理、化學、生物等多個項目獲得了較高的準確率

阿里「通義千問」目前推得最順利領域之一,就是在釘釘中的應用。釘釘本身就是做企業服務的平台,產品架構的底層邏輯就是建立在公司和組織層面上的,而且一直都在做深入產業的工作,安全性也已經得到過驗證。這意味著,通義千問接入後,可以從最底層調動原始數據幫助決策者進行定製化的分析和總結。

這種本身就有企業服務平台的公司,接入AI大模型之後,是最有可能幫助實現企業內部AGI的。而目前國內做這個且有平台級能力的,除了阿里的釘釘,就是位元組跳動的飛書,還有騰訊的系列套件,二級梯隊可能是以WPS為主要產品的金山辦公,或者筆記軟體有道雲或印象筆記等。

當然還有一個比較特殊的百度,這家公司雖然有很強的技術實力,但因為入口在搜索,所以經常卡在To C和To B的中間,自身缺少殺手級別的企業應用。這也就能理解為什麼在ChatGPT爆火後,百度要那麼著急發布文心系列——不是很多人以為的什麼追趕進度,而是極其現實的:為了搶市場。

百度沒有釘釘,沒有飛書,也沒有微信或者WPS。但有意思的是,百度除了搜索之外,還會有車和智能交通配套系統。

集度在發布會上宣布全面接入文心一言;圖源來自:現場官方返圖

這剛好就是我們要說第二種模式:直接從硬體切入。

汽車領域,集度在2月份就已經宣布接入百度文心一言,理想6月在常州發布了自家研發的認知大模型"Mind GPT",問界未來介入華為旗下的盤古,大體上也都是時間問題。傳統各大廠商未必自己完全走自研的路,但不可能不做,這也是一個AI大模型廠商們的兵家必爭之地。

各大手機廠商也顯然都不會缺席。華為已經接入了盤古,小米也已經發布了MiLM-6B,OV和榮耀雖然目前還沒有落地的大模型,但也都已經進行了大量布局,將AI接入自身手機系統做智能化升級,都只是時間問題。

當然,華為更特殊一點,盤古系列是鴻蒙的最佳拍檔,但鴻蒙卻不只為了華為手機而生。華為在工業和基礎設施領域的布局,未來都將會成為鴻蒙+盤古的主場。

華為開發者大會宣布鴻蒙4.0接入盤古大模型;圖源來自:現場官方返圖

無論是從成本,還是從產業資源上看,AI大模型這個智能時代的底層支持領域,都已經越來越趨向於巨頭們的遊戲,留給小團隊和獨立創業公司們的機會雖然不是沒有,但確實已經越來越少,而抓住機會也正在變得越來越難。

中國人最擅長的「應用層戰爭」

固然牌桌上只剩下了中美兩國,但中美之間依然存在著明顯的差距。星海一直以來經常會被問的一個問題是:在這個領域,我們和全世界最先進的水平差幾年?

在AI大模型上,這個問題李彥宏和王小川都回答過。李彥宏說文心一言和OpenAI差距大概是兩個月,王小川挺震驚,說那你們問的應該是平行宇宙的李彥宏,不是我們這個世界的。

記者問此話怎講,王小川:「那怎麼可能只差兩個月啊?那一定是另一個宇宙嘛。」

在王小川概念里,如果要用時間衡量,OpenAI比國內應該領先三年的時間。之前業內都說追上GPT-3.5可能需要一年時間,但人家已經到4了,還有5在訓練,所以他覺得有三年。如果大家很努力,那可能會短一點。

但應用層不一樣。

王小川六月去矽谷轉了一圈,去之前,他想的是,中國AI大模型已經在追求「理想」的道路上比OpenAI慢了半步,但落地他想要比美國人快上半步。但交流完回來,他的想法就變了:落地這事,王小川覺得能比對方快三步。

王小川去矽谷的時候發現,那幫子不差錢的工程師已經在研究怎麼把1000萬塊GPU聯在一塊做模型架構了,但英偉達一年才生產100萬塊GPU……

而反面是,雖然工程師文化濃厚,但美國有大量工程師沒有任何應用的經驗,一旦從做技術延展到做應用,「能力實在不咋樣」。

大模型是一個必須落向應用,但卻又沒有辦法做完服務用戶最後一步的綜合性工程,而在這個領域,落到應用層之後的應用反饋,常常會是比空中樓閣式干數據訓練更好用的東西。在《TikTok大劫案:美國總統也搶不走的武功絕學到底是什麼?》一文中,我們講Tiktok核心競爭力的時候講過一個類似原理:當有效數據量到達一定臨界值的時候,將會無限拉近不同算法帶來的準確率差距。

也就是說,應用層的反饋,某種程度上會決定模型訓練的質量。讓訓練變得更加高效,同時大幅削減訓練成本。我們可能起步晚,但應用能做起來,我們會跑得更快。

在《大國鎖鑰》一書中,我寫過中國網際網路為什麼能做到全球領先,其核心的動能就是應用過程中所爆發出來的大量創新和經濟效益,反哺了基礎層研究所需要的資金和資源,一點點補全了很多我們在70年前,甚至100年前就已經落下的功課。

AI是一個同樣適用的領域。

在美國,微軟(OpenAI)、Google、Meta的巨頭之戰,基本上已經將通用模型層的格局固定了下來,幾乎沒有創業公司會選擇「再造一個OpenAI」。轉而興起的是如火如荼的應用層創業,通用層、應用層之間涇渭分明。

但在中國,通用模型層的百模大戰還遠沒有分出勝負,從效果上誰也沒有做出決定性的優勢,但隨之而來的是對應用形式的大量創新探索。本身就在AI垂直領域做通用模型開發的廠商,如科大訊飛,也在做出通用模型後很快就發布了訊飛星火app去切入學習和辦公場景。

這種通用層和應用層相互哺育的模式,是中國獨特的發展模式,也是中國未來最大的機會所在。

結語

輿論場上面對中國如今打得不可開交的百模大戰,有過很多不好的聲音,其中一種是,OpenAI已經做出ChatGPT-4了,中國公司現在還在通用層大模型上捲來捲去早就晚了。看上去說了大實話,但其實很可笑:中國人什麼時候怕過起步晚了人家幾步呢?美國人早就把核彈造出來了,中國就不造了嗎?

在AI這件事上,早或者晚其實已經沒那麼重要了,重要的是我們必須得做。自認大模型技術水平存在差距的王小川被問到:起步晚了的中國還有沒有彎道超車的機會?

他的回答是:「超車我們現在不敢提,可能過幾年後大家會找到路徑。就像網際網路剛開始的時候,我們上來第一句話,就說要彎道超車嗎?」

路要一步步走,中國廠商的AI之路,最重要的是先做自己能做到的事情。

活下來,然後——

追上去。

星海情報局-精選代表作

文章來源: https://twgreatdaily.com/zh-hk/39e394cf95a527630d225d8744e4a936.html