國產大模型狂飆,大廠跑步入場,誰能率先做出第一個中國版GPT

2023-04-14     財經無忌

原標題:國產大模型狂飆,大廠跑步入場,誰能率先做出第一個中國版GPT

文 | 山核桃

熱火烹油的大模型賽道打起了「嘴仗」。

搜狗前CEO王小川評價百度創始人李彥宏的採訪發言稱:「你們採訪的可能是平行世界的他,不是我們這個世界裡的。」

而針對王小川的評論,百度集團副總裁、搜索平台負責人肖陽又回應道:「王小川脫離一線太久,確實跟我們不在一個宇宙,自然對國內人工智慧技術的發展缺乏了解。」

意外的是,王小川在14日凌晨又「嘲諷」了一把,稱對 方是「脫離一線15年的人,去懟離開1.5年的人」。

這場爭論也暴露出創業派與大廠間微妙的競爭關係。

毋庸置疑,大模型技術徹底點燃了科技圈的熱情,創業者忙著招兵買馬,生怕錯過了新風口;一級市場關於大模型的投融資熱度攀升,不少FA們甚至跑去B站開始惡補AI知識。

政策端也在吹來暖風,北京市經濟和信息化局發布的《2022年北京人工智慧產業發展白皮書》顯示,今年,北京將支持頭部企業打造對標ChatGPT的大模型。

熱鬧只是硬幣的A面。

無論是忙著官宣大模型的科技大廠,還是廣發英雄帖的創業公司,身處這股浪潮之中的人們都在思考一些關鍵問題:率先做出第一個中國版GPT的是誰?還有多久才能做出來?市場格局又會是發生怎樣的變化?

這些問題都難以給出正確的答案,事實上,也沒有人能給出準確的回答。畢竟,人們總是高估一項科技所帶來的短期效益,卻又低估它的長期影響。

本文將圍繞當下中國的大模型競爭現狀,基於行業資料與研究,主要回答三個問題:

1. 為什麼國內科技公司要紛紛競逐大模型?

2. 火熱背後,中國科技公司究竟缺什麼?

3. 中國科技公司「大模型之戰」的走向會是什麼?

為什麼極客們都愛大模型?

理解中國科技巨頭們的「大模型焦慮」,一張產品發布時刻表就夠了。

在OpenAI發布GPT-4大模型後,百度用「Demo演示」的形式正式發布文心一言。同樣在3月,53歲的周鴻禕決定「把剛出生的孩子抱出來給大家看看」,他推出360的大模型產品,甚至倉促到名字都要現場取。

隨後的一個多月里,科技巨頭、創業公司與高校研究院們展開了一輪關於「大模型」的軍備競賽,整個4月可以被稱為「大模型的發布月」,繼百度之後,華為、商湯、阿里已在4月亮出自己的大模型產品。

最新的消息是,京東計劃在今年發布新一代產業大模型「言犀」,被視為「京東版」ChatGPT。

大模型也成為了網際網路大佬扎堆二次創業的熱門賽道。

原美團聯合創始人王惠文、創新工場CEO李開復、前京東AI掌門人周伯文、前阿里技術副總裁賈揚清等均入局創業。前搜狗CEO王小川的百川智能已完成了5000萬美元融資,王小川給了自己一個DDL:「今年年底做到國內最好的」。

一位業內人士這樣形容當下百花齊放的圖景:「(這波創業)很像2000年左右的網際網路創業潮。」

普通讀者們很難理解科技圈對大模型的擁躉,畢竟類似的創業潮在元宇宙、XR行業也都復現過。但如果深入理解人工智慧的發展歷史與傳統AI時代的困境,就能理解為何這群極客們如此熱愛大模型。

關於大模型的定義,OpenAI創始人Altman與李開復更願意將大模型定義為「一種新技術平台」,而學界則將「大模型」對比「小模型」,定義為一種「基於大量數據訓練的、擁有巨量參數的模型」,這種模型能適應廣泛的下游任務。

在AI1.0時代,比起創業者對AI智能化的疾呼,大多數人對人工智慧只停留在一些單一場景產品端的理解。

例如人工智慧客服、人工智慧質檢等,上述場景都是針對一項任務具體開發一個專用小模型,並不具備「理解能力」。就像周鴻禕將此前的人工智慧產品形容為「人工智障」,在他看來:「在GPT之前,從來沒有一個人工智慧的產品能真正的理解我們這個世界。」

從人工智障到人工智慧的進化,大模型的出現意味著人們正式進入到AI2.0時代,這背後是大模型的湧現性使然。

湧現是人工智慧領域經常會被提及到的概念,代表一種從量變到質變的過程,當數據規模足夠大,參數達到千億級,即使在沒有專門訓練過的領域,AI也能湧現出知識理解和邏輯推理能力,華東政法大學人工智慧與大數據指數研究院將「湧現性」定義為一個「多種技術融合的結果」:「(大模型)有效集成自然語言處理等多個人工智慧核心研究領域的多項技術,實現1+1>2的融合式湧現。」

換言之,大模型有望解決「人工智慧如何理解世界」的問題,實則提供了一條可能邁向AGI(通用人工智慧)的可能性。

另一方面,大模型的通用性也在激發更多的商業圖景,解決了AI1.0時代的諸多問題。

在上一波AI創業潮中,總結AI企業所面臨的問題主要兩點:一是成本問題,清洗與標註海量的數據需要耗費巨大的成本,商湯科技聯合創始人、副總裁楊帆曾表示,對於每一個新場景,公司都要重新收集新數據,搭建定製化模型。

這種開發模式很像「小作坊」,不但解決問題的成本極高,開發模式也十分低效。

在實際落地過程中,應用場景的複雜性導致AI應用的「孤島化」,李開復曾提到一個例子:「如果今天一家銀行想做AI應用,但沒有任何數據可以用來冷啟動,還要收集、清洗、標註數據,再去做模型,整個過程代價都很大。」

而當大模型已成為上層應用的技術底座,可以實現在AI1.0時代無法實現的跨領域部署,支撐終端、平台、系統等產品應用落地。這種像搭積木一樣「組合創新」的可能性,以及商業化的能力就像ChatGPT一樣,人們不僅發現,它可以深夜聊天,撫慰人心,還會寫程序和講故事。

成本問題之外,並不具備通用能力的小模型,由於無法向行業進行推廣與復用,難以形成規模效應,也就更難言盈利。

這種「通用性」激發出諸多新的商業圖景,可以將其理解為AI時代的「作業系統」,在降低開發成本的同時,人人都可以是開發者,由此發現與生產出新的產品與應用場景。

找錢、找人、找應用場景

大模型競賽的槍響之後,創投行業又復現「元宇宙」的熱潮。

有大模型企業1個月見的投資人相當於去年一整年。一級市場關於大模型的投融資熱度攀升,不少FA們甚至跑去B站開始惡補AI知識,生怕錯過一個好項目。

但搶到這張通往新世界的「船票」並非容易,區別於AI1.0時代, 找錢、找人與找應用場景的焦慮,在這一波競逐中,體現的尤為明顯。

首先是找錢。 參考多位創業者的觀點,2億美元是行業普遍認為的啟動資金。拆解來看,以硬體成本為例,研究機構TrendForce在一份報告中指出,要處理1800億參數的GPT-3.5大型模型,需要的GPU晶片數量高達2萬顆,未來GPT大模型商業化所需的GPU晶片數量甚至會超過3萬顆。

僅在算力門檻上,很多創業企業便無力與大廠抗衡。

因此,表面上熱火朝天的大模型賽道,風大「魚」貴,但實際投資人們心裡也知道,僅靠幾張PPT創新的時代過去了,投資既是要投靠譜的人,也要考慮賽道與具體的商業路徑,畢竟,錢也一定要投在刀刃上。

雲啟資本合伙人陳昱在接受《甲子光年》採訪時就表示:「做大模型創業的公司要融到大錢不容易了。」

英諾天使基金合伙人王晟曾表示,「我們也經常『刷論文』,看到AI領域裡很棒的論文,直接就去找作者了,看他是一個學霸,還是有創業潛質、業務沒有商業化的潛力,如果合適,我們也會建議他創業並考慮投資。」

比起AI1.0時代的純科學家創業,AI2.0時代更像是一場網際網路大佬與科學家們的「集體二次創業」。

能夠融到「大錢」的要麼是有創始人經歷或個人魅力背書,要麼就是此前長期跟蹤孵化,雙方一直保持著良好的合作關係。

比如,目前融資總額已達數億元的瀾舟科技是創新工場從0到1孵化出的企業,而由前京東技術委員會主席周伯文創立的銜遠科技,背後的參投方啟明創投等均是AI領域的長期捕手。

其次,找到合適的人也並不容易,在這一點上,科技巨頭與創業公司面臨相同的處境。 在一檔播客節目中,已宣布加入光年之外的北京智源人工智慧研究院副院長劉江曾發出呼籲:「所有的同學,如果你是AI的頂級人才,或者有這樣的人,歡迎來到光年之外。」

「大數據+強算法+大算力」被視為支撐大模型落地的重要公式,大廠有算力,也有數據,能夠提供標準化的產品,但算法背後對應的則是人才。大廠很難留住強算法人才的原因在於,大模型投入是一件長期主義的事,必定會面臨與既有業務之間的衝突,從大廠出走的諸多大模型創業者的經歷已然說明了這一點。

而對創業公司而言,即便有首席科學家的支撐,找到合適的人也並不容易。

聆心智能創始人、清華大學計算機科學與技術系長聘副教授黃民烈認為,如OpenAI這種技術見長的公司需要很多特別牛的工程技術人才。

對創業企業而言,回到前述的融資環境下,無論是基於創始人的背景背書,抑或是資源合作,都需要長期積澱。

同時,在強調生態的大模型賽道,創業型企業勢必要面臨來自投資方、合作方乃至競對間的博弈,一個合適的夥伴不僅要在自己的細分領域內做到頂尖(懂技術+懂產品),還有隨時保持戰略的獨立性,不輕易站隊。

最後,能否找到合適的應用場景,另闢賽道,並迅速建立護城河壁壘,這一問題也同樣拷問著入局者。

百度李彥宏將當前的大模型生態分為三類,他最看好應用層的市場機遇。

第一類是新型雲計算公司,雲計算主流商業模式將會從IaaS變為MaaS(模型即服務)。

第二類是進行行業模型精調的公司,介於通用大模型和企業之間的中間,這類企業可以基於對行業的洞察,調用通用大模型能力,為行業客戶提供解決方案。

第三類是應用層的企業,基於通用大語言模型開發應用服務,這可能才是真正的機會。

區別於國外專業化的分工,當前,國內的大模型賽道的創業模式主要分類是三類: 一類是聚焦基礎層,對標OpenAI,發揮基礎設施的作用。一類是錨定中間層,不需要如OpenAI一樣花大錢做底層,掌握通用化能力,可以通過開源大模型做精調,讓模型具備差異化能力,最終可以形成垂直類模型。還有一類就是調用大模型API的企業,專注開發大模型具體場景的應用,如Jasper。

如果將大模型比喻成AI時代的電,那麼基礎層與中間層擔任的都是「發電廠」的角色,需要極高的門檻,對資金、技術以及資源有嚴格的准入壁壘,大多也是大公司間的競逐。

百度、阿里、華為頭部企業均採取「模型+工具平台+生態」三層共建模式的模式,推動業務的正向循環。

大廠的競逐中,也湧現出一些創業公司,既做大模型,又將其能力輸出至垂直行業,形成定製化模型,雖然避開了與有錢有勢的大廠們的直接競爭,但也面臨三大難題。

一是數據如何才能做專做細,很多行業定製化模型依舊難以形成數據飛輪與場景飛輪。二是大廠極容易摘低垂的果實,垂直大模型實現復用的前提是必須要在該行業建立壁壘與護城河,即「人無我有」的競爭優勢。三是通用化往往是歷史的趨勢,因此「未來垂直大模型是否會最終被通用大模型取代」這一問題也值得思考。

大船票or小船票?

人工智慧專家侯世達的學生梅拉妮·米歇爾在《AI 3.0時代》里認為,研究人工智慧與賽道中的創業者們都熟悉了一種模式——先是「人工智慧的春天」,緊接著是過度的承諾和媒體炒作,接下來便是「人工智慧的寒冬」。從某種程度上來說,這種模式以5~10年為周期在不斷上演。

正在興起的「大模型熱」也必定會經歷從繁榮到擠去泡沫的過程。

對中國的科技公司而言,「能不能做出一個中國版GPT」「中國創業公司里是否會出現一個OpenAI」。對上述大模型行業的叩問,從業者們看法不一。

李彥宏在被問到「中國創業公司里會不會再出一個OpenAI?」時,他直接回答「基本不會了」,「沒有必要再重新發明一遍輪子。」

但另一種觀點也認為,中國攻堅大模型依舊難以繞開OpenAI,這種危機感越發強烈。曠視科技聯合創始人印奇在接受鈦媒體採訪時表示,中國攻堅 AI 大模型要先把GPT-3.5復現出來,但面臨長期技術創新與短周期商業化兩重壓力

「未來的一段時間,能不能有一個公司首先把大模型真的做出來,且性能真的是達到GPT-3.5,這是所有事情的起點。就像菜你沒有炒過,不知道鹽和味精怎麼放,而且GPT所消耗的資源、門檻都非常高。」

是崇尚「大算力+大數據+強算法」的暴力美學,還是專注將一個垂直模型做透做專?中國企業的機會又在哪裡?又可以在哪些方面深耕與挖掘?

這些問題的答案都亟待解決。

與此同時,人們也關注大模型行業未來的市場格局演進。未來究竟是兩三家企業間的競爭,還是百花齊放?「大船票」和「小船票」或牽引企業走向不一樣的結局。

在關於大模型的這場遊戲中,儘管尚未看到終局,但對入局者而言,有兩大方向是確定的:

一個是應用與場景先行的邏輯。 國產大模型極為強調產業側的價值,一方面當前中國智能化浪潮下,產業側數字化實踐本就有廣闊的市場需求,另一方面在2B生態下,基於垂直應用的實踐本身也有利於形成數據飛輪與場景飛輪。

以金融業為例,BloombergGPT的誕生已說明了這一領域既有數據基礎,也有多元化場景需求。但在此前的實踐中,存在的問題一是數據量龐大,AI專家培養成本高,因此只有頭部銀行機構願意嘗試。二是金融機構對業務的連續性與數據的準確性有著嚴苛要求,因此也對大模型廠商對行業的理解能力提出了高要求。

換言之,回到業務本質,需要什麼就用什麼。

通用意味著泛化,這為能夠輸出精準能力的企業提供了機會窗口。如果能將一個垂直領域做專做透, 用高質量的數據持續優化模型,將價值鏈做長。 對創企而言,金融、醫療、教育等領域都有市場空間。

二是先行者已提供了路線參照。 如周鴻禕所言,差距並非是天壤之別,路線已經明確。周鴻禕指出:「發展大語言模型,別人已經指明了技術路線,剩下的就是長期主義指導下的時間問題。」

很難回答,此輪的大模型競逐是否是人工智慧競賽浪潮最後的哨聲,但幾乎每個從業者都害怕自己會成為「最後的一個」。科技大公司們恐懼被顛覆,創業公司恐懼被大公司們顛覆,更大的恐懼則來自於大模型超越摩爾定律的技術疊代速度。

而在商業世界裡,危機與恐懼往往是最好的原動力。

文章來源: https://twgreatdaily.com/zh-cn/4c49d2a6f46c134539fc3abf14a9dc3c.html