中國需要「下一個OpenAI」嗎?

2023-10-31   市界

原標題:中國需要「下一個OpenAI」嗎?

國內估值最快速超過百億的大模型創業公司誕生了。10月20日,清華團隊出身的大模型公司智譜AI宣布,今年內已融資25億元。有媒體稱,這家成立於2019年的公司最新估值已經超100億元,最高或達到150億元。

在公開的融資信息中,智譜AI的投資方頗為引人注目,包括了美團、阿里、螞蟻、騰訊、小米、金山、順為資本、Boss直聘、好未來、紅杉資本和高瓴等。尤其是在大模型賽道上一直各自為戰的騰訊和阿里,這次也聯手投了同一家項目。

國內大模型創業,清華系撐起了半壁江山。智譜AI和清華大學的關係更為緊密。智譜AI成立於2019年6月,由清華大學計算機系知識工程實驗室(KEG)的技術成果轉化而來。公司核心團隊中,CEO張鵬出身於清華計算機系,和公司總裁王紹蘭均為為清華創新領軍工程博士。現在智譜AI的不少研發人員,也曾參與過清華大學與智源研究院的合作的「中國首個+全球最大」悟道大模型項目。

大模型創業公司中,是否還能夠誕生一個「中國版OpenAI」?面對網際網路大廠們的資源和技術優勢,創業公司們又要如何突出重圍?圍繞諸多問題,市界近期和智譜AI CEO張鵬進行了深度對話。

復刻「中國版OpenAI」並不現實

市界:智譜AI在2019年正式成立,第二年,OpenAI發布了GPT-3。在當時,你們就認識到大模型的研發會是未來的方向嗎?在行業早期就all in到基座大模型的研發中去,並在2022年推出了GLM-130B,這中間智譜經過了什麼思考?

張鵬:我們的公司是在2019年成立的。GPT-3發布時,公司剛剛成立一周年。其實之前我們就一直在關注這個事情,當時正值公司一周年的慶典,我們邀請了中國科學院張鈸院士來參加活動,我們也討論了要聊些什麼,但大家的關注點還是放在了GPT-3上。

在早期,我們的團隊就發布了名為AMiner的平台,用以做科研情報分析和數據挖掘,因此我們對於這件事的敏感度是非常高的。在2019年開始,公司就在做一些相關的算法研究,也是差不多沿著這個方向在做。GPT-3的發布,其實是給我們帶來了一個信號:有人跑在前面了,這意味著,大模型的臨界點終於到了。

市界:大語言模型預訓練框架存在不同的技術路徑,OpenAI選擇的是GPT,谷歌選擇的是BERT,作為一家創業公司,智譜為什麼不用現成的,而是花大力氣自研GLM架構?

張鵬:一方面是出於技術探索和理論研究層面出發,我們是一直在關注這個技術,自己也有一些積累。GPT這個框架,也未必是最完美的,我們想嘗試,從理論上如何在這個框架基礎上能夠作出一些演進和創新。

另一方面,從現實出發,在此之前所有的預訓練框架或者算法,都是海外研發的。如果我們還是沿著它們的腳步前進,未來可能有可能會形成技術路徑依賴。而對核心技術和底層理論的自研和掌控,這是非常必要的。所以,我們也決定要自己去做這件事情。

2020年發布百億參數大模型後,公司決定,投入千億參數大模型研發中去。拿出大成本投入進去做這件事,事實上,還是需要一定的勇氣的。

和OpenAI相比,這類海外企業有很強的資本背景加持,可以放開了去做,不惜燒掉無數的資本。但在那時,我們公司還剛成立,雖然也拿了一些錢,但是跟要做的這件事所需的資金來比,還是不太高的。從理論研究上來說我們比較擅長,但真的投入進去後,發現還是很難的。但GPT-3還是給了我們信心。技術積累、團隊的共同努力,再加上一點運氣,取得的效果比我們預期的還要好一些。

千億大模型的發布,對於公司來講是一個重要的轉折點。我們可以進入一個比較快速的發展節奏了。

不得不說,其實後發還是有一定優勢的,我們可以站在GPT的肩膀上前進,把GPT和其他模型架構的優點融合起來。去年11月,史丹福大模型中心對於全球30多個大模型的橫向評測結果顯示:GLM-130B在準確性和公平性指標上與GPT-3 175B接近或持平,魯棒性、校準誤差和無偏性優於GPT-3 175B。

有一些企業嘗試沿著GPT-3的路徑去復現,其實反而沒有做到這樣一個程度。這也反證了,並不是簡單地去復刻OpenAI的方法,你就能達到它的水平。

市界:GPT-4在今年3月發布後,引發了這一波大模型浪潮。作為早期就all in進去的公司,智譜是怎麼看待這件事的?這給行業帶來的最大變化又是什麼?

張鵬:在去年年底的時候,我們還認為說,我們與GPT之間的距離已經在逐漸縮短。但GPT-4的發布讓我們認識到,其實距離還是很大的,人家也在以更快的速度往前奔跑。

但至少,這再次證明了,我們選擇的這條路是可行的,而且確實是存在很大發展可能的。

市界:在今年上半年,大模型批量湧現的時候,百度董事長兼執行長李彥宏就多次強調,不需要「重複造輪子」了。那麼,現下中國還會再出現一個類似於OpenAI這樣的公司嗎?

張鵬:在國內完全復刻一個「中國版OpenAI」,這個是不現實的。

我們對標它,其實更多地也是從技術上,從目標和方向上去對標的。它是美國公司,用美國的方式在中國市場做公司,可能是活不好、行不通的。大模型創業公司還是要因地制宜,在商業化、市場化等方面,制定自己的具體策略。

沒有基座,行業大模型是「空中樓閣」

市界:那麼在商業化落地方面,智譜是如何做的呢?

張鵬:OpenAI的商業化路徑其實很簡單。除了收取ChatGPT的用戶訂閱費用外,它主要是對API調用收費,這也和它所處的市場環境有關。

我們的創始團隊是從學校里出來,但在實驗室里已經和很多企業、機構進行合作,在做To B方面的經驗還是比較豐富的,對於這個市場也比較了解。我們在商業化路徑上,會付出更多的精力,去設計一些符合客戶需求的不同方案。

智譜AI為企業提供的服務模式更多。除了API調用外,還提供大模型服務私有化解決方案,包括雲端私有化和本地私有化,用以適應當下市場和客戶的需求。這應該是我們在國內獨有的模式,相應的實際落地案例也已經有了不少。

市界:在大模型的商業化路徑中,產業化趨勢已經非常明顯了。面向B端垂直行業的大模型,在短時間內紛紛湧現。對於做通用大模型和垂直行業大模型,智譜又是怎麼思考的?

張鵬:智譜還是主要會加碼研發基座大模型。對於行業模型這件事,我們確實也做過一些思考。

基座大模型和行業大模型,它們是並行關係、是競爭關係嗎?但實際上,我們認為,行業模型或者叫專業模型也好,應該都是建立在通用模型之上的。打個比方說,任何一個行業的專家,首先是不是也要具備非常強的基礎知識?同樣地,做行業模型,你的基座從哪裡來?還是一樣要用別人的基座。從整個市場的角度來說,沒有基座大模型的技術發展,是不可能「空中樓閣」式產生一大批行業模型的。

通用模型和行業模型,不是並行競爭的關係,而應該是合作關係。後者以前者為底座,是站在它們的肩膀上往上的。

行業大模型為什麼存在?是因為現在市面上有這個需求。那麼,企業的需求點到底是什麼呢?我覺得,是在當下這個時間段上,大模型如何能夠低成本、快速地去滿足某些特定場景的需求。而正是因為我們的基礎技術沒有做到GPT的水平,才誕生了行業模型存在的空間。

但問題在於,如果行業模型不能基於最強的通用模型,一起去共同演進,那麼它的市場空間也會越來越小,直到消失。

市界:大廠們也在積極推動大模型在產業中的落地應用,或者是利用本身的產業資源優勢,做平台+行業解決方案+AI應用,獲取企業客戶。作為創業公司,在市場競爭中優勢何在呢?

張鵬:和大廠比起來,我們是「船小好調頭」了。我們和國內的大廠,基本上是競合關係,有競爭,也有合作。

大廠的優勢在於資源豐富,它們的攤子也鋪得比較開。我們就是聚焦在做我們最擅長的事情:技術。在商業化落地方面,我們基於自有技術,會有更多的想法和靈活地處理去設計,幫助客戶去真正創造價值。

現在很多人在強調行業利好時,都沒有強調技術。我覺得,這是不準確的。人工智慧發展的關鍵是什麼?是認知,是對這個事情的宏觀認知,對大目標、方向路徑的認知,還有最關鍵的對技術的認知。

我們堅持做這件事,用很簡單的一個問題就可以解釋:一個供應商,它從頭到尾所有的技術都是自研的,你會不會優先選擇它?除非客戶要求的只有低價,否則,只要企業有對未來的規劃和預期,它自然就會作出選擇。

現在我們和GPT-4還有距離,GPT-4和真正的AGI也更加遙遠,大家的路還有很長。

市界:智譜AI的GLM-130B也選擇了開源,前不久阿里的通義千問14B模型也宣布開源,可以免費商用。大模型開源開放是否是個大趨勢?

張鵬:我們做開源這件事情,其實就是想保持AI生態的豐富程度。新的東西出來,不一定都最終會轉換成有實際價值和前景的技術,但它代表著活力,它是一種機率。我們在做基座模型的時候,也沒想說未來的基座模型只有一個。

市界:在大模型對公眾開放後,智譜也推出了面向C端的大模型產品矩陣,包括對話、寫作、繪畫、編碼等應用。那麼,智譜對2B和2C業務之間的關係以及側重點是怎麼看的?AI應用層接下來會迎來爆發嗎?

張鵬:從ChatGPT身上,我們就看到,To C應用是非常快速地積累用戶、形成數據飛輪閉環非常好的一個路徑。它的意義不在於可以賺多少錢,就算OpenAI好像也沒在這件事情上賺到多少錢。

當然,從公司商業化角度來講,它還有很多作用,比如說幫助你去拓展這個市場對公司和品牌的認知度等。你提到的很多產品,都是探索性質的,慢慢地,我們的規劃裡面會把這些東西探索出來。

我們也期待AI應用有一個大的爆發。或者不叫AI原生應用,而是叫大模型原生應用,因為AI還太寬泛,包含的東西還是比較多。在現在的時代,圍繞大模型或者生成式AI,大家期待的是用大模型重塑很多東西,包括應用生態。

市界:「百模大戰」持續了大半年,接下來,會不會出現行業整合的狀態?

張鵬:整個行業的生態圈是會有一些變化發生的。之前的混亂狀態肯定會逐漸結束,就像一池渾水,總會沉澱下來。慢慢地,大家會落到自己合適的、最擅長的位置上。那些長時間找不到自己定位和生存空間的,可能就會被淘汰,也許也會出現整合。

市界:智譜AI接下來的發展規劃是什麼?

張鵬:我們的定位仍然是做通用基座大模型。現在做C端也好,做垂直應用也好,目的都是為了「跑通」,利用我們的技術積累、知識,我們know-how的經驗,去把這個事情跑通。之後,我們會把這些內容用開源、用培訓和合作夥伴賦能等方式,把它釋放出去。我們希望的是,整個市場蛋糕被做大。

可能我們還沒有那個能力,能判斷出整個大市場的趨勢。但是我們的初衷就是想去努力做這件事情。

市界:智譜怎麼解決高算力成本投入和人才缺口問題?

張鵬:算力確實是個大事。我們也啟動了GLM國產晶片適配的工作。

實際上,我們從較早的時候就開始做這件事情了,和國產晶片廠商的合作也一直在推進。這其實是沒有直接收益的,做這個要付出額外的成本,但是我們仍然在盡最大努力。國產晶片廠商們也投入了很大熱情,我們能給它們帶來機會,這些合作也是互利的。

作者 | 楊 潔

編輯 | 孫春芳

運營 | 劉 珊