「百模大戰」,掀動資本波瀾

2023-08-03     商學院雜誌

原標題:「百模大戰」,掀動資本波瀾

國內網際網路巨頭的大模型正接連投入「實戰」,在商業場景落地方面不斷打磨,拉開大模型賦能產業的序幕。

文|劉青青 石丹

ID | BMR2004

轟轟烈烈的全球大模型浪潮已經持續了大半年,從赫赫有名的OpenAI、Google、Anthropic、Meta,到國內網際網路科技巨頭百度、阿里、騰訊、京東、華為、360……各種大模型產品層出不窮。

在這場「百模大戰」里,國內大模型活力驚人,在創業、投資、融資、應用等領域如火如荼。但是我們也能清楚地看到,國內大模型與國際技術水平的差距。

在人工智慧時代,大模型的出現仿佛人類社會走進第五次工業革命,有一些從未有過的東西蓬勃興起,有一些習以為常的東西驟然消失,還有一些擔憂揮之不去,但是科技和社會的進步依舊向前。

01

「百模大戰」

國內大模型產品遍地開花,已經落地的大模型產品數量遠遠超過了北美、歐洲地區。

大模型浪潮還在加速奔涌。毫無疑問,美國在AI大模型領域表現強悍。2022年底,OpenAI發布的ChatGPT掀起全球大模型浪潮,此後2023年3月,OpenAI發布萬億級大模型GPT-4;Anthropic發布Claude 2;Google發布當前最大的視覺語言模型PalM-E;Meta推出AI語言模型 LLaMA和視覺模型SAM。

除此之外,韓國科技巨頭 Kakao 旗下人工智慧部門Kakao Brain宣布推出AI圖像生成器 Karlo 2.0;韓國搜索巨頭NAVER發布語言大模型HyperCLOVA;LG集團人工智慧智庫LG AI Research 推出擁有3000億參數的Exaone多模態模型;德國初創公司Aleph Alpha發布了一款擁有700億參數的預訓練模型Luminous;歐洲AI初創公司 Hugging Face創建BLOOM大模型……

在國內,大模型產品更是接連落地,各大網際網路科技巨頭紛紛入局。2023年3月,基於文心大模型,百度發布「文心一言」,成為中國第一個類ChatGPT產品。此後華為發布「盤古」大模型、京東發布「言犀產業」大模型、阿里發布「通義千問」大模型、科大訊飛發布「星火認知」大模型、360公司發布通用大模型「360智腦」。除此之外,騰訊也傳出發布大模型產品「混元助手(HunyuanAide)」的消息。

同時,商湯宣布推出大模型「商湯日日新」、崑崙萬維和奇點智源合作發布「天工3.5」、知乎聯合面壁智能發布中文大模型「知海圖AI」、網易發布「玉言」大模型、達觀數據推出「曹植」系統、瀾舟科技發布孟子對話大模型「MChat」……

「百模大戰」硝煙四起,大模型之爭如火如荼。

值得一提的是,在大廠之外,國內還有另外一股「大模型勢力」。

引力創投合伙人、微博前副總經理、《超越想像的GPT醫療》譯者蘆義指出,在國內大模型浪潮當中,高校的研究走在了網際網路科技巨頭的前面。例如清華大學的ChatGLM-6B、復旦大學的MOSS大模型、香港大學的SGPT大模型等。這些高校的研究更早於網際網路科技巨頭,也積累了更多的經驗和技術。

蘆義直言,國內大模型產品遍地開花,已經落地的大模型產品數量遠遠超過了北美、歐洲地區。但國內的大模型公司多是網際網路科技巨頭,它們在原本的商業基礎上進軍AIGC領域,而國外大模型公司則大多屬於研究機構和AI初創公司,因此形成了不同的風格特點。

「例如,國外大模型多在實驗室中打磨,常常作為技術研究成果來展現。而中國網際網路科技巨頭依託產業發展,大模型產品在商業當中得到了很大的應用。」蘆義表示。

02

產業為王

目前大模型處於「百花爭艷」的狀態,站在這個時間點,企業應該思考的不是技術追趕,而是產業突破。

國產大模型大多已經接入各種類型的商業應用。

對內,各大網際網路科技巨頭開始將大模型投入自身業務。例如阿里的「通義千問」大模型將首先部署於阿里的數碼協同辦公和應用開發平台「釘釘」,以及物聯網智能家居終端機「天貓精靈」上,後續它還將接入阿里生態的所有商業應用。百度CEO李彥宏更是直言,百度首先要把全部產品用大模型重做一遍,「不是整合,不是接入,而是重做、重構。」

對外,一些大模型產品也被迅速投入到商業場景中進行落地。在國內,已經有15萬家企業申請接入百度「文心一言」,其中有超過300家生態合作夥伴,一起探索了超400個具體的落地場景。

5月中旬,360公司創始人周鴻禕提出:每個城市、每個政府部門都會有自己的專有大模型,大模型和政府的業務系統融合,還會變成政府各個業務板塊的「副駕駛」,甚至成為智慧政府、智慧城市的總調度室,形成城市級GPT。

7月初,華為雲發布「盤古大模型3.0」,提出深耕行業。據了解,此前華為雲已陸續推出了礦山、藥物分子、電力、氣象、海浪、鐵路等大模型,7月初又發布政務、金融、製造大模型,持續為業界貢獻先進的算法和解決方案。

7月中旬,京東推出「言犀」大模型,提出以完整工具鏈助推產業價值創造。京東的言犀AI開發計算平台,能夠為客戶的大模型開發和行業應用開發提供定製化解決方案。它既具備行業知識庫,沉澱了京東自身在零售、物流、健康、金融等多個行業的Know-How,又具備了100多種訓練和推理優化工具,能將通用模型迅速轉化為專業模型。

弗若斯特沙利文(Frost & Sullivan)發布的《AI 大模型市場研究報告(2023)——邁向通用人工智慧,大模型拉開新時代序幕》指出,大模型「基礎設施—底層技術—基礎通用—垂直應用」發展路線逐漸清晰,國內各廠商加速戰略布局,加大資金和技術投入,迎頭趕上全球大模型產業化浪潮,本土化大模型迎來發展新機遇。

京東集團副總裁、京東科技智能服務與產品部負責人何曉冬博士表示,目前大模型處於「百花爭艷」的狀態,站在這個時間點,企業應該思考的不是技術追趕,而是產業突破。技術上各家都是基於Transformer做大規模預訓練,並不斷地進行調優。

可以看到,國內網際網路巨頭的大模型正接連投入「實戰」,在商業場景落地方面不斷打磨,拉開大模型賦能產業的序幕。

03

融資火熱

中國大模型企業正備受資本青睞,大模型創業風潮湧動。

值得一提的是,「百模大戰」也是一場「燒錢」的競賽,充沛的算力、海量的訓練參數、堅實的硬體,還有頂尖的AI人才,無一不是「經費在燃燒」。

以重量級模型GPT-4為例,其擁有1.8萬億巨量參數,13萬億token(自然語言處理中的「詞單元」)的訓練數據。以H100物理機每小時1美元計算,一次的訓練成本就高達6300萬美元(約人民幣4.51億元)。

蘆義指出,OpenAI發布大模型GPT-4之前已經耗資上百億美元,不過隨著大模型開源和技術的不斷發展,進入此領域的資金門檻會越來越低。目前訓練出一個可以投入運行的大模型,投入資金大約在千萬美元,就是簡單一些的模型也在幾百萬美元左右。

與此相對應的是,關於大模型的投融資愈發火熱,投融界仿佛興起了一股「圍獵」大模型的風潮,AI大模型公司的融資消息不絕於耳。

2023年初,微軟第三次「加倉」OpenAI。此次投資後,微軟累計在OpenAI上投資100多億美元。4月,OpenAI又完成超百億美元融資,估值達到270億~290億美元(約合人民幣1900億~2000億元)。參與本輪融資的風投公司還包括老虎全球管理、紅杉資本、加州Andreessen Horowitz、紐約Thrive和K2Global,Founders Fund等。

而OpenAI的「強敵」Anthropic也在5月宣布獲得4.5億美元C輪融資。此輪融資由Spark Capital領投,谷歌、Salesforce Ventures,Sound Ventures,Zoom Ventures等參投。

有趣的是,同樣加入「大模型之戰」的Google,不僅發布了5620億參數的「史上最大AI多模態模型」PaLM-E,而且還四處「押寶」其他AI大模型初創公司。公開資料顯示,Google累計向Anthropic投資了3億至4億美元,同時還投資了AI視頻生成獨角獸Runway,以及Redpanda Data,Typeface,Infisical,Warp,Speakeasy等涉及AI、數據、安全、IT等領域的企業。

即便是連大模型產品都還沒有落地的加拿大AI初創公司Cohere,也在6月宣布完成2.7億美元的C輪融資,估值達到21億美元。本輪融資由加拿大全棧風險投資機構Inovia Capital領投,網際網路軟體巨頭Salesforce、人工智慧計算公司英偉達、矽谷公司Index Ventures等多家全球機構和戰略投資者參投。

值得一提的是,Cohere此前已經吸引了多家知名機構的投資,投資者涵蓋老虎環球基金、英偉達、「AI教父」Geoffrey Hinton、史丹福大學教授李飛飛、加州大學伯克利分校教授Pieter Abbeel等。

在國內,AI大模型也正在成為中國硬科技投資的一個新風向,尤其是在AI初創企業當中,更是資本涌動。

據了解,美團聯合創始人王慧文收購了AI創業公司光年;創新工廠董事長李開復創辦零一萬物,建立Project AI 2.0大語言模型;前搜狗CEO王小川創立AI公司百川智能;京東AI前掌門人周伯文建立AI公司銜遠科技……大量網際網路大佬下場「大模型」試水。

在剛過去的6月里,AI初創大模型公司月之暗面完成首輪市場融資,獲紅杉、真格等一線 VC 的押注,市場估值被曝約3億美元;AI初創企業生數科技宣布完成近億元人民幣的天使輪融資,該筆融資由螞蟻集團領投,百度發起的 BV 百度風投、卓源資本跟投,目前估值達1億美元;AI 蛋白設計公司「域新說生物」已完成近千萬元天使輪融資,投資方為九合創投。

除此之外,語言大模型企業瀾舟科技在年初完成數億元融資;通用大模型初創企業MiniMax完成新一輪融資,總規模超2.5億美元,項目估值超過10億美元,躋身AIGC獨角獸行列;深言科技(DeepLang AI)近期獲得騰訊的10億元級別融資,其此前投資方還包括紅杉資本、巨人聯創、達晨創投、金山軟體等知名機構。

總而言之,中國大模型企業正備受資本青睞,大模型創業風潮湧動。

04

仰望AI

中國大模型的發展整體依舊處於圖文訓練階段,而將大模型產品融進千行百業,還將需要各大網際網路科技公司進一步地實戰打磨。

AI確實能夠做到很多人類力有不逮的事情,比如背誦或者快速計算,但當前存在的問題也很突出,尤其是在聽、說、讀、寫各個方面,即使最基礎的文本回答,也常常有大模型給出胡編亂造的答案來。因此,大模型的發展依舊任重而道遠。

在蘆義看來,訓練參數在70億左右的大模型屬於中等規模,可以在很多設備上「跑起來」。並且通過一些算法調整,在簡單的使用場景下,這些大模型都可以做到快速問答。但是要真正投入市場,落地商業場景的大模型,其訓練參數應達到650億以上,而且大模型得到的數據訓練越多,給出的答案越精準。

「在OpenAI的ChatGTP-3.5的版本上,已經能夠看到希望。」蘆義表示,一方面,在此之前,ChatGTP版本都是自動生成文本答案,與人類交流對話大相逕庭,而現在ChatGTP-3.5已經能表現出很大的智能;另一方面,如果無法給出答案,大模型會通過網際網路「外掛」搜尋和學習知識盲點,倘若依舊無法解決,大模型也會承認不知道而非「生成式胡編」。

有人將ChatGTP-3.5的更新看做是「奇點來臨之前的一個小突破」,期待著在這個奇點上能「大力出奇蹟」,促成新的技術、新的變革。而在商業落地方面,當語言模型剛剛誕生的時候,大模型的商業模式就已經悄然延伸。

蘆義指出,首先,大模型在通過數據「喂養」和訓練之後,需要有語言模型的配合才能夠進行生成和表達。因此語言模型是大模型產品的基礎,此前掀起風潮的ChatGPT就是語言大模型。國內網際網路科技巨頭能夠通過大模型在內容創作、內容檢索方面迅速革新。

其次,在能夠表達文字的語言模型面世之後,圖片也隨之被訓練。實際上,有了語言模型的基礎,圖片模型更加容易搭建,既可以用語言模型結合圖片模型進行創作,也可以將不算尖端的語言模型直接拿來訓練圖片,變成圖片模型,畢竟圖片模型甚至不需要像語言模型一樣具有完備的語言邏輯表述。

再次,在圖文模型之後,多模態大模型成為下一步的方向。在視覺上,要讓大模型「不光能看懂文字,也能看懂圖片」;在聽覺上,要讓大模型「不光能看還能聽」,接下來混入聽、說、看、讀、寫各種感知都會陸續延展開來,這時候的大模型將會帶來AI與現實世界的結合。

不過,目前來說,大模型的發展整體依舊處於圖文訓練階段,而將大模型融進千行百業,還將需要各大網際網路科技公司進一步地實戰打磨。

05

「機械之心」

如今,人工智慧正在構建人工智慧。或許真的有一天,人類可以認同大模型也有一顆「機械之心」,能像人類一樣進行正常的溝通交流甚至是生活。

很多人都知道,ChatGTP並不完美,但是它能明明白白地展示:人工智慧發展方向正在從辨別式走向生成式。周鴻禕認為,GPT的出現代表著超級人工智慧時代的到來。原來的人工智慧只是「弱人工智慧」,帶來的影響也有限,而如今的大模型屬於通用人工智慧,在很多維度上已經超越了人類。GPT最大的意義是,人類第一次把所有的知識進行了重新編碼和存儲,現在GPT-4已經是世界上最聰明的「人」,這是一個巨大的拐點。

無論是生活還是商業,大模型仿佛都勾勒出一個美好的朦朧未來。作為湛廬文化/浙江科學技術出版社出版的《超越想像的GPT醫療》一書的譯者,蘆義已經在使用大模型進行工作了。在他看來,翻譯不可能完全交給機器,要靠人來「咀嚼」文字,把關情緒。不過,大模型確實對於翻譯工作的效率有了十倍甚至是幾十倍的提升。作為助手,大模型可以準確地幫助譯者歸納、匯總、摘要,也可以執行簡單的推理翻譯任務。

可以想像,未來大模型可以幫助人類做翻譯、駕駛、清潔等工作,也可以如《超越想像的GPT醫療》一書中所述:成為醫生忠誠的助手。

大算力、大模型、大數據讓「智能湧現」(神經網絡訓練完成後,出現出乎意料的新行為功能,而這些行為可能與初始訓練目標無關)。李彥宏指出,過去的人工智慧是,如果想讓機器學會什麼技能,就教它什麼技能。教過的有可能會,沒教過的就肯定不會。在大模型出現「智能湧現」之後,以前沒教過的技能,它也會了。

在大模型訓練初期,還需要科研人員幫忙「喂飯」,但是如果大模型產品成熟之後,它就能夠做到自我學習。

蘆義也指出,語言模型重要的特點是它有通用推理能力,就像人有思考能力一樣。大模型當然不會主動去做推理和思考,還需要人類來引導。隨著語言模型的疊代提升,或許大模型的下一個版本就不再需要人類引導,而是學會了「自我思考」。

就像是人類學會了使用工具一樣,大模型也會使用「外掛」。蘆義認為,當它的算法不足以推斷準確的信息時,它會去學習更新的數據,用數學內容解決數學問題,用電氣知識解決電氣問題,用歷史信息回答歷史問題。

「例如,人工智慧系統AlphaDev,它使用強化學習來發現增強的計算機算法,把人類無法再提高的算法效率又提高了70%。這意味著人工智慧生成的算法已經超越了人類,人工智慧正在構建人工智慧。未來將是AI自己改良AI,在某些方面人類不用參與也無法再參與。」蘆義表示。

這其實是一個令人驚喜又恐懼的發現,但是或許真的有一天,人類可以認同大模型也有一顆「機械之心」,像人一樣溝通交流甚至是生活。

來源 | 《商學院》雜誌2023年8月刊

文章來源: https://twgreatdaily.com/zh-cn/50a71b5d1d75ff24dd1d5b5cd2069d26.html