「百模大戰」，掀動資本波瀾

國內網際網路巨頭的大模型正接連投入「實戰」，在商業場景落地方面不斷打磨，拉開大模型賦能產業的序幕。

文｜劉青青石丹

ID | BMR2004

轟轟烈烈的全球大模型浪潮已經持續了大半年，從赫赫有名的OpenAI、Google、Anthropic、Meta，到國內網際網路科技巨頭百度、阿里、騰訊、京東、華為、360……各種大模型產品層出不窮。

在這場「百模大戰」里，國內大模型活力驚人，在創業、投資、融資、應用等領域如火如荼。但是我們也能清楚地看到，國內大模型與國際技術水平的差距。

在人工智慧時代，大模型的出現仿佛人類社會走進第五次工業革命，有一些從未有過的東西蓬勃興起，有一些習以為常的東西驟然消失，還有一些擔憂揮之不去，但是科技和社會的進步依舊向前。

「百模大戰」

國內大模型產品遍地開花，已經落地的大模型產品數量遠遠超過了北美、歐洲地區。

大模型浪潮還在加速奔涌。毫無疑問，美國在AI大模型領域表現強悍。2022年底，OpenAI發布的ChatGPT掀起全球大模型浪潮，此後2023年3月，OpenAI發布萬億級大模型GPT-4；Anthropic發布Claude 2；Google發布當前最大的視覺語言模型PalM-E；Meta推出AI語言模型 LLaMA和視覺模型SAM。

除此之外，韓國科技巨頭 Kakao 旗下人工智慧部門Kakao Brain宣布推出AI圖像生成器 Karlo 2.0；韓國搜索巨頭NAVER發布語言大模型HyperCLOVA；LG集團人工智慧智庫LG AI Research 推出擁有3000億參數的Exaone多模態模型；德國初創公司Aleph Alpha發布了一款擁有700億參數的預訓練模型Luminous；歐洲AI初創公司 Hugging Face創建BLOOM大模型……

在國內，大模型產品更是接連落地，各大網際網路科技巨頭紛紛入局。2023年3月，基於文心大模型，百度發布「文心一言」，成為中國第一個類ChatGPT產品。此後華為發布「盤古」大模型、京東發布「言犀產業」大模型、阿里發布「通義千問」大模型、科大訊飛發布「星火認知」大模型、360公司發布通用大模型「360智腦」。除此之外，騰訊也傳出發布大模型產品「混元助手(HunyuanAide)」的消息。

同時，商湯宣布推出大模型「商湯日日新」、崑崙萬維和奇點智源合作發布「天工3.5」、知乎聯合面壁智能發布中文大模型「知海圖AI」、網易發布「玉言」大模型、達觀數據推出「曹植」系統、瀾舟科技發布孟子對話大模型「MChat」……

「百模大戰」硝煙四起，大模型之爭如火如荼。

值得一提的是，在大廠之外，國內還有另外一股「大模型勢力」。

引力創投合伙人、微博前副總經理、《超越想像的GPT醫療》譯者蘆義指出，在國內大模型浪潮當中，高校的研究走在了網際網路科技巨頭的前面。例如清華大學的ChatGLM-6B、復旦大學的MOSS大模型、香港大學的SGPT大模型等。這些高校的研究更早於網際網路科技巨頭，也積累了更多的經驗和技術。

蘆義直言，國內大模型產品遍地開花，已經落地的大模型產品數量遠遠超過了北美、歐洲地區。但國內的大模型公司多是網際網路科技巨頭，它們在原本的商業基礎上進軍AIGC領域，而國外大模型公司則大多屬於研究機構和AI初創公司，因此形成了不同的風格特點。

「例如，國外大模型多在實驗室中打磨，常常作為技術研究成果來展現。而中國網際網路科技巨頭依託產業發展，大模型產品在商業當中得到了很大的應用。」蘆義表示。

產業為王

目前大模型處於「百花爭艷」的狀態，站在這個時間點，企業應該思考的不是技術追趕，而是產業突破。

國產大模型大多已經接入各種類型的商業應用。

對內，各大網際網路科技巨頭開始將大模型投入自身業務。例如阿里的「通義千問」大模型將首先部署於阿里的數碼協同辦公和應用開發平台「釘釘」，以及物聯網智能家居終端機「天貓精靈」上，後續它還將接入阿里生態的所有商業應用。百度CEO李彥宏更是直言，百度首先要把全部產品用大模型重做一遍，「不是整合，不是接入，而是重做、重構。」

對外，一些大模型產品也被迅速投入到商業場景中進行落地。在國內，已經有15萬家企業申請接入百度「文心一言」，其中有超過300家生態合作夥伴，一起探索了超400個具體的落地場景。

5月中旬，360公司創始人周鴻禕提出：每個城市、每個政府部門都會有自己的專有大模型，大模型和政府的業務系統融合，還會變成政府各個業務板塊的「副駕駛」，甚至成為智慧政府、智慧城市的總調度室，形成城市級GPT。

7月初，華為雲發布「盤古大模型3.0」，提出深耕行業。據了解，此前華為雲已陸續推出了礦山、藥物分子、電力、氣象、海浪、鐵路等大模型，7月初又發布政務、金融、製造大模型，持續為業界貢獻先進的算法和解決方案。

7月中旬，京東推出「言犀」大模型，提出以完整工具鏈助推產業價值創造。京東的言犀AI開發計算平台，能夠為客戶的大模型開發和行業應用開發提供定製化解決方案。它既具備行業知識庫，沉澱了京東自身在零售、物流、健康、金融等多個行業的Know-How，又具備了100多種訓練和推理優化工具，能將通用模型迅速轉化為專業模型。

弗若斯特沙利文(Frost & Sullivan)發布的《AI 大模型市場研究報告（2023）——邁向通用人工智慧，大模型拉開新時代序幕》指出，大模型「基礎設施—底層技術—基礎通用—垂直應用」發展路線逐漸清晰，國內各廠商加速戰略布局，加大資金和技術投入，迎頭趕上全球大模型產業化浪潮，本土化大模型迎來發展新機遇。

京東集團副總裁、京東科技智能服務與產品部負責人何曉冬博士表示，目前大模型處於「百花爭艷」的狀態，站在這個時間點，企業應該思考的不是技術追趕，而是產業突破。技術上各家都是基於Transformer做大規模預訓練，並不斷地進行調優。

可以看到，國內網際網路巨頭的大模型正接連投入「實戰」，在商業場景落地方面不斷打磨，拉開大模型賦能產業的序幕。

融資火熱

中國大模型企業正備受資本青睞，大模型創業風潮湧動。

值得一提的是，「百模大戰」也是一場「燒錢」的競賽，充沛的算力、海量的訓練參數、堅實的硬體，還有頂尖的AI人才，無一不是「經費在燃燒」。

以重量級模型GPT-4為例，其擁有1.8萬億巨量參數，13萬億token（自然語言處理中的「詞單元」）的訓練數據。以H100物理機每小時1美元計算，一次的訓練成本就高達6300萬美元（約人民幣4.51億元）。

蘆義指出，OpenAI發布大模型GPT-4之前已經耗資上百億美元，不過隨著大模型開源和技術的不斷發展，進入此領域的資金門檻會越來越低。目前訓練出一個可以投入運行的大模型，投入資金大約在千萬美元，就是簡單一些的模型也在幾百萬美元左右。

與此相對應的是，關於大模型的投融資愈發火熱，投融界仿佛興起了一股「圍獵」大模型的風潮，AI大模型公司的融資消息不絕於耳。

2023年初，微軟第三次「加倉」OpenAI。此次投資後，微軟累計在OpenAI上投資100多億美元。4月，OpenAI又完成超百億美元融資，估值達到270億~290億美元（約合人民幣1900億~2000億元）。參與本輪融資的風投公司還包括老虎全球管理、紅杉資本、加州Andreessen Horowitz、紐約Thrive和K2Global，Founders Fund等。

而OpenAI的「強敵」Anthropic也在5月宣布獲得4.5億美元C輪融資。此輪融資由Spark Capital領投，谷歌、Salesforce Ventures，Sound Ventures，Zoom Ventures等參投。

有趣的是，同樣加入「大模型之戰」的Google，不僅發布了5620億參數的「史上最大AI多模態模型」PaLM-E，而且還四處「押寶」其他AI大模型初創公司。公開資料顯示，Google累計向Anthropic投資了3億至4億美元，同時還投資了AI視頻生成獨角獸Runway，以及Redpanda Data，Typeface，Infisical，Warp，Speakeasy等涉及AI、數據、安全、IT等領域的企業。

即便是連大模型產品都還沒有落地的加拿大AI初創公司Cohere，也在6月宣布完成2.7億美元的C輪融資，估值達到21億美元。本輪融資由加拿大全棧風險投資機構Inovia Capital領投，網際網路軟體巨頭Salesforce、人工智慧計算公司英偉達、矽谷公司Index Ventures等多家全球機構和戰略投資者參投。

值得一提的是，Cohere此前已經吸引了多家知名機構的投資，投資者涵蓋老虎環球基金、英偉達、「AI教父」Geoffrey Hinton、史丹福大學教授李飛飛、加州大學伯克利分校教授Pieter Abbeel等。

在國內，AI大模型也正在成為中國硬科技投資的一個新風向，尤其是在AI初創企業當中，更是資本涌動。

據了解，美團聯合創始人王慧文收購了AI創業公司光年；創新工廠董事長李開復創辦零一萬物，建立Project AI 2.0大語言模型；前搜狗CEO王小川創立AI公司百川智能；京東AI前掌門人周伯文建立AI公司銜遠科技……大量網際網路大佬下場「大模型」試水。

在剛過去的6月里，AI初創大模型公司月之暗面完成首輪市場融資，獲紅杉、真格等一線 VC 的押注，市場估值被曝約3億美元；AI初創企業生數科技宣布完成近億元人民幣的天使輪融資，該筆融資由螞蟻集團領投，百度發起的 BV 百度風投、卓源資本跟投，目前估值達1億美元；AI 蛋白設計公司「域新說生物」已完成近千萬元天使輪融資，投資方為九合創投。

除此之外，語言大模型企業瀾舟科技在年初完成數億元融資；通用大模型初創企業MiniMax完成新一輪融資，總規模超2.5億美元，項目估值超過10億美元，躋身AIGC獨角獸行列；深言科技（DeepLang AI）近期獲得騰訊的10億元級別融資，其此前投資方還包括紅杉資本、巨人聯創、達晨創投、金山軟體等知名機構。

總而言之，中國大模型企業正備受資本青睞，大模型創業風潮湧動。

仰望AI

中國大模型的發展整體依舊處於圖文訓練階段，而將大模型產品融進千行百業，還將需要各大網際網路科技公司進一步地實戰打磨。

AI確實能夠做到很多人類力有不逮的事情，比如背誦或者快速計算，但當前存在的問題也很突出，尤其是在聽、說、讀、寫各個方面，即使最基礎的文本回答，也常常有大模型給出胡編亂造的答案來。因此，大模型的發展依舊任重而道遠。

在蘆義看來，訓練參數在70億左右的大模型屬於中等規模，可以在很多設備上「跑起來」。並且通過一些算法調整，在簡單的使用場景下，這些大模型都可以做到快速問答。但是要真正投入市場，落地商業場景的大模型，其訓練參數應達到650億以上，而且大模型得到的數據訓練越多，給出的答案越精準。

「在OpenAI的ChatGTP-3.5的版本上，已經能夠看到希望。」蘆義表示，一方面，在此之前，ChatGTP版本都是自動生成文本答案，與人類交流對話大相逕庭，而現在ChatGTP-3.5已經能表現出很大的智能；另一方面，如果無法給出答案，大模型會通過網際網路「外掛」搜尋和學習知識盲點，倘若依舊無法解決，大模型也會承認不知道而非「生成式胡編」。

有人將ChatGTP-3.5的更新看做是「奇點來臨之前的一個小突破」，期待著在這個奇點上能「大力出奇蹟」，促成新的技術、新的變革。而在商業落地方面，當語言模型剛剛誕生的時候，大模型的商業模式就已經悄然延伸。

蘆義指出，首先，大模型在通過數據「喂養」和訓練之後，需要有語言模型的配合才能夠進行生成和表達。因此語言模型是大模型產品的基礎，此前掀起風潮的ChatGPT就是語言大模型。國內網際網路科技巨頭能夠通過大模型在內容創作、內容檢索方面迅速革新。

其次，在能夠表達文字的語言模型面世之後，圖片也隨之被訓練。實際上，有了語言模型的基礎，圖片模型更加容易搭建，既可以用語言模型結合圖片模型進行創作，也可以將不算尖端的語言模型直接拿來訓練圖片，變成圖片模型，畢竟圖片模型甚至不需要像語言模型一樣具有完備的語言邏輯表述。

再次，在圖文模型之後，多模態大模型成為下一步的方向。在視覺上，要讓大模型「不光能看懂文字，也能看懂圖片」；在聽覺上，要讓大模型「不光能看還能聽」，接下來混入聽、說、看、讀、寫各種感知都會陸續延展開來，這時候的大模型將會帶來AI與現實世界的結合。

不過，目前來說，大模型的發展整體依舊處於圖文訓練階段，而將大模型融進千行百業，還將需要各大網際網路科技公司進一步地實戰打磨。

「機械之心」

如今，人工智慧正在構建人工智慧。或許真的有一天，人類可以認同大模型也有一顆「機械之心」，能像人類一樣進行正常的溝通交流甚至是生活。

很多人都知道，ChatGTP並不完美，但是它能明明白白地展示：人工智慧發展方向正在從辨別式走向生成式。周鴻禕認為，GPT的出現代表著超級人工智慧時代的到來。原來的人工智慧只是「弱人工智慧」，帶來的影響也有限，而如今的大模型屬於通用人工智慧，在很多維度上已經超越了人類。GPT最大的意義是，人類第一次把所有的知識進行了重新編碼和存儲，現在GPT-4已經是世界上最聰明的「人」，這是一個巨大的拐點。

無論是生活還是商業，大模型仿佛都勾勒出一個美好的朦朧未來。作為湛廬文化/浙江科學技術出版社出版的《超越想像的GPT醫療》一書的譯者，蘆義已經在使用大模型進行工作了。在他看來，翻譯不可能完全交給機器，要靠人來「咀嚼」文字，把關情緒。不過，大模型確實對於翻譯工作的效率有了十倍甚至是幾十倍的提升。作為助手，大模型可以準確地幫助譯者歸納、匯總、摘要，也可以執行簡單的推理翻譯任務。

可以想像，未來大模型可以幫助人類做翻譯、駕駛、清潔等工作，也可以如《超越想像的GPT醫療》一書中所述：成為醫生忠誠的助手。

大算力、大模型、大數據讓「智能湧現」（神經網絡訓練完成後，出現出乎意料的新行為功能，而這些行為可能與初始訓練目標無關）。李彥宏指出，過去的人工智慧是，如果想讓機器學會什麼技能，就教它什麼技能。教過的有可能會，沒教過的就肯定不會。在大模型出現「智能湧現」之後，以前沒教過的技能，它也會了。

在大模型訓練初期，還需要科研人員幫忙「喂飯」，但是如果大模型產品成熟之後，它就能夠做到自我學習。

蘆義也指出，語言模型重要的特點是它有通用推理能力，就像人有思考能力一樣。大模型當然不會主動去做推理和思考，還需要人類來引導。隨著語言模型的疊代提升，或許大模型的下一個版本就不再需要人類引導，而是學會了「自我思考」。

就像是人類學會了使用工具一樣，大模型也會使用「外掛」。蘆義認為，當它的算法不足以推斷準確的信息時，它會去學習更新的數據，用數學內容解決數學問題，用電氣知識解決電氣問題，用歷史信息回答歷史問題。

「例如，人工智慧系統AlphaDev，它使用強化學習來發現增強的計算機算法，把人類無法再提高的算法效率又提高了70%。這意味著人工智慧生成的算法已經超越了人類，人工智慧正在構建人工智慧。未來將是AI自己改良AI，在某些方面人類不用參與也無法再參與。」蘆義表示。

這其實是一個令人驚喜又恐懼的發現，但是或許真的有一天，人類可以認同大模型也有一顆「機械之心」，像人一樣溝通交流甚至是生活。

來源 | 《商學院》雜誌2023年8月刊

「百模大戰」，掀動資本波瀾

「綠色」能否重新定義一個星巴克

連夜打造冰雪大世界，「河北卷王」能否接棒「爾濱」？

理性消費時代，人們還是離不開泡泡瑪特？

「中國智造」再落一子康佳集團把握「一帶一路」機遇

中集集團吳發沛：商業向善是企業可持續存在的基本要求

清華大學朱旭峰：企業低碳轉型是新型政商關係的體現

收購印尼電商公司，TikTok東南亞合規風險暫解

廣聯達：數字化賦能綠色建築行業的全生命周期

維達力，綠色工藝如何助力可持續發展

中年天能加速變「綠」

小企業有資格做品牌嗎？

食以味為先，博世Cookit數字化賦能綠色廚房

換機潮來襲，二手手機如何進入「綠色循環」？

綠心公園，打造一個「會呼吸」的海綿城市

家族辦公室，如何實現對家族財富與精神的雙重守護？

建築業謀「綠」：保利大都匯的「碳中和」探索

京都律所滕傑：分類新規為信託公司開展創新業務提供指引四大痛點阻礙轉型

南開大學韓良：信託合規重要性凸顯法律制度亟需完善

六赴進博之約，強生骨科升級「創新密度」

復旦大學郁文：邁進人工智慧時代的統計學

打造中國特色ESG，企業應該怎麼做？

高德地圖「卷」向國際，北斗加持不止出行

「三分類」背景下，信託行業面臨的困惑與轉型路徑

於逆境中尋求增長：康佳集團披露2023三季度財報