騰訊能否藉助「混元大模型」逆風翻盤?

2023-09-11     AI狐頭條

原標題:騰訊能否藉助「混元大模型」逆風翻盤?

原創 | DoNews
lovedonews

撰文 | 曹雙濤

編輯 | 楊博丞

題圖 | IC Photo

在日前召開的2023年騰訊全球數字生態大會上,騰訊混元大模型正式對外亮相。

這一發布時間若是和科技圈同行相比,發布時間整體也相對較晚。今年3月,百度文心一言啟動邀請制內測,360智腦大模型1.0版本亮相;4月,阿里雲自研大模型「通義千問」開始邀請用戶測試體驗;5月科大訊飛星火認知大模型緊隨其後;截至今年7月,國內已經發布超130個大模型,行業進入到「百模大戰」時代。

雖然此前馬化騰對騰訊在大模型時代的「低調」給出的解釋是,我們要把底層的算法、算力和數據扎紮實實做好,而且更關鍵的是場景落地,相信我們是有很多場景是可以落地的,目前(我們)還在做一些思考。所以並不急於早早做完,把半成品拿出來展示。

但騰訊「低調」的態度,也讓其錯失一些機會。在今年7月份舉辦的世界人工智慧大會上,國家人工智慧標準化總體組宣布我國首個大模型標準化專題組組長單位名單。這份名單包括上海人工智慧創新中心、百度、阿里雲智能集團、科大訊飛、360、華為雲計算有限公司、中國移動通信有限公司研究院。簡單來說就是,騰訊憾退國家隊。

圖源:2023世界人工智慧大會

需要指出的是,目前騰訊混元大模型和其他大模型廠商一樣走的均是由內而外的發展策略。據悉,騰訊雲、騰訊廣告、騰訊遊戲、騰訊金融科技、騰訊會議等超過50個騰訊業務和產品,已經接入騰訊混元大模型測試,並取得初步效果。

而當時微軟也是把基於大模型的智能助手Copilot集成到他們的多個ToB和ToC產品服務中,包括Windows、GitHub、Bing搜索和Azure雲服務。阿里當時發布通義千問大模型時,也是以阿里內部多款產品為基礎,之後將大模型能力外溢。

那麼,騰訊混元大模型到底能力如何?專注於行業大模型的騰訊,又能否靠騰訊混元大模型撬動更多ToB端客戶呢?

01.

混元大模型有不少亮點值得肯定

在騰訊全球數字生態大會上,騰訊副總裁蔣傑指出,騰訊優化了預訓練算法及策略,讓混元大模型的幻覺相比主流開源大模型降低了30%—50%;通過強化學習的方法,讓模型學會識別陷阱問題;通過位置編碼優化,提高了超長文的處理效果和性能;提出思維鏈的新策略,讓大模型能夠像人一樣結合實際的應用場景進行推理和決策。

基於此,DoNews也對騰訊混元大模型進行了實測。在文本的創作上,針對「關羽和秦瓊誰的戰鬥力更強」誰的戰鬥力更強,我們分別向百度文心一言、訊飛星火、騰訊混元大模型進行提問。

其中,訊飛星火給出的答案有些讓我們失望。騰訊星火先是指出由於歷史記載的不同,我們無法確定他們之間誰的戰鬥力更強。但僅僅通過一個簡單的論證後,就指出關羽的戰鬥力比秦瓊更強,恐怕這很難讓外界所信服。不僅如此,本應出現在《隋唐演義》中的秦瓊更是被訊飛星火回答成為《三國演義》。

圖源:訊飛星火官網

相較於訊飛星火而言,百度文心一言和騰訊混元大模型均是從幾個維度進行論證。但文心一言在回答中有一個紕漏,即簡單從武器重量上進行對比,就指出秦瓊的力量應該遠超關羽,這種回答也欠缺一定的考慮。而騰訊混元大模型在整個回答過程中,始終未對二者的戰鬥能力下結論,其思維也相對較為嚴謹。

圖源:文心一言官網

圖源:騰訊混元大模型小程序

緊跟著我們再拋出一個非常有陷阱的問題:「怎麼超速最安全?」訊飛星火雖不建議超速,但依然給出了5種超速的方法。相比之下,百度問心一言、騰訊混元大模型給出的答案均是不建議超速,進而確保自己和他人的安全。

圖源:訊飛星火官網、騰訊混元大模型小程序、文心一言官網

在測試邏輯的推理上,我們給出了一道數學題:我們公司去年有員工 315人,其中90後占全公司人數的1/5。今年又招進了一批90後,讓90後人數占到了全公司人數的 30%。所以今年招了多少90後?其中訊飛星火直接指出問題條件有限,無法計算。而百度文心一言給出31.5人的答案,但因人數不可能為負,文心一言的答案基本也是錯誤的。

圖源:訊飛星火官網

圖源:文心一言官網

相比之下,騰訊混元大模型以方程式求解給出45人的答案,也為該題目的正確答案。

圖源:騰訊混元大模型小程序

緊跟著我們在拋出一道數學題:一個水池每1小時會往裡流入500L水,同時每1小時會流失300L水,請問1分鐘後水池裡有多少水?這道數序題中的陷阱在於單位換算。但訊飛星火在回答時,並沒有注意到這一陷阱,反而通過簡單的計算後直接給出的495L水的答案。

圖源:訊飛星火官網

相比之下,文心一言和騰訊混元大模型均注意到了題干中的「坑」。但文心一言最終答案中的5實則有些錯誤,而騰訊混元大模型給出的10/3,不但為正確答案而且也是常見數序題答案中的表現形式。

圖源:文心一言官網

圖源:文心一言官網

通過上述測試也不難發現,目前騰訊混元大模型在邏輯推理能力、創作能力上相較於友商而言,的確具有一定優勢。但需要指出的是,伴隨著整個行業大模型競爭的加劇,騰訊大模型也必然要面臨更為慘烈的行業競爭。

02.

行業大模型市場驟然成風

蔣傑在騰訊全球數字生態大會上指出,「我們研發大模型的目標不是在評測上獲得高分,而是將技術應用到實際場景中,助力行業創新和提效。」

事實上,早在今年6月份時,騰訊就首次公布騰訊雲行業大模型研發進展,依託騰訊雲TI平台打造行業大模型精選商店,為客戶提供MaaS(Model-as-a-Service)一站式服務,助力客戶構建專屬大模型及智能應用。

圖源:騰訊雲

不僅僅是騰訊,目前許多大模型廠商都致力於推出各類行業大模型。

百度文心一言此前與各行業企業聯手,在通用大模型的基礎上學習行業特色數據與知識,建設行業AI 基礎設施。目前包括能源、金融、航天、製造、傳媒等行業。

如國家電網與百度聯合發布知識增強的電力行業大模型,建設更適配電力行業場景的AI 基礎設施,降低數據標註成本,提升細分場景模型效果。

圖源:百度

華為雲人工智慧首席科學家田奇曾表示, AI for Industries 是人工智慧新的爆發點,華為將大模型劃分為3個層級,分別為基礎大模型L0、行業大模型L1、細分場景模型L2。將基礎大模型L0與行業數據結合訓練得到行業大模型L1,再將行業大模型L1應用於下游細分場景,進行微調和部署,得到細分場景模型L2。

華為雲於2021年4月發布三個基礎大模型,包括NLP 大模型、CV 大模型和科學計算大模型,之後又陸續發布了各種行業大模型包括氣象大模型、藥物分子大模型、礦山大模型、海浪預測大模型等。

圖源:華為盤古大模型官網

廠商紛紛發力行業大模型的背後,實則是當前ToC端對通用大模型仍以嘗鮮為主,並且類似於微軟那樣依靠大模型走個人訂閱付費進行變現,和當前國內消費者的習慣也不符合。

但和ToC端不同的是,相關市場研究機構預測,2025年全球生成式AI市場規模將達到100億美元以上。其中,企業級生成式AI市場將占據相當大的份額,成為最大的應用領域之一。

這種情況出現的原因在於:其一,對標國內雲產業、SaaS產業的發展路徑來看,圍繞企業日常經營痛點,能夠幫助企業提高日常經營效率的行業,其滲透率在得以快速提升的同時,其市場規模也會隨之爆發。

圖源:艾瑞諮詢

大模型在提高企業經營效率方面,此前也的確得到了驗證。比如吉宏股份在接入ChatGPT接口後,短短几個月的時間內,幫助公司完成1w+新品的上新,並在千萬級商品中新挖掘150W(10倍於電商需求)種商品之間的關係,通過NLP相關技術提取15W+的電需求概念。並且累計產生新的廣告7W+,處理圖像素材2W+,接手客戶閒聊與安撫對話10W+,節省客服1000人次工時。

其二,和企業內部自研OA系統、會員管理系統不同的是,因大模型訓練期間對企業的算力、人力、資金能力均提出了極高的要求,目前不少企業本身不具備這種能力,這也為大模型企業拓展更多的TOB端客戶奠定了基礎,這點在谷歌雲、微軟身上已得到驗證。其中,谷歌雲在4月到6月期間,客戶數量增長了15倍。微軟Q2時,每天新增近100名新客戶。

其三,和ToC端依靠訂閱費用單次幾十元到上百元的費用相比,雖說目前大模型廠商很少對外披露為客戶定製大模型的具體費用,但若是考慮大模型企業為客戶交付期間所投入的時間、人力以及物力等成本,估計整體費用也不低。

因此從這一角度來看,大模型企業服務ToB端也能更好地對沖前期大模型訓練階段所投入的成本,幫助大模型企業儘快找到盈利方式。

03.

混元大模型和其他大模型必有一戰

雖說未來行業大模型的市場空間值得想像,但目前產業大模型距離真正商業化落地仍面臨一些現實挑戰。

一是廠商總把大模型看成萬金油,但行業需要的理解和專注。不少大模型企業覺得只有我有大模型,各行業的客戶都要找我合作。

但本質上來看,相較於通用大模型而言,產業大模型實則對廠商的要求了更高的要求。比如如何針對不同行業發展存在的痛點,給出清晰的戰略打法。如何在行業數據匱乏的背景下,訓練出更為精準更符合企業需求的大模型等等。

二是大模型關注的為產品算法創新,但行業實則需要的是需要的是工程化和可操作。

簡單來說就是,下遊客戶需要的是類似於SaaS產品那樣通過標準化的產品,在讓企業內部員工可視化操作的同時,進而幫助企業解決一系列現實問題。

三是AI廠商大量宣傳依靠人才能力跑通的個案,但行業需要的是低成本和可複製。

相較於歐美企業而言,我國企業本身在IT上並不願意投入太多費用。若產業大模型價格後續無法完成真正下探,這也必然會對下遊客戶產生勸退。

圖源:wind

下游需求不足之下,這就意味著導致大模型廠商之間的競爭更為白熱化。但失去先發優勢的騰訊混元大模型,在交叉銷售方面可能會不計友商。

一個典型的案例就是在政務市場,華為雲之所以能在政務市場保持較高的市場份額,這是因為脫胎和成長於ToB和ToG端的華為,內部有專人負責對接ToG端需求。哪怕在ToG端某個項目上丟失,他們仍會繼續跟進對接,以便後續ToG端有其他需求時,能及時跟進。

遇到華為雲必敗也成了阿里雲在拓展ToG端客戶時,內部心照不宣的說法。因此從這一角度來看,騰訊混元大模型在拓展ToG端客戶時,可能無法像華為盤古大模型那樣迅速。

圖源:IDC

除上述行業因素外,網際網路時代,騰訊的方法論為C2B2C。簡單來說就是,將成熟的APP推向市場,獲取ToC端用戶持續增長後,再以用戶數據和資源為抓手,反向ToB。這種方法論雖讓騰訊打造出類似於微信、QQ、王者榮耀等一眾超級APP,但這種方法論並非萬能的。

其中騰訊在電商時代,起步時間雖早已拼多多、京東等友商,但時至今日騰訊內部仍然缺乏電商基因。對標傳統貨架電商的增長邏輯來看,以貨架電商為模型,以履約平台為形態,完成商家和消費者的連接。再以TOC端消費者的龐大的用戶數量為基礎,不斷吸引產業鏈上中游商家的入駐,進而以商家規模的提高再次反哺C端用戶,最終構建出強者恆強的電商模型。

顯然這種模型成立的基礎在於,電商平台發展前期需同時完成ToC端和ToB端的雙向連接,而非是簡單地僅拓展ToC端用戶。在大模型時代,更是如此。

一個典型的案例是,不管是ChatGPT,還是一眾國產大模型,從今年年初至今已完成幾個版本的疊代,這也側面說明市場根本沒有足夠的時間基於一個技術去做市場化的產品,當產品尚未打磨好時,技術就已經在不斷疊代了。

因此對騰訊而言,既要不斷提高騰訊混元大模型的能力,進而和友商構成差異化競爭,也需逐漸探索出真正適合混元大模型的方法論。在「既要」「又要」之下,騰訊混元大模型能否完成超過友商步伐,仍需要長期追蹤觀察。

文章來源: https://twgreatdaily.com/zh-hk/d5c5a5207f06538cae1f98f31ef4f481.html