大模型時代,騰訊雲「複製」騰訊|WAIC2023

2023-07-13     光錐智能

原標題:大模型時代,騰訊雲「複製」騰訊|WAIC2023

文|郝鑫

編|劉雨琦

剛過去的WAIC(世界人工智慧大會)儼然成為了大模型廠商的成果彙報大會。

百度文心大模型升級到3.5版本,訓練速度提升2倍,推理速度提升30倍;華為雲發布盤古大模型3.0,包含L0基礎大模型、L1行業大模型和L2場景模型;阿里雲發布AI繪畫創作模型通義萬相;騰訊雲MaaS底座、行業大模型場景全面升級;商湯「日日新」大模型升級,金融、醫療等行業場景落地已超20個。

大模型走過從無到有,在當下的階段,即使是站在同一起跑線的廠商,也走上了不同的分叉路:有人做通用大模型,有人做行業大模型;有人在為大模型的安全運行保駕護航,有人在提供造大模型的工具。

7月7日,在中國信通院發布的《2023大模型和AIGC產業圖譜》中,將大模型和AIGC產業鏈上下游分成了行業應用、產品服務、模型與工具和基礎層四個主要部分。

(圖源:中國通訊院)

從圖上看,大模型就像造房子,很難有一家企業完成所有環節。也就是說,如同網際網路的大航海時代一般,大模型生態建設,所有人都有機會。

正如騰訊雲副總裁、騰訊雲智能負責人、優圖實驗室負責人吳運聲告訴光錐智能:「大模型時代,開放是非常重要的特點。大模型要結合行業落地,需要花費大量的成本,在這種情況下,要想發揮最大的價值,只有開放,通過讓各行各業的專家、各類角色的人員加入進來,才能讓整個生態體系更健康,從而產生更多的可能性。」

發展的同時,問題也在逐漸暴露出來。相較於國外成熟的大模型市場,中國到現在還未構建起完整的大模型產業鏈,在底層的數據、晶片、計算能力存在欠缺,在模型訓練、部署等環節還十分薄弱。

針對大模型產業鏈存在的痛點,騰訊雲MaaS大模型精選商店升級技術底座,發布向量資料庫和星脈網絡,創新行業大模型的應用場景。

追本溯源,可以看出騰訊延續網際網路時代的思路,騰訊雲依然不做通用大模型,要繼續做工具箱和連接器。

Always工具箱和連接器

據光錐智能了解到,早在6月19日,騰訊雲就公布了行業大模型技術解決方案。該方案依託騰訊雲TI平台打造行業大模型精選商店,為客戶提供MaaS一站式服務,客戶只需要加入自己獨有的場景數據,就可以快速生成專屬模型,結合實際業務場景需求,開發低成本、高可用的智能應用和服務。

騰訊雲MaaS大模型商店重點突出了兩個特點,一是精專,二是靈活。

「精專」主要體現在對行業模型的訓練上,騰訊雲在其技術底座就內置了金融、政務、文旅、傳媒、教育等多個行業大模型,這意味著從預訓練時期開始,大模型便明確了方向,開始與行業經驗結合。

打個比方,就好比大學生一入學就被分到了不同的專業,之後在此基礎上繼續研究生、博士深造。騰訊雲的思路也是如此,把訓練的數據先在行業大模型中磨礪一遍,然後再結合企業的私有數據,精調後生成企業專屬模型。可以說,行業認知貫穿了模型訓練、推理、部署的全過程,由此來提升行業場景的應用能力。

「靈活」主要體現在企業調取、使用模型能力、工具上。網際網路時代,馬化騰曾將騰訊的角色定位為「工具箱」,在大模型時代,騰訊雲TI平台的角色有著異曲同工之處。

工具鏈決定著企業能不能把大模型能力和自己的業務、產品相結合,為此,騰訊雲提供了包括數據標註、訓練、評估、測試和部署等大模型工具箱和配套服務。企業可以在本地按需選用和組合工具,在保障安全的前提下進行私有化數據訓練,還可根據業務場景需求,按需定製不同參數、規格的模型服務。

以前,騰訊連接了B端商家和C端用戶,現在騰訊雲也將這種能力復刻到大模型商店。工具組合形成的工具鏈還只是平台中的一環,連接起企業產品和大模型;另一條主線——數據(私有+公有),則串連起了大模型、企業、產業和用戶。

行業應用是起點,也是終點,正如吳運聲所言,「不管是什麼樣的技術,我們最根本的出發點,還是要解決實際的問題。」

大模型加速器

如何在大模型賽道上找到合適自己的節奏,騰訊雲似乎已經摸到了脈路。

騰訊集團高級執行副總裁、雲與智慧產業事業群CEO湯道生曾表示:「關鍵還是要把底層的算法、算力和數據扎紮實實做好,而且更關鍵的是場景落地。」

延續著這樣的思路,騰訊雲一手抓底層算法、算力和數據,一手落地場景,MaaS大模型商店實現了全面的升級。

在技術底座環節,騰訊雲聚焦一個「快」字,發布了星脈網絡和向量資料庫,為大模型安上了「風火輪」。

大模型進入萬億參數時代,單體伺服器算力有限,需要將大量伺服器通過高性能網絡相連,打造大規模算力集群。

基於此,騰訊雲通過對處理器、網絡架構和存儲性能的全面優化,攻克下了大集群場景下算力損耗問題,正式發布新一代HCC(High-Performance Computing Cluster)高性能計算集群。

該集群採用騰訊雲星星海自研伺服器,搭載英偉達最新代次H800 GPU,能提升40%的GPU利用率,節省30%-60%的模型訓練成本,為AI大模型帶來10倍通信性能提升。基於騰訊雲新一代算力集群HCC,可支持10萬卡的超大計算規模。

據騰訊雲透露,騰訊雲新一代集群的算力性能較前代提升高達3倍,是國內性能最強的大模型計算集群。

高性能計算群是一種底座能力,其技術的應用體現了通過技術手段的降本增效。

首先,相比於大量分散的計算機,高性能計算集群可以降低硬體成本和運維成本,同時方便集中管理。其次,它可以提升計算、搜索的效率。提供分布式的計算能力,為向量資料庫提供支持;還能進行複雜的科學計算和建模,這也是騰訊雲「AI for Science」能迅速在天文、甲骨文考釋取得成果的原因。

在大模型訓練過程中,湯道生談起過數據質量的問題,他表示:「目前通用大模型一般都是基於廣泛的公開文獻與網絡信息來訓練的,網上的信息可能有錯誤、有謠言、有偏見,許多專業知識與行業數據積累不足,導致模型的行業針對性與精準度不夠,數據噪音過大。」

數據對大模型訓練的意義不言而喻,當前,除了數據噪聲過大,還存在數據處理、數據更新、數據安全等眾多問題。

此外,大模型還存在一個致命的缺點——沒有長期記憶,C端對話場景還可以重新提問,但應用在行業,就可能造成系統崩潰。

OpenAI 很早就意識到這個問題,通過與Zilliz、Pinecone、Weaviate等向量資料庫公司合作,為ChatGPT配置上了「外置緩存」,向量資料庫+大模型也被稱之為「黃金搭檔」。

國外向量資料庫大熱帶動了國內廠商加速,騰訊雲也趕上了第一波,發布了國內首個AI 原生向量資料庫。

針對大模型場景,它在接入層、計算層、存儲層實現了全面AI化:

在接入層,智能化支持自然語言文本的直接檢索;

在計算層,通過AI運算元替代企業尋找/調優AI算法,將接入工期從一個月縮短到3天;

在存儲層,融合智能壓縮算法,把向量存儲成本降低50%。

企業數據接入需要分為三步,分別為文本切分、向量化以及導入。以前,這三步分別由不同的公司來做,因此周期被拉得無限長,而騰訊雲將三步化作一步,直接實現了一站式接入,效率提升了10倍。

不過,從參數來看,目前騰訊雲向量資料庫性能依舊在初級的階段。

舉個例子,騰訊雲向量資料庫最高支持10億級向量檢索規模,並將延遲控制在毫秒級。作為對比Milvus最大能支持560億向量檢索規模,支持每秒進行上百萬的向量相似性搜索。

但10億級也可以說是向量資料庫的入門級參數。Pinecone 官方demo 表明其可以在 10 億條向量中實時搜索;Weaviate算法可支持十億量級的向量索引。

工欲善其事,必先利其器。從最底層一步步砸實技術,看似騰訊雲走了一條慢路,但小布快走,實現快速疊代後,帶動的將是整個生態系統的提升。

50個場景,騰訊雲批量著陸

場景一直是騰訊所強調的產品文化,即做一個產品或者上線一個功能,首先考慮的是,能不能找到場景,找到用戶。

同樣切入MaaS,站在新的起跑線上,騰訊雲通過沉澱的行業Konw-how,瞄準企業應用剛需,推進大模型應用落地,將場景作為訓練大模型的磨刀石。

「大模型雖好,但用起來還是有很高的門檻。尤其對一些傳統領域企業而言,通用大模型無法精準適配、達到降本增效的預期。企業需要的,是在實際場景中真正解決某個問題,而不是在100個場景中解決了70%-80%的問題。」吳運聲道。

騰訊雲認為,大模型不只是少數人的遊戲,把大模型從「通才」轉變為「專才」,對企業來說或許是一個可行的路徑。騰訊雲在其中承擔的角色,就是要將門檻打下來,提供一條龍服務,幫助企業跳過模型訓練、部署的「冷啟動」階段。

據光錐智能了解,基於騰訊在網際網路行業的長期沉澱,騰訊雲已聯合金融、文旅、政務、傳媒、教育等十多個行業頭部客戶,共同打造了超過50個行業大模型解決方案,這些都是騰訊 CSIG 的重點服務行業。

在金融風控場景,騰訊雲風控大模型融合了騰訊過去20多年黑灰產對抗經驗,和上千個真實業務場景,提供了金融風控解決方案。企業可以基於prompt模式,疊代風控能力,從樣本收集、模型訓練到部署上線,實現全流程零人工參與,目前,建模時間已經做到從2周減少到僅需2天。

在交互翻譯場景,基於行業大模型技術,騰訊雲無需百萬級的訓練數據,使用小樣本訓練也可以獲得不錯的翻譯結果,讓每一次交互翻譯,都能對下一句的翻譯提升發揮實時作用。

以行業場景為切入,技術、應用同時疊代升級,這樣的速度明顯要更快,效果也更加顯著。

據騰訊雲在WAIC最新數據,上述金融風控解決方案,相比之前已有了10倍效率的提升,整體反欺詐效果比傳統模式有20%左右的提升;騰訊雲數智人工廠,內置超過10個AI算法模型,騰訊雲MaaS能力,可以讓2D數智人分身復刻縮短至24小時。

技術和應用兩條腿同時跑,底層大模型支撐應用場景落地,場景也反過來反哺大模型。

正如同騰訊雲所強調的一個觀點「產業場景是大模型的最佳練兵場」,前期大模型所學習到的行業經驗可以在現實應用場景中得到矯正,再次沉澱到騰訊雲MaaS平台行業模型底座,重新更新認知,以此循環往復,行業大模型將越調越精,企業也越用越靈。

另一方面,成熟的應用落地場景,或許又將為大模型商業化開拓出新的道路。

事實證明,貪圖一時的熱鬧並不長遠,即使是擁有絕對技術壁壘的ChatGPT也面臨著流量下滑的命運,OpenAI 創始人更是直言,ChatGPT插件不如預期的原因在於,人們更想把GPT的能力用到自己的應用當中。

開啟大模型下一個競爭階段,場景與商業化能力或將變得更加密切。

正如騰訊雲副總裁、騰訊雲智能研發負責人吳永堅所認為的:「網際網路已經走到從最開始的純免費階段,慢慢向某些場景去如何商業化的階段,這不是大模型帶來的,但大模型將我們商業化的途徑變得更清晰了。」

文章來源: https://twgreatdaily.com/zh-mo/27817b33a50db7dccc38398f806ac06a.html