從小模型走向大模型:恒生電子為金融行業插上「數智翅膀」

2023-12-08     DeepTech深科技

原標題:從小模型走向大模型:恒生電子為金融行業插上「數智翅膀」

11月29日,在以「智算力就是創新力」為主題的2023人工智慧計算大會的主論壇上,恒生電子首席科學家白碩圍繞「金融行業大模型的應用實踐」發表主題演講。由恒生電子打造的金融行業大模型LightGPT,是此次演講涉及到的重點。

在人工智慧和金融領域,白碩的從業經歷非常豐富。其曾供職於中國科學院計算技術研究所等科研院所,也曾擔任過長達14年的上海證券交易所總工程師。因其此前做過恒生電子的外聘專家,並被該公司對新技術的追求和內部創新氛圍所吸引,白碩選擇全職加入這家企業,並擔任首席科學家、恒生研究院院長等職。如今,大模型產業發展方興未艾,白碩也正在帶領恒生電子積極投入金融大模型生態建設,推動金融行業數智化轉型升級。

圖丨白碩(來源:資料圖)

整合自身優勢資源,打造金融大模型LightGPT

金融大模型LightGPT,是恒生電子在金融大模型應用領域的創新成果之一。

該模型於2023年6月正式推出,其基於海量金融數據訓練而來,使用超2000億中文tokens和80多項中文金融任務指令微調,覆蓋金融多領域應用場景,對金融相關問題的理解比通用大模型更有優勢。

此外,作為金融行業專屬大模型,恒生電子也充分考慮了LightGPT在合規性和部署模式上的特性。LightGPT充分學習中國的金融法律法規,從八大評價維度確保大模型生成內容的安全合規,符合中國金融市場的監管要求。部署模式上,LightGPT支持雲部署和7B/13B/70B的私有化部署,包括大模型接口調用和金融問答服務,以及提供定製化金融預訓練和微調服務,滿足金融機構個性化需求。

經過幾輪升級之後,目前在金融大模型能力評測中,LightGPT的邏輯推理、超長文本處理、多模態交互、代碼、金融專業問答等多項能力都表現突出,已經具備為客服、運營、投顧、投研等金融業務場景提供能力支撐的水平。

事實上在布局大模型之前,恒生電子已經能夠「玩轉」小模型。因此,大模型的推出,也可以被看作是其進一步拓展服務範圍的表現。那麼,在這個過程中恒生電子又是如何結合自身原有業務的?

白碩表示:「首先,恒生電子旗下的子公司恒生聚源是一家為資本市場服務多年的金融數據服務公司,聚源資料庫可以為我們的大模型提供高質量的金融專業數據。此外,其實長時間以來,恒生電子本身就是資本市場AI應用領域的重要廠商之一,我們為客服、運營、投研、合規風控等場景提供AI產品。現在進入大模型,我們也將把自身在AI應用領域積累的數據和經驗用於大模型訓練中。」基於這些專業的金融語料數據打造成的LightGPT,可以讓原本需要很多人力成本處理的工作更加高效智能。例如,大模型應用於金融業務崗前培訓場景時,大模型可以自主創作不同的陪練場景,對新員工進行提問,從而提高員工的培訓效率,緩解人工考評壓力。

而對於金融行業而言,安全合規至關重要。為此,LightGPT從數據安全、內容安全等角度出發構建了完善的安全合規體系。針對數據安全和隱私保護,恒生電子採取了一系列的措施來確保數據的脫敏、合規、授權和追溯,包括去除數據中所有敏感的個人以及機構敏感數據,對收集的所有數據進行匿名化和加密處理,制定嚴格的數據使用規範和訪問控制,記錄所有操作行為保證數據來源可追溯等。同時,還通過建立可靠的網絡安全系統、定期開展安全評估等方式,識別和消除數據安全隱患。針對生成內容的可控問題,恒生電子構建了包括語料安全、模型安全、模型評估等在內完善的安全機制。在模型安全中,除了滿足國家基本合規要求外,LightGPT通過加入證監會等最新監管法規條款和金融基礎金融書籍和論文等語料,讓生成的內容在金融法律法規遵循、金融領域知識真實性上有大幅度提升。此外,模型對於敏感問題、誘導問題也會進行處理。

大模型「中控」平台與智能應用產品

為了解決大模型和實際應用之間的連接問題,在LightGPT大模型的基礎之上,恒生電子打造了大模型「中控」平台光子,串聯「通用工具鏈+金融插件工具+金融數據+金融業務場景」。白碩解釋稱:「光子提供的是一種介於應用場景和大模型中間的對接能力。我們發現很多應用場景都會不約而同地需要一些通用的工具能力,比如對接實時行情,文檔處理、數據要素識別等。所以我們想把大家所需的能力都放到一個中間層上,統一支持上層的業務應用產品」

目前,基於「光子」平台,恒生電子正在打造一系列的大模型應用產品,構建智能產品矩陣。今年10月,恒生電子正式發布了其中三款產品:光子·文曲、光子·善策和光子·慧營。其一,光子·文曲作為面向投資顧問的一站式內容創作平台,具有生成智能報告、AI問答助手等功能,能幫助投資顧問搜集報告素材、生成內容並進行審核發布。

其二,光子·善策聚焦投顧諮詢場景,能通過理解會話意圖、生成智能話術等功能,賦能投顧會話,為投資顧問精準定位客戶標籤,洞察客戶意圖,生成專業話術。。

其三,光子·慧營聚焦資管與託管領域,能通過文檔智能分片、要素智能提取、文字內容智能匹配等功能,為運營工作提供系統智能的輔助解決方案,從而提升運營效率和服務質量。

(來源:資料圖)

白碩表示:「我們對新技術的擁抱是自下而上的,就是發動大家去識別自己業務領域中哪些是合適的場景,然後判斷其是否具有一定的代表性或是否需要一些通用的支持能力,這時候我們再進行一些通用能力的開發,進而支持從1到N的創新。」

除了光子系列的大模型應用產品,恒生電子旗下子公司恒生聚源打造的智能投研平台WarrenQ也是金融大模型應用領域的另一成果。

作為一款輕量化的投研提效工具,WarrenQ基於大模型技術,自然語言交互的方式打通投研工作場景,將「搜讀算寫」升級為「Chat讀算寫」,形成集「大模型+數據+工具」為一體的新一代智能投研模模式。具有AI腦圖寫作、金融語音識別、等功能,能以自然語言交互的方式,貫通工作投研場景,進而打造「大模型+數據+工具」的新一代投研模式。為了更好地推動投研數智化發展,未來WarrenQ還將持續加強大模型加持下的金融垂域「搜讀算寫」能力,結合更多場景輸出智能投研工具。

顯而易見的是,以LightGPT為代表的金融行業大模型,正在加速落地金融業務場景。與此同時,一系列擺在行業客戶面前的重要問題也隨之出現:如何判定一款金融大模型是否優秀?如何選擇適合自己的大模型?

聯合發布金融大模型標準,持續提升模型專業能力

為科學評價金融大模型技術能力和應用效能提供客觀評估標準,今年9月恒生電子作為牽頭編寫單位,聯合中國信通院正式發布國內首個金融行業大模型標準《面向行業的大規模預訓練模型技術和應用評估方法 第1部分:金融大模型》。

該標準基於金融場景適配性、金融領域AI能力支持度和應用成熟度三大評估維度,涵蓋銀行、保險等多個金融行業和投研、風控等多個應用場景,能從金融場景適配性、金融領域AI能力、合規安全性、可追溯性以及部署等多個層面對金融大模型進行詳細評估。

在真正成功地落地應用的過程中,合適的通用大模型可以提供一個良好的基礎底座,而行業大模型則需要在這個基礎之上不斷地提升專業能力,從而適應行業需求。

在白碩看來,其中一個能力方向就是文本能力。金融大模型在訓練文本數據的時候,需要領域專家進行反饋和調整,比如在精調階段把握金融特有的任務類型、對特有專業術語的識別、解讀等,讓大模型的精調做的更加到位。另外,專業的代碼能力也很重要。如果一個不懂專業的代碼大模型,要在專業領域進行編碼,就會受到較大限制。

談及未來LightGPT的演進方向,白碩表示,恒生電子希望能在保持同等參數的情況下,進一步提升模型能力。其會在綜合評估以後,決定是否保持或提升某一方面的能力,也會不斷地加強大模型的數理能力。同時,公司也會繼續推動大模型在金融行業的應用實踐,促進大模型生態建設,從而更好地助力金融行業的數智化轉型升級。

文章來源: https://twgreatdaily.com/zh-hk/69b1b72b7480663eb8f0f7bf5d576b10.html