11月29日,在以“智算力就是创新力”为主题的2023人工智能计算大会的主论坛上,恒生电子首席科学家白硕围绕“金融行业大模型的应用实践”发表主题演讲。由恒生电子打造的金融行业大模型LightGPT,是此次演讲涉及到的重点。
在人工智能和金融领域,白硕的从业经历非常丰富。其曾供职于中国科学院计算技术研究所等科研院所,也曾担任过长达14年的上海证券交易所总工程师。因其此前做过恒生电子的外聘专家,并被该公司对新技术的追求和内部创新氛围所吸引,白硕选择全职加入这家企业,并担任首席科学家、恒生研究院院长等职。如今,大模型产业发展方兴未艾,白硕也正在带领恒生电子积极投入金融大模型生态建设,推动金融行业数智化转型升级。
图丨白硕(来源:资料图)
整合自身优势资源,打造金融大模型LightGPT
金融大模型LightGPT,是恒生电子在金融大模型应用领域的创新成果之一。
该模型于2023年6月正式推出,其基于海量金融数据训练而来,使用超2000亿中文tokens和80多项中文金融任务指令微调,覆盖金融多领域应用场景,对金融相关问题的理解比通用大模型更有优势。
此外,作为金融行业专属大模型,恒生电子也充分考虑了LightGPT在合规性和部署模式上的特性。LightGPT充分学习中国的金融法律法规,从八大评价维度确保大模型生成内容的安全合规,符合中国金融市场的监管要求。部署模式上,LightGPT支持云部署和7B/13B/70B的私有化部署,包括大模型接口调用和金融问答服务,以及提供定制化金融预训练和微调服务,满足金融机构个性化需求。
经过几轮升级之后,目前在金融大模型能力评测中,LightGPT的逻辑推理、超长文本处理、多模态交互、代码、金融专业问答等多项能力都表现突出,已经具备为客服、运营、投顾、投研等金融业务场景提供能力支撑的水平。
事实上在布局大模型之前,恒生电子已经能够“玩转”小模型。因此,大模型的推出,也可以被看作是其进一步拓展服务范围的表现。那么,在这个过程中恒生电子又是如何结合自身原有业务的?
白硕表示:“首先,恒生电子旗下的子公司恒生聚源是一家为资本市场服务多年的金融数据服务公司,聚源数据库可以为我们的大模型提供高质量的金融专业数据。此外,其实长时间以来,恒生电子本身就是资本市场AI应用领域的重要厂商之一,我们为客服、运营、投研、合规风控等场景提供AI产品。现在进入大模型,我们也将把自身在AI应用领域积累的数据和经验用于大模型训练中。”基于这些专业的金融语料数据打造成的LightGPT,可以让原本需要很多人力成本处理的工作更加高效智能。例如,大模型应用于金融业务岗前培训场景时,大模型可以自主创作不同的陪练场景,对新员工进行提问,从而提高员工的培训效率,缓解人工考评压力。
而对于金融行业而言,安全合规至关重要。为此,LightGPT从数据安全、内容安全等角度出发构建了完善的安全合规体系。针对数据安全和隐私保护,恒生电子采取了一系列的措施来确保数据的脱敏、合规、授权和追溯,包括去除数据中所有敏感的个人以及机构敏感数据,对收集的所有数据进行匿名化和加密处理,制定严格的数据使用规范和访问控制,记录所有操作行为保证数据来源可追溯等。同时,还通过建立可靠的网络安全系统、定期开展安全评估等方式,识别和消除数据安全隐患。针对生成内容的可控问题,恒生电子构建了包括语料安全、模型安全、模型评估等在内完善的安全机制。在模型安全中,除了满足国家基本合规要求外,LightGPT通过加入证监会等最新监管法规条款和金融基础金融书籍和论文等语料,让生成的内容在金融法律法规遵循、金融领域知识真实性上有大幅度提升。此外,模型对于敏感问题、诱导问题也会进行处理。
大模型“中控”平台与智能应用产品
为了解决大模型和实际应用之间的连接问题,在LightGPT大模型的基础之上,恒生电子打造了大模型“中控”平台光子,串联“通用工具链+金融插件工具+金融数据+金融业务场景”。白硕解释称:“光子提供的是一种介于应用场景和大模型中间的对接能力。我们发现很多应用场景都会不约而同地需要一些通用的工具能力,比如对接实时行情,文档处理、数据要素识别等。所以我们想把大家所需的能力都放到一个中间层上,统一支持上层的业务应用产品”
目前,基于“光子”平台,恒生电子正在打造一系列的大模型应用产品,构建智能产品矩阵。今年10月,恒生电子正式发布了其中三款产品:光子·文曲、光子·善策和光子·慧营。其一,光子·文曲作为面向投资顾问的一站式内容创作平台,具有生成智能报告、AI问答助手等功能,能帮助投资顾问搜集报告素材、生成内容并进行审核发布。
其二,光子·善策聚焦投顾咨询场景,能通过理解会话意图、生成智能话术等功能,赋能投顾会话,为投资顾问精准定位客户标签,洞察客户意图,生成专业话术。。
其三,光子·慧营聚焦资管与托管领域,能通过文档智能分片、要素智能提取、文字内容智能匹配等功能,为运营工作提供系统智能的辅助解决方案,从而提升运营效率和服务质量。
(来源:资料图)
白硕表示:“我们对新技术的拥抱是自下而上的,就是发动大家去识别自己业务领域中哪些是合适的场景,然后判断其是否具有一定的代表性或是否需要一些通用的支持能力,这时候我们再进行一些通用能力的开发,进而支持从1到N的创新。”
除了光子系列的大模型应用产品,恒生电子旗下子公司恒生聚源打造的智能投研平台WarrenQ也是金融大模型应用领域的另一成果。
作为一款轻量化的投研提效工具,WarrenQ基于大模型技术,自然语言交互的方式打通投研工作场景,将“搜读算写”升级为“Chat读算写”,形成集“大模型+数据+工具”为一体的新一代智能投研模模式。具有AI脑图写作、金融语音识别、等功能,能以自然语言交互的方式,贯通工作投研场景,进而打造“大模型+数据+工具”的新一代投研模式。为了更好地推动投研数智化发展,未来WarrenQ还将持续加强大模型加持下的金融垂域“搜读算写”能力,结合更多场景输出智能投研工具。
显而易见的是,以LightGPT为代表的金融行业大模型,正在加速落地金融业务场景。与此同时,一系列摆在行业客户面前的重要问题也随之出现:如何判定一款金融大模型是否优秀?如何选择适合自己的大模型?
联合发布金融大模型标准,持续提升模型专业能力
为科学评价金融大模型技术能力和应用效能提供客观评估标准,今年9月恒生电子作为牵头编写单位,联合中国信通院正式发布国内首个金融行业大模型标准《面向行业的大规模预训练模型技术和应用评估方法 第1部分:金融大模型》。
该标准基于金融场景适配性、金融领域AI能力支持度和应用成熟度三大评估维度,涵盖银行、保险等多个金融行业和投研、风控等多个应用场景,能从金融场景适配性、金融领域AI能力、合规安全性、可追溯性以及部署等多个层面对金融大模型进行详细评估。
在真正成功地落地应用的过程中,合适的通用大模型可以提供一个良好的基础底座,而行业大模型则需要在这个基础之上不断地提升专业能力,从而适应行业需求。
在白硕看来,其中一个能力方向就是文本能力。金融大模型在训练文本数据的时候,需要领域专家进行反馈和调整,比如在精调阶段把握金融特有的任务类型、对特有专业术语的识别、解读等,让大模型的精调做的更加到位。另外,专业的代码能力也很重要。如果一个不懂专业的代码大模型,要在专业领域进行编码,就会受到较大限制。
谈及未来LightGPT的演进方向,白硕表示,恒生电子希望能在保持同等参数的情况下,进一步提升模型能力。其会在综合评估以后,决定是否保持或提升某一方面的能力,也会不断地加强大模型的数理能力。同时,公司也会继续推动大模型在金融行业的应用实践,促进大模型生态建设,从而更好地助力金融行业的数智化转型升级。