这几天被国泰君安和海通证券合并的消息刷屏了,号称即将迎来航母级券商。正巧本人最近在关注沪上另一家券商,所以心血来潮,聊聊国内券商的大模型。

此文因国君和海通而起,就先看看这两家券商的大模型吧。

国泰君安

今年3月,国泰君安在官网发文,宣布推出业内首家千亿级参数多模态证券垂直类大模型——君弘灵犀大模型。这款模型什么来头?来自阶跃星辰。

阶跃星辰的boss以前是微软的,公司属于低调前行那种。前段时间阶跃星辰训出了万亿参数的MoE,但是有没有给国泰君安使用不得而知。我们还是来看看君弘灵犀大模型能解决什么问题吧:

在行业内第一个实现了将大模型能力全面融入客户智能化服务体系之中,完成对公司君弘灵犀智能服务的全新升级,将为4000多万客户在智能投顾问答、投研内容生产和交互模式上带来全新的体验。

…涵盖君弘智投、综合诊断、智能选股、热点资讯、多模态处理等十大功能…

毫无悬念,券商的AI落地场景必然有投顾、投研。虽然目前的A股市场,智不智能、投不投顾,好像意义不大,但该有的还是要有。其他诸如智能选股、综合诊断等,大模型大概率是用来生成一些用户友好的回复,核心决策是不可能完全交给大模型的。

今年7月份,上海国资委官网有篇文章提到了国泰君安的AI投顾超级助手:

“AI投顾超级助手”是国泰君安与财跃星辰在投顾领域合作的最新应用,践行买方投顾服务模式的最佳实践,借助千亿级参数多模态模型的图像识别、总结提炼、趋势研判、知识库等能力,打造“员工身边的智慧助理”,助力投顾展业服务…

上面提到的“总结提炼”,大模型再擅长不过了;“趋势研判”,大模型也很适合,准不准另说。这些场景的风险都比较低,用户对生成错误的容忍度较高,大模型在这样的场景中当仁不让。

海通证券

与国泰君安相比,海通证券也不落后。先是在2023年8月和商汤签署战略合作协议。到了今年5月份,商汤中标了海通证券的“证券垂直领域大模型”项目。商汤官网上的文章是这么说的:

商汤通过领先的大模型技术,并结合海通证券的真实应用场景,构建了符合金融行业的完整思维链,并重点在智能问答、智能研发、智能研报等业务环节实现落地应用。

什么是“符合金融行业的完整思维链”?我没有找到介绍。但是,想让大模型理解券商的业务逻辑,把金融推理的思维链融入提示词是个不错的办法。除此以外,我们先看看“智能问答”:

结合“日日新SenseNova 5.0”的强大语言理解和交互能力,商汤联合海通证券打造了大模型驱动的智能问答助手,通过叠加行业相关知识、法规条例及搜索引擎,能够准确理解相关问题,并及时高效地给出回复答案…

再看看“智能研发”:

基于海通证券丰富的数据基础,商汤大模型构建了完整思维链,深入理解业务逻辑,为开发者提供了代码智能补全与对话问答的服务,可有效提高开发效率…

商汤日日新5.0是在10亿token上训出的多模态MoE,号称对标GPT-4 Turbo。能不能对标暂且不说,我就发现业界是越来越喜欢用MoE了。为啥呢?预训练收敛快,推理成本也低,扩展起来也方便,哪里不会训哪里,三个臭皮匠顶个诸葛亮。大模型厂商青睐MoE也没毛病,就是部署成本有点高。

国泰君安和海通证券合并之后变成新的巨无霸,传统头部券商“三中一华”的格局将被打破。但是,无论是国君还是海通,都没有提及“自研”,倒是中信证券好像做了些自研工作。

中信证券

今年8月份,中信官网发文介绍了与大模型相关的部分自研工作:

为保障大模型回答的准确性和严谨性,中信证券自主研发了一系列先进技术,包括大模型与图计算融合、法规自动化标签匹配等。这些技术的应用,不仅显著提升了大模型在证券垂直领域回答的准确性,将其提升至98.5%,还确保了回答的严谨性和可靠性。

“大模型与图计算融合”是啥咱也不知道,但是他们又说能提升回答准确率,我猜这里的“图计算”是指知识图谱,那么两者融合就是RAG。也可能用上了GraphRAG?反正都能提升准确率。

他们落地的业务场景相当丰富,首先是“股权激励”:

中信证券建设了行业首个股权激励大模型应用,助力公司服务的企业提升经营效率,通过服务上市公司客户实施股权激励发挥其战略管理作用。目前平台已集成股权激励案例7000例,自动化生成1500次股权激励方案,全面赋能业务落地,提升服务质量。

看样子重点是“生成股权方案”。大模型能否生成完整方案不得而知,但这个场景是蛮新鲜的,而且也没有超出大模型的能力范围,主打生成。然后看“合规风控”:

中信证券构建了大模型风控合规助手iCare(Intelligent Compliance and Risk Ecosystem),集成了舆情资讯识别分析、内外规知识库问答、合规展业等功能,支持多标签数据应用、风控数据问答及风险事件脉络分析等服务,全面覆盖风控、合规、投行和财富管理等业务,通过全链路赋能,实现了从知识库构建到大模型数据服务的完整合规体系,是中信证券全场景风控合规的可靠助手。

注意“风控数据问答及风险事件脉络分析”,猜测这里会用到大模型。问答是RAG常规操作,但是用大模型分析风险事件脉络并不容易,需要更具体化的步骤,例如提取风险事件以及关联实体,形成风险关系图谱等。再看看“财富管理”:

推出大模型财富助手Wealth Copilot,通过大模型技术对海量知识、服务经验、历史决策的检索与总结,为投顾人员提供高水平的展业辅助,满足客户复杂多样的财富管理需求,为证券公司提供全方位、高质量、多层次、智能化的财富管理服务。

大模型确实是投顾福音。检索历史经验并不难,难的是把零散的经验拼成一段完整的投顾方案。没有大模型的时候也不是不能做,但是想要“把话说利索”,还是需要不少中间步骤和小模型。如今有了大模型,技术难度小了很多。

最后看看“债券场景”:

推出了行业首个自主研发的债券类大模型应用 Bond Copilot。债券智能助手是一款利用大语言模型、大数据和机器学习技术,为债务融资业务提供智能化解决方案的助手,涵盖数据可视化、智能分析、自动化问答和服务场景化,全面提升投行业务效率和价值,助力债券市场高效融资和实体经济高质量发展。

不得不说,作为头部券商,中信证券确实有两下子。落地场景清晰,还有一定的自研能力。然而,以我对证券公司的了解,他们是不大可能从头训一个大模型的,背后的大模型供应商是谁,我没有查到。但是,今年7月份,人民政协网上有篇文章是这么说的:

目前,百度已经与中信集团、中信金控、中信银行、中信消费金融等多个金融板块在人工智能、大模型、云计算等领域开展了广泛合作。2023年,百度智能云与中信金控联合打造的AI数字人“小信”成功入选《IDC PeerScape:AI数字人最佳实践案例与探索》最佳实践案例,并已为亿万中信用户提供了业务咨询服务。

中信证券大模型的背后会不会也有有百度的影子呢?

中信建投

说罢中信证券,就不得不提一下它的兄弟中信建投,这家公司刚刚因为实习生炫富火了一把。今天不谈实习生,只谈大模型。网上能看到的主要信息是今年7月份的世界人工智能大会,中信建投介绍了自己的大模型落地。先看看财经网报道

中信建投证券信息技术部总监李剑戈介绍中信建投证券基于大模型增强的智能投研平台时称,财报PDF解析模型的解析准确率超过95%,语音转录模型的金融专有词识别准确率可达99%,能够在一天“读”完市场新增的超1000份新研报,10分钟“听”完2小时的调研会议,提升投研工作率超40%。

乍一看,“准确率超过95%”、“准确率可达99%”等指标比较抢眼。仔细一想,pdf解析的难点表格、版式、图片等,准确率的提高主要靠精耕细作专用小模型和规则,语音转录主要靠优化ASR,都跟大模型关系不大。一天读1000份研报可能依赖大模型,因为要从非结构化数据中提取知识。

搜狐的一篇文章同样介绍了中信建投在世界人工智能大会上发布会:

…财务报告PDF文件解析准确率超过95%,语音转录中金融专有名词识别准确率达99%,具备500页以上超长招股书摘要提取能力,可以10分钟“听”完2小时的调研会议,提升投研工作效率40%以上。平台从量价变化、财报研报、新闻公告中提取金融实体信息,挖掘另类因子及量价因子1500余个…

摘要500页以上超常招股书,这是大模型的长上下文能力;从各种数据源中提取金融实体信息,以前我们要靠大量的数据标注,如今被大模型降低了难度。

两篇报道互相印证。可以看出,目前大模型在中信建投的应用主要集中在智能投研的知识抽取方向。但是同样没有提及是谁提供的大模型能力。既然同为中信集团,说不定就是百度呢。

最后

除了上面提及的,国内还有很多券商也在试水大模型。还是那句话,大模型如同军备竞赛,别人都梭哈,自己也不能没有,况且大模型这玩意确实有用,而且在启动数据匮乏的情况下也好用。

但是,现在的大模型远没有达到新闻吹捧的那种高度,取代低水平重复劳动绰绰有余,但想要实现推理和规划则达不到预期。盲目上马大模型有害身体健康。我觉得LeCun说的对,这种LLM不能实现AGI。上文提到商汤帮助海通构建思维链,实际上,思维链恰好是LLM本身能力不够的体现。如果做不到AGI,就放弃幻想,老老实实搞微调,写思维链,可能让大模型在金融领域走得更远。

券商场景依然没有逃离抽取、生成,好像没看到有人拿来推理和规划,说明虽然外界炒得火热,资本也没有完全失去理智。让大模型给客户推荐一个投资组合,亏了找谁说理去?有点遗憾的是,目前没看到有券商提到拿大模型合成数据。LLaMA3的案例告诉我们,大模型是合成数据的一把好手。大模型合成数据喂给小模型,可能是大模型落地金融的一个好场景。

再帮券商想一个大模型落地场景:国君和海通合并了,新公司起啥名好呢?不如问一下两家券商的大模型。