春节期间,中国人工智能(AI)初创企业深度求索发布的最新开源模型DeepSeek-R1横空出世、现象级火爆,其在算力成本节约和开源方面的里程碑式进展,令全球开始重估中国AI发展的技术潜力。事实上,刚刚过去的2024年是见证中国AI大模型快速的提升的一年。技术的快速迭代和资本的密集涌入,叠加政策的全力支持,推动了国内大模型应用场景的繁荣。尤其是去年下半年以来,大模型应用落地无论在B端还是在C端都取得了有目共睹的大踏步进展。
在B端,大模型在教育、金融、政务、医疗、能源、交通、气象等多个领域实现了深层次地融合和创新应用。据不完全统计,2024年公开披露的大模型中标项目超过1000个,中标金额约为36.4亿元。而2023年对应的项目仅为54个,中标金额3.9亿元。一年间,大模型中标数量增长近18倍,中标金额增长8.3倍,显示大模型应用已呈爆发态势。
金融业因具有大规模、高质量的数据资源和多维度、多元化的应用场景,一直以来被视为大模型应用最早也最广泛的领域之一。根据中国移动上海产业研究院发布的报告,金融领域的大模型渗透率已突破50%,在各行业中居首位。从中标数量来看,金融大模型仅次于教育科研和通信领域,达到63个,以银行和券商为主,还涉及信托、期货、汽车金融等。
中国银行业协会发布的《2024年度中国银行业发展报告》指出,AI大模型技术能够充分挖掘银行业的海量数据,而银行业具有适用AI大模型技术的丰富场景。当前,AI大模型正推进我国银行业服务、营销、产品等领域的全面革新,催化“未来银行”加速到来。
大模型本质上是一种“知识外包”,站在这个视角,但凡涉及知识、数据、分析、推理的环节,都可以被AI替代。有业内专家觉得,等大模型的智能代理(Agent)能力加强完善,统筹和协调的能力与人类持平,金融行业就是另外一番场景,距离智能金融的终极梦想将更进一步。随着DeepSeek的崛起,这样的“奇点”时刻是不是正在迫近?《金融时报》记者近期采访了多位AI公司负责人和研究者,深入探究几个颇为迫切和现实的问题——金融大模型应用如何从非决策性场景逐步向决策性场景拓展?技术上又该怎么样应对AI幻觉等挑战?
在国际上,彭博和摩根士丹利是最先拥抱大模型的金融机构,其模型构建策略和场景颇具代表意义。在国内,头部金融机构在大模型应用创新方面保持领先。例如,工商银行率先建成全栈自主可控的千亿级参数规模AI大模型技术体系,已应用于20余个业务领域和百余个业务场景。其所应用的大模型技术不仅包括文本处理,还涵盖了语音识别、图像与视频理解、智能搜索等多层次、多模态、多模型系统的融合协同。
“目前,大模型在国内金融机构的应用多是以办公辅助、客户咨询问答、信息汇总整理等非决策性场景为主,比起其最具特点的智慧涌现能力,目前大模型产品的强计算、场景泛化迁移能力的用途更广泛,大模型产品在以上两种能力的实践表现也更成熟。”艾瑞咨询金融研究负责人张玉在接受《金融时报》记者正常采访时说。例如,以大模型为技术底座的智能客服系统,能够用规范化的语句回答客户泛业务、泛场景的多元化问题,响应及时,问题覆盖面广,回答语句标准礼貌,极大降低了客服工作对于人力的需求,为前来咨询的客户提供更便捷、准确的服务体验。
与智能客服类似,智能营销也是大模型在金融行业落地十分普遍的场景之一。传统的营销外呼需要依赖大量的人工坐席,而且早期的智能机器人大多基于小模型,它们在处理简单询问时表现尚可,但在进行持续性对话和复杂问题解答时能力有限,导致与客户的沟通瓶颈明显。
中关村科金总裁喻友平对《金融时报》记者介绍,某金融机构在智能营销外呼场景应用中关村科金大模型外呼后,情况有了明显改观。在实际应用中,相较于传统的机器人外呼,大模型与客户的沟通轮次提升了83%,平均通线%,明显提升了客户体验。客户更愿意与可提供流畅对话和有效解决实际问题的大模型进行互动。该金融机构单日最大外呼量1200万通,其中,80%以上是由大模型完成的,剩余部分由人工坐席承担。这不仅极大提升了工作效率,也优化了资源配置。
“对于有更广泛诉求的高净值客户,人工介入和个性化服务仍然是必需的。在这样的一个过程中,大模型起到了智能筛选的作用,识别出需要深度服务的高净值客户,而客户的服务则由人工完成。这种人机协同的模式不仅提升了服务效率,也促进了人工坐席的专业能力提升。”喻友平说。
智能投研也是大模型在金融领域应用较广的一个业务场景——通过利用大模型技术分析海量金融数据,辅助投资决策,提高数据分析和投研人员的工作效率。商汤科技副总裁、金融事业部总经理钱浅莹向《金融时报》记者介绍,商汤大模型深度结合行业数据,让原先的行业研究模型具备理解分析图表、舆情、往年数据等更广范围信息的能力,得出更加可靠的行业研究结论。智谱相关负责人对《金融时报》记者透露,智谱正在和券商平台联合改造其投研流程,具体包括投研思考框架的自动总结生成、基于投研框架下的回答生成以及关键数据的智能查询等。
而在金融核心业务场景的落地方面,据张玉观察,目前大模型产品在服务以风控、投资为代表的核心业务场景时,暂未实现其理想应用模式下的完全智能状态,仍需要较高的人工参与。
技术厂商也普遍认同这一观点。“目前,大模型技术在金融核心业务领域的介入还处于初级阶段,主要扮演着为员工提供生产力工具的角色,辅助金融从业者进行日常业务操作和决策支持。”钱浅莹以风控领域为例谈道,商汤大模型可以辅助风控人员进行风险识别和评估,提供风险预警信息,但最终的风控决策仍需由专业的风控人员综合考虑多方面因素后做出。
“未来,随着大模型基础能力的持续提升,以及金融机构整体数智化应用能力的逐步的提升,大模型有望在金融核心业务中实现更深层次的融合和应用。”钱浅莹预计这将为金融机构带来显著的业务增量,如在投资领域,大模型可当作投顾服务给投资者提供个性化的产品推荐服务与信息服务;在投研领域,大模型可以对海量非结构化/结构化信息做多元化的分析提取,实现投研信息精准沉淀;在决策领域,通过大模型的深度分析和预测,可以为投资决策/量化交易提供更准确的依据,提高投资回报率。
2024年,大模型在金融行业应用方面涌现出诸多技术突破点。“例如,多模态数据处理能力使得大模型可以同时处理多种类型的数据,如文本、图像、音频等,这让大模型能够更全面地理解复杂的金融场景。又如,通过改进模型结构和训练方法,大模型的推理能力得到了显著提升,能够更准确地识别和评估风险,做出更明智的投资决策。”智谱相关负责人说。
北京智源AI研究院日前发布的“2025十大AI技术趋势”报告也认为,统一的多模态大模型实现更高效AI。喻友平介绍说,多模态大模型是中关村科金和头部金融机构共创的重要方向之一,大模型技术正在借此逐步向金融业务核心场景突破。例如在金融安全领域合作,可通过跨模态活体检测、深度防伪大模型等技术拦截各类伪造攻击手段。
在逻辑推理领域,多模态大模型强大的思维链能力也被多位业内人士提及。“在专业的场景中,大模型要学习和模仿专家的思维链,并不断迭代。”王丰辉解释道,人类的专家之所以成为“专家”,是因为经过长时间的领域浸淫和经验积累,在处理事情时有自己的一套思维模式。每个企业都有自己的专家团队,每位专家都有自己的资深经验,如何把专家的知识转化为大模型的知识,这是大模型To B领域的一大挑战,也是To B领域的一大前景。钱浅莹也表示,思维链将帮助金融解决更多复杂的问题,在技术能力上突破在金融营销辅助、风控决策上深入应用的可能性。
此外,要可信与可控地解决金融场景应用的问题,仅靠大语言模型是不够的。例如,异动个股分析是金融业务场景中一个很复杂的任务,要解决超长文本窗口、幻觉率、知识检索增强、新闻事件相关性、重要性识别、舆情正负面等问题。王丰辉表示,这样一个时间段,大语言模型与局部微调的较小模型结合,能轻松的获得更高的性能,同时能带来更高的可解释性。
张玉则发现近年显而易见的技术突破大多分布在在金融大模型产品的工具链方面。针对各自服务的金融业务场景,国内技术服务商在大模型产品的原生工具链环节为客户提供了更加精细化的选择。这不仅优化了大模型产品在垂类场景应用的专业化服务能力,还通过对产品结构精准简洁的调整,降低了其在部署、使用的过程中对于算力及其他固定成本的需求,在大模型的反馈速度与生成结果的准确度方面也有了更多的保障。
喻友平更加关注大模型的落地应用。“随着大模型进入精细化落地的进程,市场需要真正有用的To B大模型应用,要能够回归商业本质帮助客户解决核心问题,要具备端到端的解决方案和全链条的服务能力。”喻友平认为,“平台+应用+服务”是企业大模型落地的最佳路径,也是企业智能化升级的方向。以某证券公司的“大模型智能陪练”为例,解决的是传统培训后客户经理知识应用和知识掌握效果不佳的问题。中关村科金先基于大模型平台训练出更懂金融证券专业相关知识的行业大模型,再基于内部产品知识库,打造出智能知识助手、智能陪练助手等大模型应用,为该证券公司的客户经理提供培训服务。这就是典型的“平台+应用+服务”的大模型落地路径。
生成式人工智能技术加速融入千行百业、给人们的工作生活带来便利的同时,也不乏“翻车”的时候。例如受制于数据质量、语料库标准化建设、训练成本等因素,AI幻觉不时出现,即“一本正经地胡说八道”,这无疑会对C端用户造成误导,在B端应用中也更需要引起警惕。
不仅如此,张玉进一步分析称,包括AI幻觉、数据准确性以及大模型产品可能广泛存在的伦理问题,都将对金融机构应用大模型前沿技术带来挑战。“这些挑战可能会影响模型的性能和可靠性,尤其是在对风险十分敏感的金融领域。”智谱相关负责人说。钱浅莹也表示,AI幻觉可能会引起大模型生成错误或不准确的信息,进而影响金融决策的可靠性。例如,在金融分析和预测中,如果大模型受到幻觉的影响,可能会得出与真实的情况不符的结论,从而误导投资决策等。
以上挑战并非无解。业内一致认为,技术上能够使用提高数据质量、模型验证与测试、人机协同、定期更新模型等方式来应对这些挑战。智谱相关负责人称,例如,在部署模型之前,能够直接进行严格的验证和测试,以确保模型在不同场景下的性能和鲁棒性。能定期更新模型,以反映新的数据和趋势,提高模型的准确性和可靠性。
此外,还能大大的提升模型的透明度和可解释性,使决策过程更加清晰,便于监管和审查。钱浅莹表示,提高大模型决策过程的可解释性,可以使金融机构和监督管理的机构更好地理解和信任其应用结果,从而促进大模型在金融领域的广泛应用。
事实上,业界在应对AI幻觉等问题上已经有了不少实践。OpenAI o1通过扩大参数规模和强化学习来实现推理能力的提升;中关村科金、商汤科技等厂商则通过结合高质量的领域知识和数据,利用RAG(Retrieval-Augmented Generation)等技术,打造出专业性更强的行业大模型应用,这些都能有实际效果的减少大模型幻觉问题。
业内一致认为,当前的开源大模型基本满足了金融机构的非决策场景需求。而在遇到关键决策过程时,智谱相关负责这个的人说,能结合人类专家的判断和模型的输出,以减少错误和幻觉的风险。张玉进一步提出,建议提升大模型产品使用者对于该技术产品的接受程度与理解能力,充分把握实践场景下的信息反馈,逐步实现从小范围、非核心场景向更重要的决策性场景拓展。