2024年中国金融大模型产业发展洞察报告

2024-09-20

AIGC技术的实际效用迎来了行业级的爆发,包括生成算法、预训练模型、多模态数据分析等AI技术。通用大模型技术的成熟推动了行业新一轮的生产力变革。在投资提升和政策支持的双重作用下,以大模型技术为基础,结合系统金融能力的金融大模型商品应运而生。对此,《2024年中国金融大模型产业发展洞察报告》将重点关注国内金融大模型产业的发展状况,分析金融大模型结构的特点和优势,预测未来的产业趋势和业务应用方向。同时,本报告优先选择国内金融大模型领域的龙头企业,深入分析其金融大模型的产品实力和实践技能,选出TOP20金融大模型行业优秀服务商名单。


介绍中国金融大模型产业发展背景。


技术崛起:回顾大模型迭代过程

多技术聚集结合推动大模型能力不断完善,实现“专用智能”→通用智能→“系统化智能”模式转变


AIGC技术的实际效用迎来了行业级的爆发,包括生成算法、预训练模型、多模态数据分析等AI技术。在内部模型迭代和多技术协同的影响下,“大规模” 以“预训练”为核心的大模型产品,逐渐从Transformer系统架构走向集图像识别、语义理解、视觉感知于一体的多模态、全应用模型系统,实现AIGC能力的进一步释放,实用化、专业化。同时,通用大模型技术的成熟推动了新一轮产业生产力变革。大模型主要产业的发展凭借其在场景泛化、技术出现、计算能力强等方面的优势,带来了产业革命级生产能力的提升。随着系统应用过程的推进,通用大模型在处理特定场景的专业化问题时出现了一些局限性问题。由于缺乏行业深度信息,很难在专业领域提供高价值的服务。此外,通用大模型对数据和计算能力的更高要求也提高了其在细分领域应用的门槛。相比之下,更具专业性和成本优势的大型垂直类型模型可能成为未来应用大型模型技术的关键途径。预计未来五年,服务于特定行业的大型垂直类型将覆盖80%以上的专业领域,大型模型能力将通过系统定制产品赋予更多垂直类型行业领域权力。



能力适应:大模型与金融数智化高度适应

大模型的技术特点和金融业务的智能化需求适应性很高。如何获得低运营成本的高价值大模型服务是金融行业大模型应用的核心问题。



工业定制:大模型技术的工业化应用

在投资提升和政策支持的双重作用下,以大模型技术为基础,结合系统金融能力的金融大模型商品应时而生。


近年来,在金融科技发展规划和金融机构数字化转型一系列政策的指导下,国内金融行业的数字化智能转型取得了巨大的成效。越来越多的金融企业意识到数字化转型对自身业务发展的帮助,行业对金融科技的资金投入逐年增加。以金融企业为主要服务对象的技术制造商迎来了需求侧市场快速发展的上升期。为前沿技术的产业化定制创造了优越的市场环境;此外,金融作为一个对监管合规性要求较高的信息密集型行业,其管控体系的完善和监管政策的完善促进了机构应用前沿技术增强合规性的需求。作为一种有实力优化业务流程、完善合规应用的技术应用,其产业化和垂直应用的价值不容小觑。



分析金融大模型结构特征和优势能力



大型金融模型核心结构概览总览

完整的金融大模型商品建设体系由通用大模型底座、专用模型工具链、私域需求场景训练三部分组成。



底座支持:通用大模型

国内通用大模型市场迎来了“百模对决”时代。泛化能力的应用和专业能力的提升将成为通用大模型服务金融业的两种主流方式。


在自然语言理解、计算机视觉处理等方面,以卷积神经网络、抵抗生成网络、ResNet为代表的深度学习模型可在自然语言理解、计算机视觉处理等方面取得较大突破,随后随着Transformer结构的应用,以Transformer和注意机制作为部件,参数超过10亿级的自我监督学习模型。随着近几年大模型技术在实际应用场景中的发展,通用大模型市场已经进入了“百模对决”的新时代。总体而言,GPT44-Turbo、以LaMDA为代表的国际市场头部通用大模型在模型架构能力、参数范围、应用交互体验等方面具有相对领先的优势。然而,随着近年来国内大型模型产业的爆炸式增长,中国市场也出现了“文心大模型”、“通义千问2.0”是一种国产通用大模型商品,旨在打造自己的大模型产品架构基础和生态模式,考虑到金融行业对信息创建和数据保护的要求较高,国内通用大模型体系的建设对于大模型技术在国内金融市场的应用尤为重要。在实际应用过程中,一般大模型的关键使用渠道主要有两种,一种是应用其泛化学习能力,将其他行业获得的信息和模型能力转移到金融行业,处理非核心金融业务场景中的信息处理和交互需求,另一种方法是将其作为金融垂直应用模型的基础。在工具链的加强和专有业务生态培训下,成为具有更高系统金融业务处理能力的大型金融商品,满足金融业对大型商品专业术语的概念和理解、情景目的解决方案和高精度、合规性的需求。



功能强化:大型工具链

作为通用大模型和垂直大模型之间的桥梁,工具链方便灵活,帮助金融大模型建设降低成本。


大模型工具链产品是指在金融大模型产品研发过程中,在产品研发、预训练、精调、压缩、推理、部署等方面提供高性能、灵活易用的工具模块。为了优化通用大模型在金融领域的应用性能,在简化复杂的练习过程、降低大模型技术使用门槛和落地周期的同时,提高了模型使用的准确性和可靠性。提高了金融大模型商品在投资回报方面的表现。目前,在国内市场,大模型工具链的使用与通用大模型有着深厚的联系。工具链的关键技术提供商主要是大模型制造商。随着通用大模型技术能力的迭代,预计未来更多的工具链产品将逐步融入大模型内部系统,以更高水平的通用大模型产品形式为开发者提供完整整合的AGI服务,但对于金融行业等专业堡垒较高的行业,大型厂商很难真正满足金融机构在技术层面的应用需求。基于长期服务金融企业的技术积累和行业Know-how能力将成为增强工具链功能的重点。因此,具有更多行业深耕能力的专业厂商仍然需要负责特定行业的专业服务。



业务适配:大型垂类情景训练

大模型在特定信息领域的定制训练将全面提升其垂直业务场景的应用性能,数据信息的专业性和群体特征的捕捉能力将成为业务适应的关键。


大型模型在垂直需求场景中的应用效果与其训练应用的文本数据密切相关,信息输入的质量将在很大程度上决定大型模型在特定业务场景中的应用性能,尤其是在专业壁垒较高的金融行业。大型金融模型对金融系统运营逻辑的认知、专业术语的解读以及对宏观市场环境的洞察,大多依赖于大型模型制造商在模型训练过程中的信息输入。因此,大模型制造商在金融领域的专业积累能力将极大地影响其大模型产品的应用效果。能否为模型培训提供专业的场景信息、专业知识和行业know-how能力,将成为判断其大金融模型可用性的关键。金融机构提供的私域情景信息除了模型厂商专业知识库的场景训练外,还将大大提高金融大模型建模的准确性和解决问题的能力。在合规分享的前提下,结合客户方私域数据的金融大模型产品在模型结构和参数丰富性方面会表现得更好。通过丰富大模型垂直情景训练,为金融机构提供与需求场景和客户群体特征匹配度较高的定制大型商品。




第一阶段:商品建设期

基于通用大模型的金融大模型构建体系,在保留产品差异化和个性化竞争空间的同时,具有成本控制和同频迭代的优势。



第二阶段:模型使用寿命

金融大模型商品在资源需求、生成效率和解决问题方面具有较强的优势,通过模型结构调整、专用功能增强和业务技能提升。


与传统的通用大模型相比,金融大模型产品在使用阶段的核心优势主要来自其结构类型和行业实践经验。在模型算法能力、参数精度、产品结构模式等方面,通过完整的垂直模型构建体系下的金融大模型产品具有更好、更准确、更轻的特点。在其影响下,对外部资源的需求水平相对较低。精简模型商品不再受到巨大的计算能力需求的限制,不仅降低了金融行业使用大模型商品的门槛,也降低了机构模型的维护成本。结合金融大模型在金融场景下解决问题的能力和专业表现,轻量级金融大模型产品将更有能力为金融机构提供更具成本效益的专业AGI服务,产品本身具有更高的实用价值和推广应用条件。



第三阶段:迭代维护期

在保证大金融模型商品灵活性的同时,“小而精”的结构类型降低了商品后续使用的维护迭代门槛,提高了产品的普遍性。


作为政策导向和宏观影响力较强的服务业,金融机构的经营、决策和发展与外部政策导向与市场环境密切相关。对于服务于该领域的大型产品,需要能够根据外部信息的变化及时调整模型结构,为金融机构提供及时、准确、专业的业务解决方案,以适应金融业的高效和实时需求。与传统通用大模型在金融领域的直接应用相比,垂直金融大模型“小而精”的结构类型在面对外部环境变化时具有足够的灵活性和适应性。模型调整和再培训的反应更加敏捷,可以在模型结构中快速反映市场形势,为金融机构提供前沿的业务解决方案。此外,金融大模型产品的结构类型优势在产品维护难度和成本方面也得到充分呈现,为产品后续迭代升级和长期应用奠定了基础。



中国金融大模型产业未来趋势预测


前瞻性的市场趋势

金融企业对技术产品的合规性、实践技能和稳定性的要求将引导供应方产业的迭代方向;分工合作、强强结合将成为未来产业发展的主流方式


金融业属于政策导向型产业,对前沿技术产品的合规性、实际效果和性能稳定性要求较高。对于大型金融产品来说,生成式AI作为其底层技术能力,已经被认为是技术发展曲线的膨胀阶段。如何将市场对技术能力的期望转化为大模型的产品实力,将成为大模型产业发展的重要课题。结合金融业应用的特殊性,未来金融大模型产业的发展将很大程度上取决于需求方对产品的认可,即金融企业如何使用大模型产品。考虑到金融企业对新技术产品选择的谨慎程度,未来中短期内大型商品在金融领域的表现将极大地影响机构对该产品的认可,从而影响后续产业的整体发展。对于金融大模型产品的供应商来说,如何在合规的背景下保证产品的技术能力和专业性,为机构提供更好的AI体验,是目前短期和中期发展的关键。就我国金融大模型市场的发展而言,独立机构很难实现从技术底座、能力增强到金融知识培训的各个环节的行业领先优势。“多环节、多组织”的合作模式可能会成为构建高质量金融大模型商品的一种方式。各自的技术厂商将提供底层技术、能力提升和专业培训,充分发挥金融实践积累与技术创新迭代的协同作用,推动国内金融大模型产业链的整体发展。



产品结构建设

数据合规应用与成本、效果之间的衡量将成为影响垂直大模型实践效果的关键因素,边缘部署和轻量化建设可能成为金融大模型商品建设的新趋势


金融行业对数据信息保护的要求很高。云部署意味着金融企业需要通过将业务数据信息上传到云部来完成模型培训,并获得输出结果,这对金融企业自身的信息安全和合规应用是一个很大的挑战。由于这种部署方式,市场的整体接受度和认可度也将受到很大的限制。大多数涉及私域数据的专业需求场景将难以接受云部署的大模型应用。而且基本的金融场景也很难充分发挥金融大模型在涌现和复杂信息处理方面的能力,从而影响大模型的实际价值。因此,大型商品要想在金融行业实现高价值、大规模应用,就要提高产品部署模式的多样化,逐步从云延伸到边缘,增强商品部署的私密性,从而减少大型商品应用过程中面临的信息安全问题,满足金融机构在合规环境下的个性化定制需求。同时,与国际市场通用大模型的“大规模军备竞赛”不同,巨大的参数对于垂直大模型来说过于冗余,尤其是对于对结果生成时效性要求较高的情况,参数过多的大模型产品并不是一个好的选择,模型规模的扩大也会显著增加维护成本和软硬件的支撑负担。因此,如何压缩模型,减少模型计算的复杂性和内存比例,将成为未来行业发展关注的焦点。通过合理的修剪和低秩分解,大模型产品将被轻量化,用于精准运营,为用户提供稳定可靠的计算结果。



技术能力迭代

基于大模型能力,构建具有环境感知、自主理解、决策制定和执行能力的AI。 Agent智能体,促进大模型能力的应用。


AI协同应用的技术进化路径意味着AI协同应用 在“动态决策”的大模型框架下,Agent将成为大模型技术迭代和落地应用的重要方向,AI Agent将接收外部指令、信息并以“非常拟人化”的形式进行深入了解,并依靠其CoT。 (Chain of Thought)能力,通过计划、行动和观察相结合,填补推理与实践的差距,实现有效的意图识别和决策制定。此外,大模型作为Agent的“大脑”,将为其全自动管理能力提供四种能力的补充:规划、记忆、执行和工具,促进其以任务目标为主导的一系列行动,如处理更复杂、更多元化的决策任务、独立规划任务、环境感知、选择行动、观察纠错等。,从而提高解决大模型技术具体问题的能力和决策结果的准确性,促进智能体的实际应用过程。



未来场景应用

加深技术产品之间的协同应用,实现从非决策场景向决策场景的过渡,承担更重要的金融投资角色;技术、业务和合规的应用困境仍然需要重视


目前,包括传统AI技术产品在内的许多前沿技术已经应用于金融业务的许多环节,其服务模式和应用效果已经达到相对成熟的水平。对于金融模型来说,未来的服务模式并不是完全取代以前的小模型或其他技术产品,而是应用大模型在语义理解、信息分析、内容生成等方面的优势。作为补充能力,可以提高原有的实践效果。此外,大型金融模型的应用将逐步从简单的信息处理和图形生成扩展到与投资决策相关的核心业务板块,充分发挥大型商品在智能出现和复杂信息处理方面的优势,为投资研究和投资场景提供更全面的技术赋能。同时,金融大模型信息处理能力也将在客户运营和挖掘中得到更充分的应用,以高效低成本的方式到达长尾客户,从而深入挖掘私域用户的需求。在未来场景应用的过程中,大模型的技术能力、金融业的深度培育和监管合规要求将极大地影响其实际效果。如何在合规的前提下保证产品的技术实力和业务水平,将成为未来金融大模型商品之争的关键。



中国金融大模型产业专家的声音






本文来自微信微信官方账号“艾瑞咨询”(ID:iresearch-),作者:艾小妹,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com