做好“数字金融”，大模型大有可为

在今年的两会上，“五篇大文章”首次进入政府工作报告。数字金融作为“五篇大文章”之一成为热议话题。加快科技创新，是实现金融高质量发展的关键，也是推动新质生产力发展的内在需要。加快建设金融强国，金融业重任在肩。

当前，全球的人工智能技术不断取得新突破，我国人工智能也在蓬勃发展，赋能千行百业。生成式AI大模型必将为金融业变革带来新的发展机遇。

人民日报出版社近日推出《生成式AI大模型：赋能金融业变革》一书，十余位业内专家学者共谋“数字金融”大文章，共同探讨生成式AI大模型如何在金融应用中顺利“闯关”。图书得到国家金融与发展实验室理事长李扬、中国工程院院士郑纬民、中国工程院院士柴洪峰鼎力推荐！

基本信息

书名：《生成式AI大模型：赋能金融业变革》

作者：姚前，杨涛主编

开本：16开

页数：228

字数：202千

定价：46元

书号：978-7-5115-8160-0

出版时间：2024年3月

作者简介

姚前

工学博士，教授级高工，中国证监会科技监管司司长、信息中心主任。曾任中国证券登记结算有限责任公司总经理，中国人民银行数字货币研究所所长，发表学术文章200多篇，著作10多部，多次获得金融科技发展奖一等奖等奖项，多项专利发明人，主持多项国家标准制定。

杨涛

国家金融与发展实验室副主任，中国社会科学院产业金融研究基地主任，研究员，兼任全国金融标准化技术委员会委员等。主要研究领域包括宏观金融与政策、数字经济与数字金融、支付清算等。已主编出版图书《中国产业链韧性：金融的力量》《金融创新：助力实现共同富裕》《绿色金融：助力碳达峰、碳中和》等。

内容简介

随着金融科技的蓬勃发展，金融行业正经历着一场革命性的变革。金融垂直领域模型构建与金融数据的结合成为推动金融科技创新和发展的重要动力。同时，金融垂直领域的大模型应用仍面临挑战。《生成式AI大模型：赋能金融业变革》邀请中国工商银行、清华大学、中国工程院、中国证监会等产、学、研领域的十余位权威专家，对金融领域大模型的技术、应用、合规、监管等方面进行深入阐释，力图共同构建更强大、安全、可靠的金融垂直领域基础模型，切实为经济高质量发展提供助力。

专家推荐

李扬

中国社会科学院学部委员、国家金融与发展实验室理事长

金融业是使用科技最主要的领域之一。生成式人工智能的出现，对某些领域来说似为灭顶之灾，但是历史证明，科技的步伐是挡不住的，而且科技一定会创造新的生存场景。本书既阐述了大模型治理智慧，又分析了大模型在金融领域的实践应用案例，还展望了未来发展方向，能为做好科技金融这篇大文章提供强有力的智力和学术支持。

郑纬民

中国工程院院士、清华大学计算机系教授

大语言模型为人工智能系统赋予强大的语言理解和生成能力，具有明显的优势特征。在金融行业，大语言模型可以用于金融分析、风险分析、客户分析等众多业务场景，本书对此也有多方论证与详细阐述。当前，众多金融机构主动融入数字中国建设大局，加快建立开放性的产业生态，把选择权交给用户，驱动行业百花齐放，也将能真正促进大模型产业在金融领域的健康发展。

柴洪峰

中国工程院院士、复旦大学金融科技研究院院长

金融垂直领域的大模型应用仍面临挑战。金融数据和知识的私密性限制了共享和构建大规模数据集的能力，金融数据的多模态特性也增加了模型处理和建模的复杂性，还有“幻觉”、伦理治理等问题。为了克服这些难题，加强产学研用的合作势在必行。本书综合展现大模型的有关理论与具体应用实践，为新形势下更好地促进大模型落地金融场景提供很好的借鉴和启示。

高峰

中国银行业协会首席信息官

大模型应用将给银行业带来深远影响。不同规模的银行，走出了不同路径。大型银行坚定地加入了人工智能大模型技术发展浪潮之中；中小银行也从战略层面开始重视大模型应用并与多方合作。针对大模型落地过程中遇到的各种难点，各家银行已在积极寻求解决方案。本书包含多方面的探索与实践，将为银行业金融机构提供应用范例，助力其持续提升数字化转型质效。

编辑推荐

作者专业：作者均为来自学界、监管层、业界的专业人士，能够充分瞄准问题痛点，把握发展方向。

专家认可：中国社会科学院学部委员李扬、中国工程院院士郑纬民、中国工程院院士柴洪峰联袂推荐。

内容丰富：既有对大模型落地金融业的详细介绍，又包含具体的应用实例，同时针对当前金融业数字化改革面临的一系列问题进行深刻探讨。

正当其时：2024年2月15日，OpenAI正式对外发布Sora模型，引起全球广泛关注。新的生成式大模型层出不穷，科技浪潮不断奔涌向前。探索金融业数字化转型路径，使大模型更好落地金融业是顺时之举。

目录

向上滑动阅览

序一大模型赋能金融科技：思考与展望柴洪峰 Ⅰ

序二生成式AI让金融服务更有温度高峰 Ⅴ

前言杨涛 001

上　篇　大模型考验治理智慧

01 大模型生态建设与合规发展　007

姚前

02 生成式AI大模型的金融应用仍需“闯关”　022

杨涛

03 走向负责任和可问责的金融大模型伦理治理　034

段伟文

04 人工智能在金融领域应用的风险暴露与监管挑战　051

尹振涛王美懿

05 大模型赋能金融业的责任之路　066

温昱晖段力畑

中　篇　大模型如何改变金融业

06 AI大模型在银行业的落地探索实践　089

吕仲涛

07 银行如何拥抱AI奇点时刻——以ChatGPT为例　100

沈志勇

08 生成未来：人工智能预训练大语言模型在金融风险管理的应用及展望　114

俞　勇

09 大语言模型在银行财富管理领域的应用　130

吴永飞宁冰叶广楠刘森

王彦博陈志豪陈生杨璇

10 大模型在基金投顾领域的潜在应用和风险　143

刘　玮范仲悦马彦楠

下　篇　人工智能还将走多远

11 以数据资产图谱技术构建金融大模型的数据供给生态　157

林常乐

12 人工智能大模型在金融行业的应用展望与建议　169

李振华刘沛然徐润卢传斌徐枞

13 大语言模型在金融知识服务中的挑战与应对　181

庞　斌孔　夏

14 大模型在银行客户体验管理和客户经营领域的应用实战　193

孙中东　陈　涛

序言一

大模型赋能金融科技：思考与展望

柴洪峰中国工程院院士

随着金融科技的蓬勃发展，金融行业正经历着一场革命性的变革。金融垂直领域模型构建与金融数据的结合成为推动金融科技创新和发展的重要动力。通过整合跨学科研究和系统方法，能够探索金融系统的整体性和复杂性，超越单点技术突破，从而推动金融科技的突破性进展。近日，国家金融与发展实验室副主任杨涛教授邀请我为本书作序，我将从大模型赋能金融科技方面谈谈自己的思考和对未来的展望。

大数据、人工智能和机器学习等技术的发展，使人们能更快速、高效地获取、分析、存储、共享和整合各种异构数据。然而，金融垂直领域的大模型应用仍面临一些挑战。金融数据和知识的私密性限制了共享和构建大规模数据集的能力。此外，金融数据的多模态特性增加了模型处理和建模的复杂性。为了克服这些难题，加强产学研的合作势在必行，共同构建更强大的金融垂直领域基础模型，提升大模型对多模态数据的表达能力至关重要。

一、构建金融垂直领域模型：金融数据与通用大模型的结合

金融科技的崛起正在改变金融行业的面貌，实现金融科技突破对于推动金融领域的创新和发展至关重要。而整体思维和系统认知是实现金融科技突破的首要前提，金融系统是一个开放复杂巨系统，已经很难依靠“点”上的技术突破实现整体提升。所以需要将跨学科的研究和系统方法作为解决重大关键问题的首选项。

系统认知就是要从系统要素构成、互作机理和耦合作用来探索问题的解决途径。金融与实体经济是一个生命共同体，金融领域的科学突破必须突破单要素思维，从资源利用、运作效力、系统弹性和可持续性的整体维度进行思考。

数据科学和信息技术是金融领域的战略性关键技术，数据科学和分析科技的进步为金融领域的研究和知识应用提供了重要的突破机遇。大数据、人工智能、机器学习等技术的发展提供了更快速的收集、分析、存储、共享和集成异构数据的能力和高级分析方法。数据科学和信息技术能够极大提高对复杂问题的解决能力，在动态变化条件下，自动整合数据并进行实时建模，促进形成数据驱动的智慧管控。

人机混合智能技术将成为推动金融领域进步的创新驱动技术。人机混合智能技术包括自然语言处理、机器学习、计算机视觉、语音识别和智能推荐等多个领域。这些技术的发展使得人和机器间的交互变得更加智能化，人机混合智能在金融领域的应用也越来越多，最新的大模型技术，如ChatGPT、MOSS、ChatGLM等，是和目前的金融垂直领域结合的热点。

金融数据底座的构建可以包括各类金融实时数据，各类需解析的文档数据、各类非结构化数据以及信息高度浓缩文本。通过庞大的金融垂直类数据为金融大模型提供数据支撑。

对于金融垂直领域大模型的构造需要解决的关键问题有如下三点。

一是多源、异构金融数据金融数字底座构建、金融数据安全共享使用。

二是金融数据底座与大模型的融合技术，解决通用大模型在垂直领域知识匮乏、知识关联问题，同时实现模型根据数据实时更新、不断迭代。

三是基于金融科技底座的大模型对于金融科技多领域的应用赋能，展现金融垂直领域涌现能力。

然而目前大模型在金融垂直领域仍未挖掘出涌现效应，一方面是由于金融数据及知识的私密性导致难以共享，无法构建一个庞大的数据集，对此可以增强产学研的联动性，共同构建更强的金融垂直领域基座模型。另一方面由于金融数据模态更多，难以进行统一的处理建模，而如今的大模型对此种多模态的表达能力仍有待加强。

二、关于知识图谱与大模型的融合：知识驱动与数据驱动的交互

在过去的研究中，我们构建金融知识图谱系统，其过程多为从研报、财报等各类非结构化文本信息中抽取多源异构知识，通过实体对齐、实体消歧等知识融合方法完善庞大复杂的金融知识图谱，并通过分布式图数据库存储图数据，便于后续分布式图算法的开发与应用，这些已构建的金融知识图谱在大模型时代仍有其不可替代的应用。

知识图谱是过去对显示知识的一种符号化表达，大模型是对隐性知识的新兴表达。在大模型时代，也不能完全摒弃已构建的海量知识图谱，知识图谱能够指导大模型对行业进行正确精准的认知，提高其理解、推理决策的能力。知识图谱及专家知识库解决问题的范式需要与基于与统计学习的大模型范式相融合，才能更好推动领域内涌现能力的出现。我们需要把以知识图谱为代表的知识驱动方法，基于利用静态以及动态的知识图谱，与以大模型为代表的数据驱动方法进行持续交互，运用多种模式，以达到知识图谱与大模型的完美结合。以人机结合方式解决现实中的复杂问题，在认知的过程中，通过人机协同挖掘一些很难由人类或计算机单独发现的新知识。

三、关于金融大模型的监管：从安全角度解决大模型的部署问题

金融数据和垂直领域大模型密切相关，存在数据安全、大模型安全可信和技术伦理等问题，同时金融领域也涉及敏感信息和决策，因此对于金融大模型的监管必不可少。

一是建立监管框架与标准，确保大模型在金融领域的应用符合法规与道德要求，通过政产学研的合作制定相关的政策和指南。

二是对于金融大模型的部署与使用，需要协同共治，提升透明度，保证数据质量和可解释性的机制。这可以帮助用户与监管机构理解模型的决策依据，并确保其不带有偏见或歧视性。

三是监管机构还应加强对于金融大模型的审查和风险评估，对于关键人物和系统，应建立审查和测试的机制以确保其安全性。

具体来讲可分为数据安全与版权安全两个方面。

首先是数据安全问题。大模型的复杂性和规模增加了攻击者进行攻击的可能性。同时，大模型的训练过程涉及更多的数据和计算资源，这也给无恶意攻击者提供了更多的机会来入侵和篡改数据模型。目前大模型极易因通过对抗攻击、后门攻击、模型窃取等手段而遭受威胁，需要寻找有效的方法规避风险。大模型在辅助金融场景知识问答的过程中，由于无法对用户身份进行识别，容易产生高等级或机密信息泄露等风险，需要对大模型训练过程中的数据安全等级做严格的界定。

其次是版权安全问题。在金融垂直领域大模型开源的情况下，被恶意窃取并进行微调的现象时有发生，可利用特定的数据进行输入，模型识别到这一特定的输入，就会给出不同于正常类的输出，通过这一行为来判断模型的归属问题。

站在新的历史起点上，在新的历史方位和发展格局中，希望学界与业界共同努力，针对金融科技发展的科学问题，聚焦国家重点关键性、基础性、牵引性战略需求任务，发挥产学研协同优势，攻关金融为实体经济服务的关键技术，为做好中央金融工作会议提到的“五篇大文章”贡献力量。

序言二

生成式AI让金融服务更有温度

高峰中国银行业协会首席信息官

当前，以ChatGPT为代表的人工智能大模型引领新一轮技术发展浪潮，生成式AI大模型热度持续走高，受到业界广泛关注。银行业作为最早应用传统人工智能技术的领域之一，生成式AI大模型的应用对其产业形态具有显著影响力。银行业贯彻落实中央金融工作会议精神，坚定不移走中国特色金融发展之路，扎实推动金融高质量发展，加快建设金融强国，需要把握生成式AI大模型发展机遇，加快AI大模型在业务中的广泛应用，做好“五篇大文章”，为经济社会发展提供高质量服务。在大模型助力下，金融机构将不断提升全业务、全流程、全场景的智能化水平，赋能数字化转型。通过大模型全面提升金融服务质效，推动数据与实体的融合，改变行业发展格局。《生成式AI大模型：赋能金融业变革》的出版恰逢其时，我将围绕“生成式AI让金融服务更有温度”谈几点看法，供读者参考、指正。

大模型将给银行业带来深远影响。一些银行业金融机构坚定地加入了这场浪潮之中，农业银行推出ChatABC，工商银行发布了基于昇腾AI的金融行业通用模型，中国银行、交通银行、邮储银行、招商银行、中信银行、兴业银行、华夏银行、浙商银行、江苏银行等多家银行都在探索大模型应用。一些银行业金融机构已从战略层面开始重视大模型，但受制于算力资源紧缺、算力成本高昂等因素，很多金融机构开始从单纯希望自己建算力、建模型，转变为探索应用层面多方合作。银行业金融机构更关心业界用大模型做了什么，实现了怎样的效果。具体到不同规模的银行，也走出了不同路径。大型银行具有海量金融数据和应用场景，可引入业界领先的基础大模型，自建企业大模型，形成专业领域的任务大模型，快速赋能业务。值得一提的是，针对大模型落地过程中遇到的各种难点，各家银行都在努力探索解决方案。

对大模型应用在银行业落地应持审慎态度。大模型应用需要具备“三个条件”，即技术成熟度、政策支持、应用场景。2022年元宇宙技术也曾众星捧月，但最终并没有在金融业“落地生根”，归根结底还是因为技术与业务没能深度融合，没能实际改善金融业的服务效率。对金融机构来说，合规是第一要务。国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局公布《生成式人工智能服务管理暂行办法》，自2023年8月15日起施行，目的就是促进生成式人工智能健康发展和规范应用，维护国家安全和社会公共利益，保护公民、法人和其他组织的合法权益。没有应用场景，新技术就是“无根之木”。当前，大模型技术并不成熟，而金融行业是一个强监管、高安全的行业。目前金融大模型已经应用在内部职能运营方面，如金融资讯、产品介绍等内容的文本自动生成，提升了内容运营效率；以助手形式、人机协同来提升业务人员工作质效，构建虚拟客服在线交互等，给用户提供更人性化的服务。而像投研、投顾等场景，价值很大，但很难快速产生效果，对数据的要求也高。总体而言，内部员工训练模型目前使用比较广泛，而对外、对客的使用还不是很多。

银行业大模型存在数据安全问题和隐私泄露风险。大模型的训练和应用涉及大量身份信息、金融资产、交易记录、信用历史等个人敏感数据，导致存在合规风险。随着大模型应用场景增多，需要打通的银行各业务部门数据范围越来越广。然而当前各业务部门的数据采集使用标准不统一，数据治理与规范整理过程将成为新挑战。行业亟须制定数据治理操作标准与数据规范整理操作指引，建立数据治理与评估体系，实现全域化数据治理。

此外，生成式AI大模型赋能金融业还存在其他一些问题。大模型对算力要求提升，硬件设施未来亟须完善。大模型的高成本、高能耗与绿色AI发展理念不符，如何平衡大模型训练需求与碳排量至关重要。国产芯片设计和制造方面虽取得了显著进步，但与国际顶级厂商相比，仍存在一定的技术差距。我国大模型涌现，但均从Transformer等基础模型衍生，在底层网络及框架方面的研究布局较少，大模型底层技术、基础架构由国外头部企业掌握，存在“卡脖子”隐患。大模型应用于银行业需克服幻觉问题、基准测试对标难问题等。

大模型和人工智能对元宇宙的兴起提供了很好的机会。元宇宙在2022年就已经比较火爆，2023年大模型又对元宇宙起到了“空中加油”的作用。国内外金融元宇宙的应用重点在虚拟营业厅、数字员工。目前，已有工商银行、建设银行、交通银行等11家客服中心与远程银行实现了虚拟数字人应用落地。在应用场景方面，虚拟数字人广泛应用于对客服务、风险控制、新媒体运营、内部赋能等四大领域，并全面提升远程银行智能化水平与客户体验。大模型将赋能虚拟数字人“智能进化”。AIGC大模型在语义理解和内容生成方面有着卓越表现，虚拟数字人或成为AIGC在远程银行的最佳着陆点。在AIGC大模型的加持下，虚拟数字人将被广泛应用于前台员工辅助、中台运营赋能、后台管理支持等各环节，推动金融场景内容生产加速发展。虚拟数字人助推远程银行转型升级，其作为人机交互新入口，未来将助推远程银行沉浸式交互体验更加拟人、降本增效更加显著、数字化转型质效持续提升。

总而言之，AIGC对金融业的影响主要在于减少人力成本、丰富并优化有温度的金融服务。具体来说，在远程银行、投研、运营、营销、风控、数字员工等方面，AIGC都有一些很好的应用案例。但同时也面临一些挑战，主要包括芯片设计制造、成本控制、数据安全以及法律法规制定等等。应对这些挑战，我从四个方面提出发展建议与举措。第一，监管方面，应形成一套完备的人工智能监管体系，制定针对不同业态的法规，对生成式人工智能进行监管。第二，法律法规方面，应加强数据隐私保护，提高透明度和可解释性；加强伦理和道德约束，制定伦理准则和行业标准。第三，人才方面，应加强产学研结合，通过与企业合作开展实践项目，加强国际合作和人才引进。第四，生态方面，应针对性开放数据并共享数据，支持开放研究合作。