一种基于大模型的金融指标精准问答方法与流程

文档序号：37263938发布日期：2024-03-12 20:45阅读：13来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本申请涉及大模型，具体为一种基于大模型的金融指标精准问答方法。

背景技术：

1、大模型：大规模语言模型，比如chatgpt、chatglm等；

2、大模型幻觉：hallucination，当模型生成的文本不遵循原文或者不符合事实时，可以认为模型出现了幻觉问题，通常描述为“一本正经胡说八道”；

3、prompt：提示词，用于让大模型按照提示词的要求进行文本的提取和生成；

4、chatglm2：当前最优秀的中文开源大模型；

5、turbo大模型：openai公司开放的gpt大模型编号；

6、langchain：一种基于大模型和向量检索的知识库检索方式，通常用于缓解大模型的幻觉问题；

7、sql是用于访问和处理数据库的标准的计算机语言；

8、对于金融领域的公司来说，每年的年报分析会涉及很多和金融相关的指标，比如拨备覆盖率、不良率、利润增速、息差收窄、归母净利润等，通常需要专业人士才能从报告中通过阅读理解到企业在各个指标上的表现，但占大多数的非专业人士就没办法获得自己想得到的信息，存在很大的信息差，在大模型的技术出现后，有很多金融公司对这个问题进行了尝试的解决，包括训练垂直领域的金融大模型去提高效果，但得到的指标数据都不能保证正确率，虽然基于langchain的向量搜索和垂直的金融大模型都可以有效改善这种情况，但还是不能保证100％准确，这些已有的方法对于金融行业这种对准确率要求极高的场景是无法落地应用的。

技术实现思路

1、本申请的目的在于提供一种基于大模型的金融指标精准问答方法，以解决上述背景技术中提出的问题。

2、为实现上述目的，本申请提供如下技术方案：一种基于大模型的金融指标精准问答方法，包括以下步骤：

3、步骤1、指标提取，基于大量历史用户提出的问题数据，通过编写prompt“请帮我从这个问题中提取专业的金融行业指标”，让大模型从单个问题中提取年报中所涉及到的金融行业指标；

4、步骤2、数据提取，基于步骤1中提取到的金融行业指标采用大模型对年报数据进行分词，将对应的指标和指标数值提取出来，并存储到指标数据库中，并使用一个字段关联表，记录指标和指标在数据库字段的关联关系；同时也将计算具体指标的公式也存储到数据库中；

5、步骤3、查询指标，当用户提出要分析的问题时，由大模型对这个问题进行分词，找到用户想查询的金融指标，再在步骤2中的字段关联表中找到指标和指标字段的关联关系，把这些相关内容一并交给大模型，生成对应的数据库查询语句，找到和这个问题相关的指标和公式；

6、步骤4、指标结果融合，将步骤3中查询数据库返回的指标和公式，交给chatglm2大模型进行计算和融合，基于大模型逻辑推理能力综合回答用户的问题。

7、优选的，所述步骤1中的数据源包括多种语言。

8、优选的，所述步骤1中的大模型采用了chatglm2作为底座大模型。

9、优选的，所述步骤3采用了turbo作为生成sql的底座大模型。

10、优选的，所述步骤4中chatglm2大模型在计算时首先输出每个指标的具体数值，其次要基于这些指标和公式输出计算后的指标值，最后把这些指标值和计算过程交给大模型。

11、与现有技术相比，本申请的有益效果是：

12、本发明通过把问答场景间接转换成数据库检索的方式，通过大模型提前处理并提取年报数据中的指标数据，在回答用户问题时返回数据库中真实的指标数值，让大模型回答数据库中真实的指标数值，避免大模型在数值上的“幻觉”问题导致大模型回答虚假指标数据，从而保证回答的准确性。

技术特征：

1.一种基于大模型的金融指标精准问答方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于大模型的金融指标精准问答方法，其特征在于：所述步骤1中的数据源包括多种语言。

3.根据权利要求1所述的一种基于大模型的金融指标精准问答方法，其特征在于：所述步骤1中的大模型采用了chatglm2作为底座大模型。

4.根据权利要求1所述的一种基于大模型的金融指标精准问答方法，其特征在于：所述步骤3采用了turbo作为生成sql的底座大模型。

5.根据权利要求1所述的一种基于大模型的金融指标精准问答方法，其特征在于：所述步骤4中chatglm2大模型在计算时首先输出每个指标的具体数值，其次要基于这些指标和公式输出计算后的指标值，最后把这些指标值和计算过程交给大模型。

技术总结
本申请公开的属于大模型技术领域，具体为基于大模型的金融指标精准问答方法，包括指标提取、数据提取、查询指标、指标结果融合多个步骤，本发明通过把问答场景间接转换成数据库检索的方式，通过大模型提前处理并提取年报数据中的指标数据，在回答用户问题时返回数据库中真实的指标数值，让大模型回答数据库中真实的指标数值，避免大模型在数值上的“幻觉”问题导致大模型回答虚假指标数据，从而保证回答的准确性。

技术研发人员：李翔,汪凡
受保护的技术使用者：珠海市卓轩科技有限公司
技术研发日：
技术公布日：2024/3/11

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李翔,汪凡
技术所有人：珠海市卓轩科技有限公司
我是此专利的发明人

上一篇：一种实现跨平台分发文件的方法与流程
上一篇：显示面板的制作方法、显示面板以及显示装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。