合同的处理方法、装置、存储介质及电子设备与流程

文档序号:36085707发布日期:2023-11-18 02:58阅读:30来源:国知局
合同的处理方法与流程

本技术涉及大数据、金融科技领域或者其他,具体而言,涉及一种合同的处理方法、装置、存储介质及电子设备。


背景技术:

1、金融机构在日常业务的办理过程中会产生大量的纸质合同,但目前金融机构对产生的合同文件的处理操作仅限于签约合同文件、扫描合同文件,以及将合同文件电子化存储在金融机构中,没有对合同的内容采取有效的利用。因此,目前现有技术中存在难以定位与预设合同内容相关的合同文件、难以对大量合同文件进行多维度的统计汇总操作、难以根据合同的某个问题定位到存在该问题的合同文件、以及由于业务需求较多和合同文件的种类繁多引起的合同起草学习成本高等问题,进而导致金融机构中业务人员处理合同相关的工作的效率较低。

2、针对相关技术中金融机构处理合同数据时,需要通过业务人员手动执行重复和繁琐的操作,导致合同数据的处理效率较低的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本技术的主要目的在于提供一种合同的处理方法、装置、存储介质及电子设备,以解决相关技术中金融机构处理合同数据时,需要通过业务人员手动执行重复和繁琐的操作,导致合同数据的处理效率较低的问题。

2、为了实现上述目的,根据本技术的一个方面,提供了一种合同的处理方法,该方法包括:在接收到目标对象的合同处理指令的情况下,获取所述目标对象在金融机构中的层级信息,其中,所述合同处理指令至少包括以下类型之一:第一类型、第二类型,所述第一类型的合同处理指令是指生成合同的指令,所述第二类型的合同处理指令是指生成所述目标对象所提出目标问题的回复信息的指令;依据所述目标对象在所述金融机构中的层级信息确定所述目标对象允许访问的数据范围,得到目标数据范围;在所述合同处理指令属于所述第一类型的情况下,通过第一模型生成合同文件,得到目标合同文件,其中,所述第一模型是采用金融领域的相关知识和所述目标数据范围内的合同数据对初始模型进行训练后得到的模型;在所述合同处理指令属于所述第二类型的情况下,通过第二模型生成所述目标问题的回复信息,得到目标回复信息,其中,所述第二模型是采用金融领域的相关知识和所述目标数据范围内的问答数据对所述初始模型进行训练后得到的模型。

3、进一步地,在获取所述目标对象在金融机构中的层级信息之前,所述方法还包括:确定所述金融机构中每个机构人员所在机构的层级,得到每个机构人员的第一层级信息;确定所述金融机构中每个机构人员的工作职位,并依据每个机构人员的工作职位确定每个机构人员的职位层级,得到每个机构人员的第二层级信息;依据每个机构人员的第一层级信息和每个机构人员的第二层级信息确定每个机构人员在所述金融机构中的层级信息。

4、进一步地,在依据所述目标对象在所述金融机构中的层级信息确定所述目标对象允许访问的数据范围,得到目标数据范围之前,所述方法还包括:依据每个机构人员的目标层级信息确定所述金融机构中每个合同数据的访问权限标识,其中,所述每个合同数据的访问权限标识用于指示允许访问所述合同数据的所述目标层级信息;依据每个机构人员的目标层级信息和每个合同数据的访问权限标识确定所述金融机构中每个机构人员允许访问的数据范围。

5、进一步地,在通过第一模型生成合同文件,得到目标合同文件之前,所述方法还包括:采集所述目标数据范围内的合同数据,并将所述合同数据转化为文本信息,得到第一语料库;对所述第一语料库进行预处理操作,得到第二语料库,其中,所述预处理操作至少包括分词操作;对所述第二语料库中词语进行标注,得到带有标注信息的第二语料库,其中,所述标注信息用于指示所述第二语料库中每个词语的语义信息;采用预设语言表示模型对所述带有标注信息的第二语料库进行处理,得到第一词向量集合;采用所述第一词向量集合对所述初始模型进行训练,得到所述第一模型。

6、进一步地,采集所述目标数据范围内的合同数据,并将所述合同数据转化为文本信息,得到第一语料库包括:通过预设渠道获取金融领域的相关知识的文本信息,得到第一文本信息;采用文字识别技术将所述金融机构中所述目标数据范围内的合同数据转化为文本信息,得到第二文本信息;由所述第一文本信息和所述第二文本信息组合得到第一语料库。

7、进一步地,在通过第二模型生成所述目标问题的回复信息,得到目标回复信息之前,所述方法还包括:在所述目标数据范围内,依据所述金融机构的业务需求获取与所述合同数据相关的问题,以及所述问题对应的答案,得到第三文本信息;由所述第一文本信息和所述第三文本信息组合得到第三语料库;对所述第三语料库中词语进行标注,并采用预设分隔符对所述第三语料库中文本信息进行分隔,得到第四语料库;采用所述预设语言表示模型对所述第四语料库进行处理,得到第二词向量集合;采用所述第二词向量集合对所述初始模型进行训练,得到所述第二模型。

8、进一步地,对所述第一语料库进行预处理操作,得到第二语料库包括:采用预设代码对所述第一语料库中的文本信息进行数据清洗,得到清洗后的第一语料库;采用正则化表达式去除所述清洗后的第一语料库中的标点符号,得到第五语料库;将所述第五语料库中的合同文本拆分为段落,并且为属于同一篇合同文本的段落建立索引,得到带有索引信息的第五语料库;采用预设分词工具对所述带有索引信息的第五语料库进行分词处理,得到所述第二语料库。

9、进一步地,对所述第二语料库中词语进行标注,得到带有标注信息的第二语料库包括:通过第一预设标注工具标注所述第二语料库中与合同文件的属性相关的词语,得到第六语料库;通过第二预设标注工具标注所述第六语料库中与客户的客户信息相关的词语,得到所述带有标注信息的第二语料库,其中,所述客户是指签订合同的客户。

10、进一步地,采用预设语言表示模型对所述带有标注信息的第二语料库进行处理,得到第一词向量集合包括:采用所述预设语言表示模型对所述带有标注信息的第二语料库中文本信息进行词向量预训练,得到第七语料库;采用第三预设标注工具对所述第七语料库中每个词语的词性进行标注,得到带有标注信息的第七语料库;过滤所述带有标注信息的第七语料库中的目标词语,得到第八语料库,其中,所述目标词语至少包括以下词语:停用词、语法助词、连接词;对所述第八语料库进行数据清洗操作,并按照所述索引信息对清洗后的第八语料库中每个词向量进行排序,得到所述第一词向量集合。

11、进一步地,对所述第三语料库中词语进行标注,并采用预设分隔符对所述第三语料库中文本信息进行分隔,得到第四语料库包括:对所述第三语料库进行预处理操作,得到预处理后的第三语料库;对所述预处理后的第三语料库中的词语进行标注,得到带有标注信息的第三语料库;确定所述带有标注信息的第三语料库中的每个问题以及每个问题对应的答案;采用所述预设分隔符对每个问题和每个问题对应的答案进行分隔,得到所述第四语料库。进一步地,采用所述第一词向量集合对所述初始模型进行训练,得到所述第一模型包括:依据所述第一词向量集合的标注信息配置提示信息,得到带有提示信息的第一词向量集合,其中,所述提示信息是指使得所述初始模型的模型准确率大于第一预设数值的词向量;采用所述带有提示信息的第一词向量集合对所述初始模型进行迭代训练,直到训练后模型的准确率大于第二预设数值,并将准确率大于第二预设数值的模型确定为第三模型;依据预设模型指标计算所述第三模型对应的模型指标数值,并且依据所述第三模型对应的模型指标数值对所述第三模型进行调整,得到第四模型,其中,所述预设模型指标至少包括以下指标模型准确率、模型精确度、f1分数、召回率:采用预设模型对所述第四模型进行前向反馈训练,得到第五模型;依据所述预设模型指标计算所述第五模型对应的模型指标数值,并且对所述第五模型的模型参数进行调整,直到调整后模型的损失值小于第三预设数值,将损失值小于第三预设数值的模型确定为所述第一模型。

12、进一步地,依据预设模型指标计算所述第三模型对应的模型指标数值,并且依据所述第三模型对应的模型指标数值对所述第三模型进行调整,得到第四模型包括:依据所述预设模型指标计算所述第三模型对应的模型指标数值,并且对所述第三模型的模型参数进行调整,直到调整后模型的损失值小于第四预设数值,将损失值小于第四预设数值的模型确定为第六模型:依据所述预设模型指标计算所述第六模型对应的模型指标数值,并且确定所述第六模型对应的模型指标数值中小于第五预设数值的模型指标数值,得到目标指标数值;确定所述目标指标数值对应的训练任务,并且生成所述训练任务的目标训练结果;采用所述训练任务以及所述目标训练结果对所述第六模型的模型参数进行调整,得到所述第四模型。

13、为了实现上述目的,根据本技术的另一方面,提供了一种合同的处理装置,该装置包括:第一获取单元,用于在接收到目标对象的合同处理指令的情况下,获取所述目标对象在金融机构中的层级信息,其中,所述合同处理指令至少包括以下类型之一:第一类型、第二类型,所述第一类型的合同处理指令是指生成合同的指令,所述第二类型的合同处理指令是指生成所述目标对象所提出目标问题的回复信息的指令;确定单元,用于依据所述目标对象在所述金融机构中的层级信息确定所述目标对象允许访问的数据范围,得到目标数据范围;第一生成单元,用于在所述合同处理指令属于所述第一类型的情况下,通过第一模型生成合同文件,得到目标合同文件,其中,所述第一模型是采用金融领域的相关知识和所述目标数据范围内的合同数据对初始模型进行训练后得到的模型;第二生成单元,用于在所述合同处理指令属于所述第二类型的情况下,通过第二模型生成所述目标问题的回复信息,得到目标回复信息,其中,所述第二模型是采用金融领域的相关知识和所述目标数据范围内的问答数据对所述初始模型进行训练后得到的模型。

14、进一步地,所述第一获取单元包括:第一确定子单元,用于在获取所述目标对象在金融机构中的层级信息之前,确定所述金融机构中每个机构人员所在机构的层级,得到每个机构人员的第一层级信息;第二确定子单元,用于确定所述金融机构中每个机构人员的工作职位,并依据每个机构人员的工作职位确定每个机构人员的职位层级,得到每个机构人员的第二层级信息;第三确定子单元,用于依据每个机构人员的第一层级信息和每个机构人员的第二层级信息确定每个机构人员在所述金融机构中的层级信息。

15、进一步地,所述确定单元包括:第四确定子单元,用于在依据所述目标对象在所述金融机构中的层级信息确定所述目标对象允许访问的数据范围,得到目标数据范围之前,依据每个机构人员的目标层级信息确定所述金融机构中每个合同数据的访问权限标识,其中,所述每个合同数据的访问权限标识用于指示允许访问所述合同数据的所述目标层级信息;第五确定子单元,用于依据每个机构人员的目标层级信息和每个合同数据的访问权限标识确定所述金融机构中每个机构人员允许访问的数据范围。

16、进一步地,所述装置还包括:采集单元,用于在通过第一模型生成合同文件,得到目标合同文件之前,采集所述目标数据范围内的合同数据,并将所述合同数据转化为文本信息,得到第一语料库;第一处理单元,用于对所述第一语料库进行预处理操作,得到第二语料库,其中,所述预处理操作至少包括分词操作;第一标注单元,用于对所述第二语料库中词语进行标注,得到带有标注信息的第二语料库,其中,所述标注信息用于指示所述第二语料库中每个词语的语义信息;第二处理单元,用于采用预设语言表示模型对所述带有标注信息的第二语料库进行处理,得到第一词向量集合;第一训练单元,用于采用所述第一词向量集合对所述初始模型进行训练,得到所述第一模型。

17、进一步地,所述采集单元包括:获取子单元,用于通过预设渠道获取金融领域的相关知识的文本信息,得到第一文本信息;第一处理子单元,用于采用文字识别技术将所述金融机构中所述目标数据范围内的合同数据转化为文本信息,得到第二文本信息;组合子单元,用于由所述第一文本信息和所述第二文本信息组合得到第一语料库。

18、进一步地,所述装置还包括:第二获取单元,用于在通过第二模型生成所述目标问题的回复信息,得到目标回复信息之前,在所述目标数据范围内,依据所述金融机构的业务需求获取与所述合同数据相关的问题,以及所述问题对应的答案,得到第三文本信息;组合单元,用于由所述第一文本信息和所述第三文本信息组合得到第三语料库;第二标注单元,用于对所述第三语料库中词语进行标注,并采用预设分隔符对所述第三语料库中文本信息进行分隔,得到第四语料库;第三处理单元,用于采用所述预设语言表示模型对所述第四语料库进行处理,得到第二词向量集合;第二训练单元,用于采用所述第二词向量集合对所述初始模型进行训练,得到所述第二模型。

19、进一步地,所述第一处理单元包括:第一清洗子单元,用于采用预设代码对所述第一语料库中的文本信息进行数据清洗,得到清洗后的第一语料库;第二处理子单元,用于采用正则化表达式去除所述清洗后的第一语料库中的标点符号,得到第五语料库;拆分子单元,用于将所述第五语料库中的合同文本拆分为段落,并且为属于同一篇合同文本的段落建立索引,得到带有索引信息的第五语料库;第三处理子单元,用于采用预设分词工具对所述带有索引信息的第五语料库进行分词处理,得到所述第二语料库。

20、进一步地,所述第一标注单元包括:第一标注子单元,用于通过第一预设标注工具标注所述第二语料库中与合同文件的属性相关的词语,得到第六语料库;第二标注子单元,用于通过第二预设标注工具标注所述第六语料库中与客户的客户信息相关的词语,得到所述带有标注信息的第二语料库,其中,所述客户是指签订合同的客户。

21、进一步地,所述第二处理单元包括:第一训练子单元,用于采用所述预设语言表示模型对所述带有标注信息的第二语料库中文本信息进行词向量预训练,得到第七语料库;第三标注子单元,用于采用第三预设标注工具对所述第七语料库中每个词语的词性进行标注,得到带有标注信息的第七语料库;过滤子单元,用于过滤所述带有标注信息的第七语料库中的目标词语,得到第八语料库,其中,所述目标词语至少包括以下词语:停用词、语法助词、连接词;第二清洗子单元,用于对所述第八语料库进行数据清洗操作,并按照所述索引信息对清洗后的第八语料库中每个词向量进行排序,得到所述第一词向量集合。

22、进一步地,所述第二标注单元包括:第四处理子单元,用于对所述第三语料库进行预处理操作,得到预处理后的第三语料库;第四标注子单元,用于对所述预处理后的第三语料库中的词语进行标注,得到带有标注信息的第三语料库;第六确定子单元,用于确定所述带有标注信息的第三语料库中的每个问题以及每个问题对应的答案;分隔子单元,用于采用所述预设分隔符对每个问题和每个问题对应的答案进行分隔,得到所述第四语料库。

23、进一步地,所述第一训练单元包括:配置子单元,用于依据所述第一词向量集合的标注信息配置提示信息,得到带有提示信息的第一词向量集合,其中,所述提示信息是指使得所述初始模型的模型准确率大于第一预设数值的词向量;第二训练子单元,用于采用所述带有提示信息的第一词向量集合对所述初始模型进行迭代训练,直到训练后模型的准确率大于第二预设数值,并将准确率大于第二预设数值的模型确定为第三模型;第一调整子单元,用于依据预设模型指标计算所述第三模型对应的模型指标数值,并且依据所述第三模型对应的模型指标数值对所述第三模型进行调整,得到第四模型,其中,所述预设模型指标至少包括以下指标模型准确率、模型精确度、f1分数、召回率:第三训练子单元,用于采用预设模型对所述第四模型进行前向反馈训练,得到第五模型;第二调整子单元,用于依据所述预设模型指标计算所述第五模型对应的模型指标数值,并且对所述第五模型的模型参数进行调整,直到调整后模型的损失值小于第三预设数值,将损失值小于第三预设数值的模型确定为所述第一模型。

24、进一步地,所述第一调整子单元包括:计算模块,用于依据所述预设模型指标计算所述第三模型对应的模型指标数值,并且对所述第三模型的模型参数进行调整,直到调整后模型的损失值小于第四预设数值,将损失值小于第四预设数值的模型确定为第六模型:第一确定模块,用于依据所述预设模型指标计算所述第六模型对应的模型指标数值,并且确定所述第六模型对应的模型指标数值中小于第五预设数值的模型指标数值,得到目标指标数值;第二确定模块,用于确定所述目标指标数值对应的训练任务,并且生成所述训练任务的目标训练结果;调整模块,用于采用所述训练任务以及所述目标训练结果对所述第六模型的模型参数进行调整,得到所述第四模型。

25、为了实现上述目的,根据本技术的一个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述任意一项所述合同的处理方法。

26、为了实现上述目的,根据本技术的一个方面,提供了一种电子设备,包括一个或多个处理器和存储器,存储器用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现上述任意一项所述合同的处理方法。

27、通过本技术,采用以下步骤:在接收到目标对象的合同处理指令的情况下,获取所述目标对象在金融机构中的层级信息,其中,所述合同处理指令至少包括以下类型之一:第一类型、第二类型,所述第一类型的合同处理指令是指生成合同的指令,所述第二类型的合同处理指令是指生成所述目标对象所提出目标问题的回复信息的指令;依据所述目标对象在所述金融机构中的层级信息确定所述目标对象允许访问的数据范围,得到目标数据范围;在所述合同处理指令属于所述第一类型的情况下,通过第一模型生成合同文件,得到目标合同文件,其中,所述第一模型是采用金融领域的相关知识和所述目标数据范围内的合同数据对初始模型进行训练后得到的模型;在所述合同处理指令属于所述第二类型的情况下,通过第二模型生成所述目标问题的回复信息,得到目标回复信息,其中,所述第二模型是采用金融领域的相关知识和所述目标数据范围内的问答数据对所述初始模型进行训练后得到的模型,解决了相关技术中金融机构处理合同数据时,需要通过业务人员手动执行重复和繁琐的操作,导致合同数据的处理效率较低的问题。通过确定目标对象的层级信息,能够限制允许业务人员访问的合同数据,有利于保护金融机构内的合同数据,提高了金融机构的数据安全性,并且通过第一模型能够自动起草合同文件,通过第二模型能够生成与合同相关问题对应的答案,从而能够辅助业务人员完成与合同相关的工作,同时提高了合同处理指令的处理结果的准确性,达到了提高合同的处理效率的效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1