本技术涉及数据处理,特别是一种审核保函文本的方法、系统、设备及介质。
背景技术:
1、保函是一种由具备特定资质的主体为公司或个人用户进行开具的用于信用担保的凭证,具有作用特定、数量庞大、使用频率高等特点。但是现有技术对保函文本的审核效率较低。因此,如何提高保函文本的审核效率,成为当前所需解决的技术问题。
技术实现思路
1、鉴于上述问题,本发明的目的在于提供一种审核保函文本的方法、系统、设备及介质,以提高保函文本的审核效率,具体方案如下:
2、第一方面,本技术实施例公开了一种审核保函文本的方法,所述方法包括:
3、获取待审核保函文本和保函文本库;所述保函文本库中包含多个目标保函文本;所述目标保函文本为已通过审核的保函文本;
4、根据所述待审核保函文本的内容信息,确定所述待审核保函文本的分类标签;
5、根据所述待审核保函文本的分类标签和所述保函文本库,确定标签匹配保函文本集;所述标签匹配保函文本集中包括至少一个标签匹配保函文本;所述标签匹配保函文本为,所述保函文本库中与所述待审核保函文本具有相同分类标签的目标保函文本;
6、根据所述标签匹配保函文本集中各个标签匹配保函文本的内容信息和所述待审核保函文本的内容信息,确定各个待匹配相似度;所述待匹配相似度为所述标签匹配保函文本与所述待审核保函文本的相似度;所述待匹配相似度的数量与所述标签匹配保函文本的数量相同;
7、将所述各个待匹配相似度与所述预设相似度进行比对;若所述各个待匹配相似度中的任意一个待匹配相似度大于所述预设相似度,则所述待审核保函文本通过审核。
8、可选的,所述获取待审核保函文本和保函文本库,包括:
9、获取待处理业务信息;所述待处理业务信息包括所述待审核保函文本,以及所述待审核保函文本的开立结构信息;
10、根据所述待审核保函文本的开立机构信息,从各个预设保函文本库中选择与所述待审核保函文本具有相同开立机构信息的预设保函文本库,作为所述保函文本库。
11、可选的,所述根据所述标签匹配保函文本集中各个标签匹配保函文本的内容信息和所述待审核保函文本的内容信息,确定各个待匹配相似度,包括:
12、对所述待审核保函文本的内容信息进行分词,得到第一分词集合;
13、对所述各个标签匹配保函文本的内容信息进行分词,得到多个第二分词集合;所述第二分词集合为所述标签匹配保函文本的内容信息中所包含分词的集合;
14、将所述第一分词集合和所述多个第二分词集合进行合并,得到比对分词集合;
15、根据所述第一分词集合和所述比对分词集合,确定第一词频;所述第一词频为所述第一分词集合中的各个分词在所述比对分词集合中的词频;
16、根据所述多个第二分词集合和所述比对分词集合,确定多个第二词频;所述第二词频为所述第二分词集合中的各个分词在所述比对分词集合中的词频;
17、根据所述第一词频和所述多个第二词频,确定所述各个待匹配相似度。
18、可选的,所述根据所述第一词频和所述多个第二词频,确定所述各个待匹配相似度,包括:
19、对所述第一词频进行向量化,得到第一分词向量集合;
20、分别对所述多个第二词频进行向量化,得到多个第二分词向量集合;
21、根据所述第一分词向量集合和所述多个第二分词向量集合,确定所述各个待匹配相似度。
22、可选的,在所述待审核保函文本通过审核之后,所述方法还包括:
23、将所述待匹配相似度大于所述预设相似度的标签匹配保函文本,在显示界面中展示。
24、第二方面,本技术实施例公开了一种审核保函文本的系统,所述系统包括:
25、获取模块,用于获取待审核保函文本和保函文本库;所述保函文本库中包含多个目标保函文本;所述目标保函文本为已通过审核的保函文本;
26、确定模块,用于根据所述待审核保函文本的内容信息,确定所述待审核保函文本的分类标签;
27、所述确定模块,还用于根据所述待审核保函文本的分类标签和所述保函文本库,确定标签匹配保函文本集;所述标签匹配保函文本集中包括至少一个标签匹配保函文本;所述标签匹配保函文本为,所述保函文本库中与所述待审核保函文本具有相同分类标签的目标保函文本;
28、所述确定模块,还用于根据所述标签匹配保函文本集中各个标签匹配保函文本的内容信息和所述待审核保函文本的内容信息,确定各个待匹配相似度;所述待匹配相似度为所述标签匹配保函文本与所述待审核保函文本的相似度;所述待匹配相似度的数量与所述标签匹配保函文本的数量相同;
29、比对模块,用于将所述各个待匹配相似度与所述预设相似度进行比对;若所述各个待匹配相似度中的任意一个待匹配相似度大于所述预设相似度,则所述待审核保函文本通过审核。
30、可选的,所述获取模块,具体用于:
31、获取待处理业务信息;所述待处理业务信息包括所述待审核保函文本,以及所述待审核保函文本的开立结构信息;
32、根据所述待审核保函文本的开立机构信息,从各个预设保函文本库中选择与所述待审核保函文本具有相同开立机构信息的预设保函文本库,作为所述保函文本库。
33、可选的,所述确定模块,包括:
34、分词单元,用于对所述待审核保函文本的内容信息进行分词,得到第一分词集合;
35、所述分词单元,还用于对所述各个标签匹配保函文本的内容信息进行分词,得到多个第二分词集合;所述第二分词集合为所述标签匹配保函文本的内容信息中所包含分词的集合;
36、合并单元,用于将所述第一分词集合和所述多个第二分词集合进行合并,得到比对分词集合;
37、确定单元,用于根据所述第一分词集合和所述比对分词集合,确定第一词频;所述第一词频为所述第一分词集合中的各个分词在所述比对分词集合中的词频;
38、所述确定单元,还用于根据所述多个第二分词集合和所述比对分词集合,确定多个第二词频;所述第二词频为所述第二分词集合中的各个分词在所述比对分词集合中的词频;
39、所述确定单元,还用于根据所述第一词频和所述多个第二词频,确定所述各个待匹配相似度。第三方面,本技术实施例公开了一种终端设备,所述设备包括处理器以及存储器:所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;所述处理器用于根据所述程序代码中的指令执行上述任意一种审核保函文本的方法。
40、第四方面,本技术实施例公开了一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现上述任意一种审核保函文本的方法。
41、相对于现有技术,本技术具有以下有益效果:
42、通过获取待审核保函文本和保函文本库,根据待审核保函文本的内容信息,确定待审核保函文本的分类标签。根据待审核保函文本的分类标签和保函文本库,确定标签匹配保函文本集。根据标签匹配保函文本集中各个标签匹配保函文本的内容信息和待审核保函文本的内容信息,确定各个待匹配相似度,将各个待匹配相似度与预设相似度进行比对,若各个待匹配相似度中的任意一个待匹配相似度大于预设相似度,则待审核保函文本通过审核。由于目标保函文本为已通过审核的保函文本,所以当保函文本库中存在与待审核保函文本具有相同标签,且内容信息与待审核保函文本的内容信息相似度较高的目标保函文本时,该待审核保函文本同样为能够通过审核的保函文本,无需再对该待审核保函文本进行审核。从而通过将待审核保函文本与保函文本库中的目标保函文本的标签和相似度进行比较,快速确定出待审核保函文本是否能够直接通过审核,以提高审核效率。