本发明涉及数据管理,尤其涉及一种文档的审核方法、装置、电子设备及存储介质。
背景技术:
1、安装手册和维护手册等手册类文档是指对产品的安装和维护进行说明的文档。由于在日常业务中,批次任务多、涉及的产品较广,各个任务的手册类文档的编写人员不尽相同,导致手册类文档的质量参差不齐;为了确保手册类文档符合质量审计的要求,需要在手册类文档发布之前进行审核以及评审流程验证操作。
2、目前主要通过工作人员逐一对手册类文档进行审核,由于手册类文档中的内容往往比较多,因此审核过程比较繁琐,容易出现由于人为疏忽导致失误的问题,且人工审核所需要的时间成本也较高,导致审核效率低下。
技术实现思路
1、有鉴于此,本发明实施例提供一种文档的审核方法、装置、电子设备及存储介质,以解决人工审核效率低的问题。
2、为实现上述目的,本发明实施例提供如下技术方案:
3、本发明实施例第一方面公开一种文档的审核方法,所述方法包括:
4、采集源数据,所述源数据包括手册类文档和手册类文档的评审流程数据;
5、基于检查规则库对所述源数据进行数据抽取,得到待检查关键词;所述检查规则库预先根据用户输入的检查表构建;
6、将所述待检查关键词输入检测模型中进行检测,得到所述待检查关键词的检测结果,所述检测模型预先根据预设样本数据训练神经网络模型得到;
7、若所述检测结果指示所述待检查关键词不符合规则要求,则基于所述待检查关键词生成审核报告,并将所述审核报告发送至所述用户。
8、优选的,所述基于检查规则库对所述源数据进行数据抽取,得到待检查关键词,包括:
9、根据预设语言处理方法和预设文字识别方法,将所述源数据进行分类,得到安装手册类文档、维护手册类文档和手册类文档的评审流程数据;
10、基于检查规则库中的检查要素,分别从所述安装手册类文档、所述维护手册类文档和所述手册类文档的评审流程数据中,抽取所述检查要素相应的待检查关键词。
11、优选的,根据用户输入的检查表构建检查规则库的过程,包括:
12、定时接收用户输入的检查表;
13、提取所述检查表中的文档类型和所述文档类型对应的检查要素;
14、根据所述文档类型和所述文档类型对应的检查要素,构建检查规则库。
15、优选的,根据预设样本数据训练神经网络模型得到所述检测模型的过程,包括:
16、获取样本数据,所述样本数据为关键词信息;
17、将所述样本数据拆分为训练集和测试集;
18、基于所述训练集,训练神经网络模型直至所述神经网络模型收敛,得到检测模型;
19、利用所述测试集测试所述检测模型的检测效果;
20、若所述检测效果满足预设条件,则确定得到最终的检测模型;
21、若所述检测效果不满足预设条件,则更新所述检测模型的参数,返回执行利用所述测试集测试所述检测模型的识别效果这一步骤。
22、优选的,所述若所述检测结果指示所述待检查关键词不符合规则要求,则基于所述待检查关键词生成审核报告,并将所述审核报告发送至所述用户,包括:
23、若所述检测结果指示所述待检查关键词不符合规则要求,则获取所述待检查关键词对应的目标源数据;
24、根据所述目标源数据和所述待检查关键词生成审核报告;
25、将所述审核报告发送至所述用户。
26、本发明实施例第二方面公开一种文档的审核装置,所述装置包括:
27、采集单元,用于采集源数据,所述源数据包括手册类文档和手册类文档的评审流程数据;
28、抽取单元,用于基于检查规则库对所述源数据进行数据抽取,得到待检查关键词;所述检查规则库预先根据用户输入的检查表构建;
29、检测单元,用于将所述待检查关键词输入检测模型中进行检测,得到所述待检查关键词的检测结果,所述检测模型预先根据预设样本数据训练神经网络模型得到;
30、生成单元,用于若所述检测结果指示所述待检查关键词不符合规则要求,则基于所述待检查关键词生成审核报告,并将所述审核报告发送至所述用户。
31、优选的,所述抽取单元,包括:
32、分类模块,用于根据预设语言处理方法和预设文字识别方法,将所述源数据进行分类,得到安装手册类文档、维护手册类文档和手册类文档的评审流程数据;
33、抽取模块,用于基于检查规则库中的检查要素,分别从所述安装手册类文档、所述维护手册类文档和所述手册类文档的评审流程数据中,抽取所述检查要素相应的待检查关键词。
34、优选的,还包括:
35、接收单元,用于定时接收用户输入的检查表;
36、提取单元,用于提取所述检查表中的文档类型和所述文档类型对应的检查要素;
37、构建单元,用于根据所述文档类型和所述文档类型对应的检查要素,构建检查规则库。
38、本发明实施例第三方面公开一种存储介质,用于存储计算机程序,所述计算机程序被执行时,具体用于实现本发明实施例第一方面公开的一种文档的审核方法。
39、本发明实施例第四方面公开一种电子设备,包括:存储器和处理器;
40、所述存储器用于存储计算机程序;
41、所述处理器用于执行所述计算机程序,具体用于实现本发明实施例第一方面公开的一种文档的审核方法。
42、基于上述本发明实施例提供的一种文档的审核方法、装置、电子设备及存储介质,该方法包括:采集源数据,源数据包括手册类文档和手册类文档的评审流程数据;基于检查规则库对源数据进行数据抽取,得到待检查关键词;将待检查关键词输入检测模型中进行检测,得到待检查关键词的检测结果;若检测结果指示待检查关键词不符合规则要求,则基于待检查关键词生成审核报告,并将审核报告发送至用户。构建检查规则库,基于检查规则库从源数据中抽取待检查关键词,提高了审核的准确性;利用检测模型对手册类文档和手册类文档的评审流程数据进行自动化审核,缩短了审核时长,提高了审核效率。
1.一种文档的审核方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于检查规则库对所述源数据进行数据抽取,得到待检查关键词,包括:
3.根据权利要求1所述的方法,其特征在于,根据用户输入的检查表构建检查规则库的过程,包括:
4.根据权利要求1所述的方法,其特征在于,根据预设样本数据训练神经网络模型得到所述检测模型的过程,包括:
5.根据权利要求1所述的方法,其特征在于,所述若所述检测结果指示所述待检查关键词不符合规则要求,则基于所述待检查关键词生成审核报告,并将所述审核报告发送至所述用户,包括:
6.一种文档的审核装置,其特征在于,所述装置包括:
7.根据权利要求6所述的装置,其特征在于,所述抽取单元,包括:
8.根据权利要求6所述的装置,其特征在于,还包括:
9.一种存储介质,其特征在于,用于存储计算机程序,所述计算机程序被执行时,具体用于实现如权利要求1至5任意一项所述的文档的审核方法。
10.一种电子设备,其特征在于,包括:存储器和处理器;