本发明涉及机器学习,具体涉及一种基于机器学习的报销流程审核方法及装置。
背景技术:
1、目前各个企业的财务报销必须经过相应的报销流程,根据制度文件的要求,企业普遍制定了较为细致的报销流程。
2、现有的报销流程中,只有个别流程节点上做到自动化,例如在提交报销单的场景下,可以使用智能识别技术,将用户的纸质票务识别抽取关键信息,然后自动填入报销单各个选项中,并不能自动化审核当前报销是否通过,比如当前报销支付了100元,一般都会结合各种差旅标准以及特定的业务进行后续人工审核才能确定是否可以报销。从根本上来说,现有报销流程需要根据特定场景进行针对性人工审核才能最终确定报销是否通过,耗费大量人力物力。
技术实现思路
1、有鉴于此,本发明实施例提供一种基于机器学习的报销流程审核方法及装置,以实现自动化审核报销流程,节省人力物力的目的。
2、为实现上述目的,本发明实施例提供如下技术方案:
3、本发明实施例第一方面公开了一种基于机器学习的报销流程审核方法,所述方法包括:
4、针对用户发起的报销流程,从所述报销流程的各个流程节点中抽取特征数据;
5、将所述特征数据输入到预先构建的机器学习模型进行审核,得到审核结果;
6、若所述审核结果指示审核通过,则生成所述报销流程对应的归档信息并进行保存;
7、若所述审核结果指示审核不通过,则展示所述特征数据以使得人工对所述报销流程进行审核。
8、优选的,所述特征数据包括通用特征数据和差异化特征数据,所述针对用户发起的报销流程,从所述报销流程的各个流程节点中抽取特征数据,包括:
9、针对用户发起的报销流程中各个企业均采用的通用流程,从所述通用流程中的各个通用流程节点抽取对应的通用特征数据,所述通用流程节点包括:申请单节点、报销单节点、erp节点和对账系统节点;
10、针对用户发起的报销流程中预先个性化配置的差异化流程,从所述差异化流程中的各个差异化流程节点抽取差异化特征数据。
11、优选的,所述针对用户发起的报销流程中预先个性化配置的差异化流程,从所述差异化流程中的各个差异化流程节点抽取差异化特征数据,包括:
12、针对用户发起的报销流程中的报销规则检查流程,从所述报销规则检查流程对应的节点抽取配置特征作为差异化特征数据,所述配置特征用于表征所述用户是否符合预设的报销规则;
13、针对用户发起的报销流程中的报销场景的分类流程,从所述分类流程对应的节点抽取场景特征作为差异化特征数据,所述场景特征用于表征所述用户发起的所述报销流程对应的报销场景;
14、针对用户发起的报销流程中的附件上传流程,从所述附件上传流程对应的节点抽取附件特征作为差异化特征数据,所述附件特征用于表征所述用户上传的附件的内容;
15、针对用户发起的报销流程中的合规性校验流程,从所述合规性校验流程对应的节点抽取合规性校验特征作为差异化特征数据,所述合规性校验特征用于表征所述用户提供的报销内容是否符合要求。
16、优选的,所述机器学习模型的构建过程,包括:
17、获取从历史报销流程抽取的历史特征数据;
18、对所述历史特征数据添加标注,所述标注用于指示对应的所述历史报销流程是否通过;
19、按照预设比例将标注后的所述历史特征数据划分为训练集、验证集和测试集;
20、构建待训练的机器学习模型;
21、利用所述训练集对待训练的所述机器学习模型进行训练,并在训练过程中利用所述验证集调整所述机器学习模型的参数,得到训练后的所述机器学习模型;
22、利用所述测试集对训练后的所述机器学习模型进行测试;
23、若测试通过,则得到训练完成的所述机器学习模型;
24、若测试不通过,则调整训练后的所述机器学习模型的参数后,利用所述训练集继续对训练后的所述机器学习模型进行训练,直到训练后的所述机器学习模型测试通过。
25、优选的,所述对所述历史特征数据添加标注,包括:
26、获取人工针对所述历史特征数据输入的标注,并向所述历史特征数据添加所述标注;
27、或者,
28、获取人工针对预设数量的所述历史特征数据输入的标注,并向预设数量的所述历史特征数据添加所述标注;
29、利用标注过的预设数量的所述历史特征数据训练标注算法,利用训练后的所述标注算法对剩余的所述历史特征数据添加标注;
30、或者,
31、利用预先训练完成的标注算法,对所述历史特征数据添加标注。
32、优选的,在将所述特征数据输入到预先构建的机器学习模型进行审核,得到审核结果之前,所述方法还包括:
33、若所述特征数据包括多种数据类型,则根据所述特征数据的数据类型和对应的转换方法,将所述特征数据转换为符合机器学习模型输入要求的结构化的所述特征数据。
34、本发明实施例第二方面公开了一种基于机器学习的报销流程审核装置,所述装置包括:
35、抽取单元,用于针对用户发起的报销流程,从所述报销流程的各个流程节点中抽取特征数据;
36、审核单元,用于将所述特征数据输入到预先构建的机器学习模型进行审核,得到审核结果;
37、归档单元,用于若所述审核结果指示审核通过,则生成所述报销流程对应的归档信息并进行保存;
38、复核单元,用于若所述审核结果指示审核不通过,则展示所述特征数据以使得人工对所述报销流程进行审核。
39、优选的,所述抽取单元,包括:
40、通用特征抽取子单元,用于针对用户发起的报销流程中各个企业均采用的通用流程,从所述通用流程中的各个通用流程节点抽取对应的通用特征数据,所述通用流程节点包括:申请单节点、报销单节点、erp节点和对账系统节点;
41、差异化特征抽取子单元,用于针对用户发起的报销流程中预先个性化配置的差异化流程,从所述差异化流程中的各个差异化流程节点抽取差异化特征数据。
42、优选的,所述差异化特征抽取子单元,具体用于:
43、针对用户发起的报销流程中的报销规则检查流程,从所述报销规则检查流程对应的节点抽取配置特征作为差异化特征数据,所述配置特征用于表征所述用户是否符合预设的报销规则;
44、针对用户发起的报销流程中的报销场景的分类流程,从所述分类流程对应的节点抽取场景特征作为差异化特征数据,所述场景特征用于表征所述用户发起的所述报销流程对应的报销场景;
45、针对用户发起的报销流程中的附件上传流程,从所述附件上传流程对应的节点抽取附件特征作为差异化特征数据,所述附件特征用于表征所述用户上传的附件的内容;
46、针对用户发起的报销流程中的合规性校验流程,从所述合规性校验流程对应的节点抽取合规性校验特征作为差异化特征数据,所述合规性校验特征用于表征所述用户提供的报销内容是否符合要求。
47、优选的,所述装置还包括:
48、构建单元,用于获取从历史报销流程抽取的历史特征数据;
49、对所述历史特征数据添加标注,所述标注用于指示对应的所述历史报销流程是否通过;
50、按照预设比例将标注后的所述历史特征数据划分为训练集、验证集和测试集;
51、构建待训练的机器学习模型;
52、利用所述训练集对待训练的所述机器学习模型进行训练,并在训练过程中利用所述验证集调整所述机器学习模型的参数,得到训练后的所述机器学习模型;
53、利用所述测试集对训练后的所述机器学习模型进行测试;
54、若测试通过,则得到训练完成的所述机器学习模型;
55、若测试不通过,则调整训练后的所述机器学习模型的参数后,利用所述训练集继续对训练后的所述机器学习模型进行训练,直到训练后的所述机器学习模型测试通过。
56、基于上述本发明实施例提供的一种基于机器学习的报销流程审核方法及装置,针对用户发起的报销流程,从所述报销流程的各个流程节点中抽取特征数据,将所述特征数据输入到预先构建的机器学习模型进行审核,得到审核结果,若所述审核结果指示审核通过,则生成所述报销流程对应的归档信息并进行保存,若所述审核结果指示审核不通过,则展示所述特征数据以使得人工对所述报销流程进行审核。在本方案中,从报销流程各个节点入手使用机器学习技术建立机器学习模型,然后基于从报销流程提取的特征数据以及预先构建的机器学习模型,自动审核报销流程是否通过,以实现自动化审核报销流程,节省人力物力的目的。