1.一种报销单风险预测方法,其特征在于,所述报销单风险预测方法包括:
获取历史报销单信息,并将所述历史报销单信息作为样本数据;
将所述样本数据按照预设的比例划分为训练样本和测试样本;
根据预设的N个报销单风险等级的定义,确定每个所述训练样本的报销单风险等级,其中,N为正整数;
针对每个所述报销单风险等级中的所述训练样本,使用关联规则算法进行模型训练,得到初始预测模型,其中,所述初始预测模型包括每个所述报销单风险等级中满足预设的模型参数要求的关联规则,所述模型参数包括支持度和置信度;
使用所述初始预测模型对所述测试样本进行模型预测,在从每个所述报销单风险等级中选择一组所述模型参数进行组合得到的每种组合方式下,计算每个所述报销单风险等级的预测成功率,以及每种所述组合方式下的总预测成功率和测试时间;
对所述模型参数、所述预测成功率、所述测试时间和所述总预测成功率进行回归分析,得到目标预测模型。
2.如权利要求1所述的报销单风险预测方法,其特征在于,所述针对每个所述报销单风险等级中的所述训练样本,使用关联规则算法进行模型训练,得到初始预测模型包括:
对每个所述报销单风险等级中的所述训练样本进行数据预处理,得到每个所述报销单风险等级中的待处理数据集;
对所述待处理数据集使用关联规则算法进行数据挖掘,得到每个所述报销单风险等级中的多个项集;
针对每个所述报销单风险等级,从该报销单风险等级中的所述项集中筛选出满足所述模型参数要求的目标项集,并根据该目标项集建立关联规则;
根据所述关联规则和所述关联规则对应的所述模型参数要求,构建所述初始预测模型。
3.如权利要求1或2所述的报销单风险预测方法,其特征在于,所述使用所述初始预测模型对所述测试样本进行模型预测,在从每个所述报销单风险等级中选择一组所述模型参数进行组合得到的每种组合方式下,计算每个所述报销单风险等级的预测成功率,以及该组合方式下的总预测成功率和测试时间包括:
根据所述预设的N个报销单风险等级的定义,确定每个所述测试样本的报销单风险等级,以及每个所述报销单风险等级的测试样本数;
按照如下公式计算所述测试样本中每个报销单风险等级的概率:
其中,i∈[1,N],Pi为所述测试样本中第i个报销单风险等级的概率,Ri为第i个所述报销单风险等级的测试样本数,S为所述测试样本的总数;
从每个所述报销单风险等级中选择一组所述模型参数进行组合,得到L种组合方式,其中,L为正整数;
针对每种所述组合方式,按照所述概率由高到低的顺序,使用所述初始预测模型对所述测试样本进行报销单风险等级预测,得到每个所述测试样本的预测结果,并获取在该组合方式下的进行报销单风险等级预测的测试时间;
将每个所述测试样本的所述预测结果与该测试样本的报销单风险等级进行对比,若两者相同则确认该测试样本预测成功,并统计在每种所述组合方式下每个所述报销单风险等级下的测试样本预测成功的个数;
按照如下公式计算每种所述组合方式下每个所述报销单风险等级的预测成功率:
其中,hitratei为第i个所述报销单风险等级的预测成功率,Mi为第i个所述报销单风险等级下的测试样本预测成功的个数;
按照如下公式计算每种所述组合方式下的总预测成功率:
其中,hitRate为所述总预测成功率。
4.如权利要求3所述的报销单风险预测方法,其特征在于,所述对所述模型参数、所述预测成功率、所述测试时间和所述总预测成功率进行回归分析,得到目标预测模型包括:
将每个所述报销单风险等级中的所述模型参数,以及所述预测成功率和所述测试时间作为设计变量,将所述总预测成功率作为目标变量,使用所述设计变量和所述目标变量进行函数拟合,得到拟合函数;
对所述拟合函数进行求解,根据求解结果将所述总预测成功率最高并且所述模型参数的值最高的一组设计变量作为模型配置参数,并根据所述模型配置参数构建目标预测模型,其中,所述目标预测模型的模型精确度为最高的所述总预测成功率。
5.如权利要求4所述的报销单风险预测方法,其特征在于,所述对所述模型参数、所述预测成功率、所述测试时间和所述总预测成功率进行回归分析,得到目标预测模型之后,所述报销单风险预测方法还包括:
将所述样本数据分割成K个子样本数据;
从所述K个子样本数据中,选择一个所述子样本数据作为所述测试样本,剩余K-1个所述子样本数据作为所述训练样本,进行所述模型训练、所述模型预测和所述回归分析,得到K个所述目标预测模型和每个所述目标预测模型的所述模型精确度,其中,K为正整数;
将所述模型精确度最高的目标预测模型作为合理模型。
6.一种报销单风险预测装置,其特征在于,所述报销单风险预测装置包括:
样本数据采集模块,用于获取历史报销单信息,并将所述历史报销单信息作为样本数据;
第一划分模块,用于将所述样本数据按照预设的比例划分为训练样本和测试样本;
风险等级预设模块,用于根据预设的N个报销单风险等级的定义,确定每个所述训练样本的报销单风险等级,其中,N为正整数;
初始预测模型获取模块,用于针对每个所述报销单风险等级中的所述训练样本,使用关联规则算法进行模型训练,得到初始预测模型,其中,所述初始预测模型包括每个所述报销单风险等级中满足预设的模型参数要求的关联规则,所述模型参数包括支持度和置信度;
初始预测模型测试模块,用于使用所述初始预测模型对所述测试样本进行模型预测,在从每个所述报销单风险等级中选择一组所述模型参数进行组合得到的每种组合方式下,计算每个所述报销单风险等级的预测成功率,以及每种所述组合方式下的总预测成功率和测试时间;
目标预测模型获取模块,用于对所述模型参数、所述预测成功率、所述测试时间和所述总预测成功率进行回归分析,得到目标预测模型。
7.如权利要求6所述的报销单风险预测装置装置,其特征在于,所述初始预测模型获取模块包括:
数据预处理单元,用于对每个所述报销单风险等级中的所述训练样本进行数据预处理,得到每个所述报销单风险等级中的待处理数据集;
训练样本挖掘单元,用于对所述待处理数据集使用关联规则算法进行数据挖掘,得到每个所述报销单风险等级中的多个项集;
关联规则获取单元,用于针对每个所述报销单风险等级,从该报销单风险等级中的所述项集中筛选出满足所述模型参数要求的目标项集,并根据该目标项集建立关联规则;
初始预测模型构建单元,用于根据所述关联规则和所述关联规则对应的所述模型参数要求,构建所述初始预测模型。
8.如权利要求6所述的报销单风险预测装置装置,其特征在于,所述报销单风险预测装置装置还包括:
第二划分模块,用于将所述样本数据分割成K个子样本数据;
交叉验证模块,用于从所述K个子样本数据中,选择一个所述子样本数据作为所述测试样本,剩余K-1个所述子样本数据作为所述训练样本,进行所述模型训练、所述模型预测和所述回归分析,得到K个所述目标预测模型和每个所述目标预测模型的所述模型精确度,其中,K为正整数;
合理模型获取模块,用于将所述模型精确度最高的目标预测模型作为合理模型。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述报销单风险预测方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述报销单风险预测方法的步骤。