保险欺诈判断方法、模型训练方法、装置和计算机设备与流程

文档序号:37547570发布日期:2024-04-08 13:53阅读:18来源:国知局
保险欺诈判断方法、模型训练方法、装置和计算机设备与流程

本技术涉及计算机,特别是涉及一种保险欺诈判断方法、模型训练方法、装置和计算机设备。


背景技术:

1、保险欺诈是指在购买保险、保险理赔过程中,故意提供虚假信息、制造虚假事故或故意损坏财产等手段,以获取非法经济利益的行为。保险欺诈影响了保险市场的稳定性和公平性。保险理赔反诈是指保险公司采取措施预防和应对保险欺诈行为,保护保险公司和客户的利益。

2、传统技术中,保险理赔反诈方法通过数据分析和风险评估实现,然而用于学习的样本数据普遍存在正负样本极不均衡的情况,同时在负样本集合中也隐藏着未被标注出的阳性样本,样本不均衡且正负样本均有噪声,是影响机器学习效果的重要因素,导致训练得到的样本模型判断不准确。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够准确进行保险欺诈判断的保险欺诈判断方法、模型训练方法、装置和计算机设备。

2、第一方面,本技术提供一种保险欺诈判断方法,所述方法包括:

3、获取待判断理赔数据,将所述待判断理赔数据输入至欺诈判断模型中;所述欺诈判断模型包括第一子判断模型和第二子判断模型;

4、通过所述第一子判断模型对所述待判断理赔数据进行判断,得到第一判断结果,通过所述第二子判断模型对所述待判断理赔数据进行判断,得到第二判断结果;其中,所述第一子判断模型通过欺诈样本集和带有欺诈标签的已标注样本采用自学习算法经过多次训练得到,所述第二子判断模型通过欺诈样本集和带有欺诈标签的已标注样本采用标签传播算法经过多次训练得到;

5、将所述第一判断结果和所述第二判断结果进行加权,得到欺诈判断结果。

6、在其中一个实施例中,所述第一子判断模型和所述第二子判断模型的训练过程包括:

7、获取欺诈样本集,获取带有欺诈标签的已标注样本;

8、将所述欺诈样本集输入至预设去噪模型中,通过所述预设去噪模型去除所述欺诈样本集中的异常样本;

9、通过所述欺诈样本集和所述已标注样本对所述第一初始模型采用自学习算法经过多次迭代训练,得到所述第一子判断模型;

10、通过所述欺诈样本集和所述已标注样本对所述第二初始模型采用标签传播算法经过多次训练得到所述第二子判断模型。

11、在其中一个实施例中,所述通过所述欺诈样本集和所述已标注样本对所述第一初始模型采用自学习算法经过多次迭代训练,得到所述第一子判断模型,包括:

12、通过带有欺诈标签的已标注样本对所述第一初始模型进行参数优化;

13、将不具有欺诈标签的欺诈样本集输入至第一初始模型中,得到各样本的判断结果;

14、将满足预设准确条件的欺诈样本集中的样本作为已标注样本与前一次训练的已标注样本组合,再次输入至第一初始模型中进行训练;

15、重复训练多次直至满足预设停止条件,得到所述第一子判断模型。

16、在其中一个实施例中,所述通过带有欺诈标签的已标注样本对所述第一初始模型进行参数优化,包括:

17、将带有欺诈标签的已标注样本输入至第一初始模型中,得到判断结果;

18、将欺诈标签和判断结果进行比对,根据比对结果对所述第一初始模型进行参数优化。

19、在其中一个实施例中,所述通过所述欺诈样本集和所述已标注样本对所述第二初始模型采用标签传播算法经过多次训练得到所述第二子判断模型,包括:

20、获取欺诈样本集,获取带有欺诈标签的已标注样本;

21、将所述已标注样本输入至所述第二初始模型中,根据所述欺诈样本集和所述已标注样本构建节点图;

22、基于标签传播算法更新所述节点图中所述欺诈样本集的各节点,使至少部分经传播带有欺诈标签;

23、将所述欺诈样本集中带有欺诈标签的样本作为已标注样本再次基于标签传播算法更新所述节点图中的各节点;

24、重复多次直至满足预设收敛条件,得到第二子判断模型。

25、第二方面,本技术还提供一种欺诈判断模型训练方法,所述方法包括:

26、获取欺诈样本集,获取带有欺诈标签的已标注样本;

27、将所述欺诈样本集输入至预设去噪模型中,通过所述预设去噪模型去除所述欺诈样本集中的异常样本;

28、通过所述欺诈样本集和所述已标注样本对所述第一初始模型采用自学习算法经过多次迭代训练,得到所述第一子判断模型;

29、通过所述欺诈样本集和所述已标注样本对所述第二初始模型采用标签传播算法经过多次训练得到所述第二子判断模型。

30、第三方面,本技术还提供一种保险欺诈判断装置,所述装置包括:

31、理赔数据获取模块,用于获取待判断理赔数据,将所述待判断理赔数据输入至欺诈判断模型中;所述欺诈判断模型包括第一子判断模型和第二子判断模型;

32、子判断结果确定模块,用于通过所述第一子判断模型对所述待判断理赔数据进行判断,得到第一判断结果,通过所述第二子判断模型对所述待判断理赔数据进行判断,得到第二判断结果;其中,所述第一子判断模型通过欺诈样本集和带有欺诈标签的已标注样本采用自学习算法经过多次训练得到,所述第二子判断模型通过欺诈样本集和带有欺诈标签的已标注样本采用标签传播算法经过多次训练得到;

33、判断结果加权模块,用于将所述第一判断结果和所述第二判断结果进行加权,得到欺诈判断结果。

34、第四方面,本技术还提供一种欺诈判断模型训练装置,所述装置包括:

35、样本获取模块,用于获取欺诈样本集,获取带有欺诈标签的已标注样本;

36、异常样本去除模块,用于将所述欺诈样本集输入至预设去噪模型中,通过所述预设去噪模型去除所述欺诈样本集中的异常样本;

37、第一模型训练模块,用于通过所述欺诈样本集和所述已标注样本对所述第一初始模型采用自学习算法经过多次迭代训练,得到所述第一子判断模型;

38、第二模型训练模块,用于通过所述欺诈样本集和所述已标注样本对所述第二初始模型采用标签传播算法经过多次训练得到所述第二子判断模型。

39、第五方面,本技术还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述保险欺诈判断方法的步骤,或上述欺诈判断模型训练方法的步骤。

40、第六方面,本技术还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述保险欺诈判断方法的步骤,或上述欺诈判断模型训练方法的步骤。

41、第七方面,本技术还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述保险欺诈判断方法的步骤,或上述欺诈判断模型训练方法的步骤。

42、上述保险欺诈判断方法、模型训练方法、装置和计算机设备,欺诈判断模型包括第一子判断模型和第二子判断模型,用于判断输入的数据是否为欺诈理赔。其中,第一子判断模型基于自学习算法训练得到,第二子判断模型基于标签传播算法得到。在将待判断理赔数据输入至欺诈判断模型中后,分别通过第一子判断模型和第二子判断模型得到第一判断结果和第二判断结果,通过对第一判断结果和第二判断结果进行加权,得到待判断理赔数据的最终欺诈判断结果。相较于传统技术中通过数据分析和风险评进行判断的方法,本发明提供的保险欺诈判断方法使用训练完成的欺诈判断模型进行判断,提高了准确率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1