一种保险行业理赔反欺诈识别方法及装置与流程

文档序号：24416220发布日期：2021-03-26 21:11阅读：147来源：国知局

1.本说明书一个或多个实施例涉及金融保险技术领域，尤其涉及一种保险行业理赔反欺诈识别方法及装置。

背景技术：

2.保险理赔是保险经营的一项重要的经营环节，近些年随着保险业务量的增长，通过保险理赔进行金融欺诈的现象也日渐增多，这就对保险理赔反欺诈带来更大的压力；
3.近些年，针对理赔反欺诈，建立了各种机器学习或深度学习的算法模型，用于识别评估理赔申请的欺诈风险。然而，由于机器学习和深度学习等算法的黑盒属性，欺诈风险识别模型只能评估出欺诈风险相对大小，无法给出评估为欺诈的具体原因，即风险评估结果难以解释，这就对评估结果的可信度产生了严重影响，进一步影响后续调查取证工作的展开。

技术实现要素：

4.有鉴于此，本说明书一个或多个实施例的目的在于提出一种保险行业理赔反欺诈识别方法及装置，以解决现有方式无法给出评估为欺诈的具体原因的问题。
5.基于上述目的，本说明书一个或多个实施例提供了一种保险行业理赔反欺诈识别方法，包括：
6.获取待测保单的数据；
7.获取预先生成的反欺诈分析模型基于待测保单的数据的分析结果，判断待测保单是否为高风险保单，并得到高风险保单的可疑点；
8.将得到的高风险保单的可疑点与预先生成的理赔欺诈手段知识库进行比对，判断高风险保单的可疑点是否属于理赔欺诈手段知识库中的高风险因子，输出符合判断条件的高风险保单的可疑点为认定的风险点。
9.优选地，待测保单的数据包括但不限于投保人收入、累计保费、投保人年龄。
10.优选地，判断待测保单是否为高风险保单包括，获取反欺诈分析模型基于待测保单的风险评估值，判断获取的风险评估值是否高于预设评估值。
11.优选地，预先生成理赔欺诈手段知识库的过程包括：
12.获取历史保单的理赔数据，并从历史保单的理赔数据中提取风险特征；
13.利用shap方法对各风险特征对风险评估值的贡献程度进行量化计算，得到各风险特征的贡献值；
14.基于各风险特征的贡献值计算结果，将筛选出的贡献值大于预设的贡献阈值的风险特征输出为高风险因子；
15.将输出的高风险因子汇总，生成理赔欺诈手段知识库；
16.对风险特征的贡献值计算过程及高风险因子的筛选过程进行迭代，更新理赔欺诈手段知识库。
17.优选地，在将输出的高风险因子汇总，生成理赔欺诈手段知识库前，本方法还包括：
18.基于历史保单的理赔经验数据对输出的高风险因子进行验证，剔除未通过验证的高风险因子。
19.优选地，本方法还包括：
20.基于认定的风险点，从相应的外部数据库中取得与风险点相关的证据。
21.优选地，在从相应的外部数据库中取得与风险点相关的证据前，方法还包括：
22.向待测保单的客户发出授权问询，取得授权则进行下一步流程，反之终止取证。
23.优选地，预先生成反欺诈分析模型的过程包括：
24.获取历史理赔案件样本；
25.为每个历史理赔案件样本标定对应的风险指标值，形成样本数据集；
26.从样本数据集中提取特征信息；
27.将提取出的特征信息分为第一比例的训练集和第二比例的验证集；
28.利用训练集训练逻辑回归模型，得出逻辑回归模型与特征信息的关联关系；
29.利用验证集对得出的逻辑回归模型与特征信息的关联关系进行验证，若未通过验证，则增加历史理赔案件样本的数量，重新训练，直至通过验证，输出反欺诈分析模型。
30.优选地，本方法还包括：
31.根据待测保单所属的险种从各反欺诈分析模型中确定评估用的目标反欺诈分析模型。
32.本说明书还提供一种保险行业理赔反欺诈识别装置，包括：
33.获取模块，用于获取待测保单的数据；
34.分析模块，用于获取预先生成的反欺诈分析模型基于待测保单的数据的分析结果，判断待测保单是否为高风险保单，并得到高风险保单的可疑点；
35.输出模块，用于将得到的高风险保单的可疑点与预先生成的理赔欺诈手段知识库进行比对，判断高风险保单的可疑点是否属于理赔欺诈手段知识库中的高风险因子，输出符合判断条件的高风险保单的可疑点为认定的风险点。
36.从上面所述可以看出，本说明书一个或多个实施例提供的保险行业理赔反欺诈识别方法及装置，通过获取待测保单的数据，利用反欺诈分析模型对数据进行评估分析，判断待测保单是否为高风险保单，对于高风险保单，将其可疑点与理赔欺诈手段知识库进行比对，从而输出认定的风险点，不仅可以评估出待测保单的欺诈风险大小，还可以给出评估为欺诈的具体原因，即导致该保单存在高风险的风险点，方便后续调查取证工作的展开，规范整个作业流程，提高作业智能化水平，节省人工工作量。
附图说明
37.为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书一个或多个实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
38.图1为本说明书一个或多个实施例的保险行业理赔反欺诈识别方法流程示意图；
39.图2为本说明书一个或多个实施例的理赔申请反欺诈取证示意图。
具体实施方式
40.为使本公开的目的、技术方案和优点更加清楚明白，以下结合具体实施例，对本公开进一步详细说明。
41.需要说明的是，除非另外定义，本说明书一个或多个实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本说明书一个或多个实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性，而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同，而不排除其他元件或者物件。
42.一种保险行业理赔反欺诈识别方法，如图1所示，包括以下步骤：
43.s101获取待测保单的数据；
44.举例来说，获取的待测保单的数据包括但不限于投保人收入、累计保费、投保人年龄等。
45.s102获取预先生成的反欺诈分析模型基于待测保单的数据的分析结果，判断待测保单是否为高风险保单，并得到高风险保单的可疑点；
46.举例来说，判断待测保单是否为高风险保单包括，获取反欺诈分析模型基于待测保单的风险评估值，即将待测保单的数据代入反欺诈分析模型中，输出风险评估值，判断获取的风险评估值是否高于预设评估值，前述风险评估值可以是用数字量化的评估值，也可以是按等级划分的评估结果，具体不做限定，风险评估值为数字量化的实施例中，预设评估值可设置为60，则获取的风险评估值高于60时，说明该待测保单为高风险保单。
47.前述得到高风险保单的可疑点，可以将高风险保单的全部数据均作为可疑点，也可以基于机器筛选或人工筛选，保留部分数据作为可疑点。
48.s103将得到的高风险保单的可疑点与预先生成的理赔欺诈手段知识库进行比对，判断所述高风险保单的可疑点是否属于所述理赔欺诈手段知识库中的高风险因子，输出符合判断条件的所述高风险保单的可疑点为认定的风险点。
49.举例来说，是将s102中得到的所有可疑点一一带入理赔欺诈手段知识库中，进行数据碰撞，若可疑点的数据符合理赔欺诈手段知识库中的数据标准，则判定为命中，将该可疑点输出为认定的风险点。
50.本说明书实施例提供的保险行业理赔反欺诈识别方法，通过获取待测保单的数据，利用反欺诈分析模型对数据进行评估分析，判断待测保单是否为高风险保单，对于高风险保单，将其可疑点与理赔欺诈手段知识库进行比对，从而输出认定的风险点，不仅可以评估出待测保单的欺诈风险大小，还可以给出评估为欺诈的具体原因，即导致该保单存在高风险的风险点，方便后续调查取证工作的展开，规范整个作业流程，提高作业智能化水平，节省人工工作量。
51.作为一种实施方式，预先生成理赔欺诈手段知识库的过程包括：
52.获取历史保单的理赔数据，并从所述历史保单的理赔数据中提取风险特征；
53.利用shap(shapley additive explanations)方法对各所述风险特征对风险评估
值的贡献程度进行量化计算，得到各所述风险特征的贡献值；
54.shap方法是一种基于博弈论的统计计算方法，为每一个特征计算一个shap值作为贡献值，shap值的计算过程中，将某一个特征与其他的所有的特征的子集进行博弈比较，计算特征相对于其他特征子集对于预测结果的影响程度。
55.基于各所述风险特征的贡献值计算结果，将筛选出的贡献值大于预设的贡献阈值的风险特征输出为高风险因子，前述高风险因子，指正向高贡献值的风险特征。
56.将输出的高风险因子汇总，生成理赔欺诈手段知识库。
57.对风险特征的贡献值计算过程及高风险因子的筛选过程进行迭代，更新理赔欺诈手段知识库，对知识库中的知识不断进行积累丰富。
58.举例来说，风险特征为投保人收入小于3000元，计算出的贡献值为0.45，预设的贡献阈值为0.3，则该风险特征为高风险因子，在将可疑点与理赔欺诈手段知识库进行比对时，若可疑点为投保人收入为2500元，满足小于3000元，则可以认定该可疑点为风险点，同理，高风险因子还可以包括累计保费小于y元，投保人年龄大于z岁等。
59.通过对风险评估值的贡献程度进行量化计算，可以更加准确地找出对高风险案件起到关键性因素的高风险因子，从而针对该高风险因子进行调查取证。
60.作为一种实施方式，在将输出的高风险因子汇总，生成理赔欺诈手段知识库前，所述方法还包括：
61.基于历史保单的理赔经验数据对输出的高风险因子进行验证，剔除未通过验证的高风险因子。
62.上述理赔经验数据由历史保单的理赔结果结合从业人员经验综合得到，验证时可采用机器或人工验证的方法，减少数据处理中的错误数据，提高理赔欺诈手段知识库的正确性。
63.作为一种实施方式，本方法还包括，基于认定的风险点，从相应的外部数据库中取得与所述风险点相关的证据，如图2所示，举例来说，若认定的风险点为投保人在1个月内有就医记录，则可以从外部的医疗机构获取就医数据，进行数据碰撞完成调查取证，由此建立一整套精准有效的保险理赔欺诈调查取证方案，解决保险理赔反欺诈排查难、取证难的行业问题。
64.作为一种实施方式，在从相应的外部数据库中取得与所述风险点相关的证据前，本方法还包括：
65.向所述待测保单的客户发出授权问询，取得授权则进行下一步流程，反之终止取证。
66.考虑到用户隐私和可能面临的侵权问题，在对接外部数据库进行调查取证前，需要取得客户授权，若未能取得客户授权，则不进行取证流程。
67.作为一种实施方式，预先生成所述反欺诈分析模型的过程包括：
68.获取历史理赔案件样本；
69.为每个历史理赔案件样本标定对应的风险指标值，形成样本数据集；
70.从样本数据集中提取特征信息；
71.将提取出的特征信息分为第一比例的训练集和第二比例的验证集，举例来说，第一比例为80％，第二比例为20％；
72.利用训练集训练逻辑回归模型，得出逻辑回归模型与特征信息的关联关系；
73.利用验证集对得出的逻辑回归模型与特征信息的关联关系进行验证，若未通过验证，则增加历史理赔案件样本的数量，重新训练，直至通过验证，输出反欺诈分析模型。
74.上述特征信息指的是样本数据集中所有可能与欺诈风险相关的数据，在利用验证集进行验证时，需要验证逻辑回归模型的命中率、覆盖率和准确率，若命中率、覆盖率及准确率均高于设定值，则验证通过。
75.作为一种实施方式，在获取预先生成的反欺诈分析模型基于所述待测保单的数据的分析结果之前，本方法还包括：
76.根据所述待测保单所属的险种从各反欺诈分析模型中确定评估用的目标反欺诈分析模型。
77.在本实施例中，不同险种的反欺诈分析模型需要根据不同险种的历史理赔案件样本分别训练生成，针对不同险种保单的特殊性，提高高风险保单的评估准确率。
78.可以理解，该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。
79.需要说明的是，本说明书一个或多个实施例的方法可以由单个设备执行，例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下，由多台设备相互配合来完成。在这种分布式场景的情况下，这多台设备中的一台设备可以只执行本说明书一个或多个实施例的方法中的某一个或多个步骤，这多台设备相互之间会进行交互以完成所述的方法。
80.上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。
81.本说明书实施例还提供一种保险行业理赔反欺诈识别装置，包括：
82.获取模块，用于获取待测保单的数据；
83.分析模块，用于获取预先生成的反欺诈分析模型基于所述待测保单的数据的分析结果，判断待测保单是否为高风险保单，并得到高风险保单的可疑点；
84.输出模块，用于将得到的高风险保单的可疑点与预先生成的理赔欺诈手段知识库进行比对，判断所述高风险保单的可疑点是否属于所述理赔欺诈手段知识库中的高风险因子，输出符合判断条件的所述高风险保单的可疑点为认定的风险点。
85.为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本说明书一个或多个实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
86.上述实施例的装置用于实现前述实施例中相应的方法，并且具有相应的方法实施例的有益效果，在此不再赘述。
87.用于执行本实施例方法的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只
读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd
‑
rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。
88.所属领域的普通技术人员应当理解：以上任何实施例的讨论仅为示例性的，并非旨在暗示本公开的范围(包括权利要求)被限于这些例子；在本公开的思路下，以上实施例或者不同实施例中的技术特征之间也可以进行组合，步骤可以以任意顺序实现，并存在如上所述的本说明书一个或多个实施例的不同方面的许多其它变化，为了简明它们没有在细节中提供。
89.另外，为简化说明和讨论，并且为了不会使本说明书一个或多个实施例难以理解，在所提供的附图中可以示出或可以不示出与集成电路(ic)芯片和其它部件的公知的电源/接地连接。此外，可以以框图的形式示出装置，以便避免使本说明书一个或多个实施例难以理解，并且这也考虑了以下事实，即关于这些框图装置的实施方式的细节是高度取决于将要实施本说明书一个或多个实施例的平台的(即，这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如，电路)以描述本公开的示例性实施例的情况下，对本领域技术人员来说显而易见的是，可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本说明书一个或多个实施例。因此，这些描述应被认为是说明性的而不是限制性的。
90.尽管已经结合了本公开的具体实施例对本公开进行了描述，但是根据前面的描述，这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如，其它存储器架构(例如，动态ram(dram))可以使用所讨论的实施例。
91.本说明书一个或多个实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此，凡在本说明书一个或多个实施例的精神和原则之内，所做的任何省略、修改、等同替换、改进等，均应包含在本公开的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张洪涛;鞠芳
技术所有人：中国人寿保险股份有限公司
我是此专利的发明人

上一篇：一种自动络筒机出筒导向装置的制作方法
上一篇：一种评论信息的显示方法、装置、电子设备及存储介质与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。