一种保单风险评估方法、装置、终端设备及存储介质与流程

文档序号:15096582发布日期:2018-08-04 14:43阅读:234来源:国知局

本发明涉及金融服务技术领域,尤其涉及一种保单风险评估方法、装置、终端设备及存储介质



背景技术:

在保险行业,经常有犯罪分子违反保险法规,采用虚构保险标、保险事故或者制造保险事故等方法,向保险公司骗取保险金。保险公司需要通过对保单信息进行分析,识别保险欺诈案件。

但是,目前在保险行业对保单数据进行挖掘分析时,仅从单个保单的角度进行分析和挖掘,或者通过人工方式查找保单之间可能存在的联系,导致对团伙保单的挖掘效率低,并且成功率不高,造成团伙骗保的风险识别率不高,而现实中往往团伙骗保一般都是有计划和有预谋的犯罪,并且涉及的欺诈索赔金额巨大,若不能及时识别团伙骗保风险,则会对保险公司造成巨大的经济损失。



技术实现要素:

本发明实施例提供一种保单风险评估方法,以解决目前保险行业没有对保单数据进行关联性地挖掘分析而导致团伙骗保风险的识别率低的问题。

第一方面,本发明实施例提供一种保单风险评估方法,包括:

构建保单关系网络,其中,所述保单关系网络由相互之间通过相同的属性信息进行关联的保单生成;

获取历史保单案件信息,将所述历史保单案件信息作为样本数据;

根据所述样本数据构建评分模型,其中,所述评分模型包含预设条数的评分项和每条所述评分项在不同评分条件下的评分值;

使用所述评分模型对所述保单关系网络进行评估,得到评估总分;

根据所述评估总分分析所述保单关系网络中的保单欺诈风险。

第二方面,本发明实施例提供一种保单风险评估装置,包括:

保单关系网络构建模块,用于构建保单关系网络,其中,所述保单关系网络由相互之间通过相同的属性信息进行关联的保单生成;

保单样本数据采集模块,用于获取历史保单案件信息,将所述历史保单案件信息作为样本数据;

保单评估模型构建模块,用于根据所述样本数据构建评分模型,其中,所述评分模型包含预设条数的评分项和每条所述评分项在不同评分条件下的评分值;

保单关系网络评估模块,用于使用所述评分模型对所述保单关系网络进行评估,得到评估总分;

保单欺诈风险分析模块,用于根据所述评估总分分析所述保单关系网络中的保单欺诈风险。

第三方面,本发明实施例提供一种本发明实施例提供一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述保单风险评估方法的步骤。

第四方面,本发明实施例提供一种本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述保单风险评估方法的步骤。

本发明实施例与现有技术相比具有如下优点:本发明实施例提供的一种保单风险评估方法、装置、终端设备及存储介质中,通过保单之间相同的属性信息对保单进行关联,构建保单关系网络,该保单关系网络提供了保单之间的关联关系,从而能够为团伙保单数据的挖掘提供有效的基础数据,使用由历史保单案件信息作为样本数据进行机器学习构建评分模型,对保单关系网络进行评估,并根据评估总分分析保单关系网络中的保单欺诈风险,使得不同保单之间通过相同的属性信息关联起来后,能够有效地对保单数据进行关联性地挖掘分析,并直接输出对保单关系网络的风险识别结果,从而辅助相关人员精准高效地识别团伙骗保风险,提高对保单风险识别的效率和团伙骗保风险的识别率。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例1中提供的保单风险评估方法的流程图;

图2是本发明实施例1中提供的保单风险评估方法中步骤10的实现流程图;

图3是本发明实施例1提供的保单风险评估方法中一个由四个保单构成的保单关系网络的网络结构图的示意图;

图4是本发明实施例1中提供的保单风险评估方法中步骤30的实现流程图;

图5是本发明实施例1中提供的保单风险评估方法中步骤50的实现流程图;

图6是本发明实施例2中提供的保单风险评估装置的示意图;

图7是本发明实施例4中提供的终端设备的示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1

请参阅图1,图1示出了本发明实施例提供的保单风险评估方法的实现流程。该保单风险评估方法可从保单数据库中采集历史保单案件信息,以便基于采集到的历史保单案件信息进行保单风险评估模型训练。该保单风险评估方法可具体应用在保险行业保单信息库管理系统这一数据管理系统中,用于对保单关系网络进行评估其欺诈风险,能够有效提高团伙骗保风险的识别率。如图1所示,该保单风险评估方法包括步骤S10至步骤S50,详述如下:

S10:构建保单关系网络,其中,保单关系网络由相互之间通过相同的属性信息进行关联的保单生成。

在本发明实施例中,属性信息是指保单数据库存储的保单的保单信息中保险对象的属性信息。保单数据库为保险公司存储客户的保单的数据库,每个保单的保单信息包括保单标识信息和保单对象的属性信息等。

保单标识信息用于唯一标识保单,例如,保单标识信息可以是保单号,该保单号可以由保单生成的日期加上序号生成,使得每个保单具有唯一的保单号,但并不限于此,保单标识信息可以根据应用的需要进行设置,此处不做限制。

保单对象是指保单中的保险产品涉及到的相关利益人,保单对象包括投保人、被保险人、受益人或申请人中的至少一个,其中,投保人是指与保险人订立保险合同,并按照保险合同负有支付保险费义务的人,投保人可以是自然人也可以是法人。被保险人是指根据保险合同,其财产利益或人身收保险合同保障,在保险事故发生后,享有保险金请求权的人。投保人可以与被保险人相同。受益人是指人身保险合同中由被保险人或者投保人指定的享有保险金请求权的人。投保人和被保险人均可以为受益人,如果投保人或被保险人均未指定受益人,则其法定继承人即为受益人。申请人是指保险理赔申请人,即出险时得到理赔的被保险人。

保单对象的属性信息即投保人、被保险人、受益人或申请人的属性信息,包括客户号、电话号码、终端设备号、银行卡号、身份证号码或家庭地址信息中的至少一个,但并不限于此,属性信息还可以包括其他标识保险对象的信息,此处不做限制。其中,终端设备号为登录保险应用APP或访问保险网站的终端设备的唯一设备标识码,客户号用于标识保单对象在保险公司的客户编号,当保单对象在保险公司第一次成功购买了保险产品时,该保单对象成为保险公司的客户,保险公司会为该保单对象分配一个唯一的客户号。

保单信息中的身份标识信息是指为该保单信息的保单客户提供保险产品销售服务的保险销售人员的身份标识信息。

身份标识信息用于唯一标识保险销售人员,例如,身份标识信息可以是保险销售人员的工号等,但并不限于此,保单标识信息可以根据应用的需要进行设置,此处不做限制。

具体地,针对保单信息中的每个属性信息,对保单进行遍历,将具有相同属性信息的值的保单信息对应的保单之间建立基于该属性信息的关联关系,将互相具有关联关系的保单以及该关联关系构成保单关系网络。

例如,若保单A中投保人的电话号码与保单B中受益人的电话号码相同,则通过该电话号码将保单A与保单B进行关联,得到保单A与保单B之间基于该电话号码的关联关系a,若保单B中被保险人的家庭地址信息与保单C中申请人的家庭地址信息相同,则通过该家庭地址信息将保单B与保单C进行关联,得到保单B与保单C之间基于该家庭地址信息的关联关系b。因此,保单A、保单B和保单C,以及关联关系a和关联关系b属于一个保单关系网络。

可以理解的是,根据保单数据库中的保单信息最终构建出的保单关系网络可能存在多个。

S20:获取历史保单案件信息,将历史保单案件信息作为样本数据。

在本发明实施例中,历史保单案件信息是从保单数据库中进行采集,具体地,采集保单数据库中的历史团伙保单案件,获取历史团伙保单案件的数据信息,其中,该数据信息包括但不限于保险事故信息、索赔人信息、索赔信息、受伤信息和医疗信息,以历史团伙保单案件的数据信息作为样本数据进行挖掘学习。

需要说明的是,保险事故信息具体可以是保险事故涉及到的事故类型、时间、地点、证人、警察报告等信息,索赔人信息具体可以是索赔人的性别、年龄、失业情况和索赔的历史记录等信息,索赔信息具体可以是索赔的种类、发票信息和索赔金额等信息,受伤情况具体可以是受伤类型和受伤等级等信息,医疗信息具体可以是医疗地点、医疗时长、医疗药品和恢复状况等信息,此处不做限制。

S30:根据样本数据构建评分模型,其中,评分模型包含预设条数的评分项和每条评分项在不同评分条件下的评分值。

在本发明实施例中,预先进行设置保单评估的风险指标,该风险指标即为对团伙欺诈特征有影响的可测信息点,风险指标根据保险环境和保险类型的不同而有不同的设定,具体可以根据实际应用进行设置,此处不做限制。

具体地,从样本数据中采集满足所预设的每个风险指标的样本数,对每个风险指标及其对应的样本数,使用决策树算法筛选出目标风险指标以及每个目标风险指标对应的评分条件,其中,目标风险指标是用于预测保单关系网络中保单欺诈风险的评估条件。

通过使用逻辑回归算法对样本数据、目标风险指标和评分条件进行机器学习,得到每个评分条件的重要性系数,以目标风险指标作为评分模型的评分项,将重要性系数进行转换得到系数值,作为每条评分项相应的评分条件的评分值,通过评分项和每条评分项在不同评分条件下的评分值构建评分模型。该评分模型用于对保单关系网络的保单欺诈风险进行评估,能够提高对保单风险评估的效率。

S40:使用评分模型对保单关系网络进行评估,得到评估总分。

在本发明实施例中,评估总分用来标识保单关系网络中存在保单欺诈风险的可能性,若评估总分越大,则保单关系网络中存在的保单欺诈风险越大。

具体地,根据步骤S30构建的评分模型,按照其全部评分项和每条评分项在不同评分条件下的评分值,逐条对保单关系网络进行评估,得到保单关系网络在每条评分项的评估分值,对得到的全部评估分值进行求和运算,输出保单关系网络的评估总分。通过使用构建的保单风险评估模型,能直接得到保单欺诈风险的结果,减少人工查找保单之间的联系进行保单风险评估的方式,提高对团伙骗保的识别成功率。

下面以一个具体地评分模型为例加以说明。如表一所示,表一示出了该评分模型的全部评分项,共21条,其中,评分项中提到的网络为保单关系网络。如表二所示,表二示出了每条评分项分别在三种不同评分条件下的评分值。

表一

表二

S50:根据评估总分分析保单关系网络中的保单欺诈风险。

在本发明实施例中,根据步骤S40计算得到保单关系网络的评估总分,对保单关系网络中的保单欺诈风险进行分析,根据分析得到的结果启动相对应的风险监控管理措施。

具体地,评估总分与保单欺诈风险之间可以是正比例线性函数关系,评估总分越大则保单存在欺诈风险的可能性越大,反之,评估总分越小则保单存在欺诈风险的可能性越小。评估总分与理保单欺诈风险之间还可以是阈值范围对应关系,即设定评估总分的不同阈值范围,每个范围对应一个保单欺诈风险等级,评估总分的值较大的阈值范围对应的保单欺诈风险等级较高,反之,评估总分的值较小的阈值范围对应的保单欺诈风险等级较低。

需要说明的是,风险监控管理措施是根据保单存在欺诈风险的可能性或等级而制定的相对应措施,以便能够及时减少保单欺诈案件发生的可能性,或者减少保单欺诈案件发生时造成的损失,从而降低保险公司承担的骗保风险。例如,若评估总分达到了预设的风险阈值,则发出预警信息,对保单关系网络进行定期监控,关注保单关系网络中每个保单的情况,若其中的保单信息发生变化,则及时将变化情况输出,提醒相关监控人员关注。该风险阈值和风险监控管理措施可以根据应用需要进行设置,此处不做限制。

进一步地,还可以根据构建的保单关系网络,基于保险业务员的信息和保险业务员相关联的保单关系网络,进行构建业务员关系网络,对业务员关系网络中的数据信息进行关联性地挖掘分析,构建评估模型对业务员关系网络进行评估,分析业务员关系网络中的保单欺诈风险。从而识别保险公司的从业人员或者代理人,在开展业务和理赔过程中为谋取私利或者私分保险赔付金,与投保人串通共同骗保的情况,提高对保险从业人员参与的骗保行为的识别率,对保险业的诚信建设和反欺诈行动提供重要的帮助。

在图1对应的实施例中,通过保单之间相同的属性信息对保单进行关联,构建保单关系网络,该保单关系网络提供了保单之间的关系,从而能够为团伙保单数据的挖掘提供有效的保单信息。以历史团伙保单案件信息作为样本数据,并与筛选出的目标风险指标和评分条件进行机器学习构建评分模型,该评分模型用于对保单关系网络的保单欺诈风险进行评估,提高对保单风险评估的效率。使用评分模型对保单关系网络进行评估,并根据评估总分分析保单关系网络中的保单欺诈风险,直接输出对保单关系网络的风险识别结果,根据分析得到的结果启动相对应的风险监控管理措施,降低保险公司承担的骗保风险,从而实现了精准高效地识别团伙骗保风险,提高对保单风险识别的效率和团伙骗保风险的识别率。

接下来,在图1对应的实施例的基础之上,下面通过一个具体的实施例对步骤S10中提及的构建保单关系网络的具体实现方法进行详细说明。

请参阅图2,图2示出了本发明实施例提供的步骤S10的具体实现流程,详述如下:

S11:从保单数据库中获取每个保单的保单信息,其中,该保单信息包括保单标识信息和保单对象的属性信息,该保单标识信息用于唯一标识保单。

具体地,从保单数据库中获取每个保单的保单标识信息和该保单中每个保单对象的属性信息。

S12:根据保单对象的属性信息确定待匹配参数。

具体地,从步骤S11获取到的保单对象的属性信息中选取至少一项属性信息作为待匹配参数。

例如,若属性信息包括客户号、电话号码、终端设备号、银行卡号、身份证号码和家庭地址信息,则可以将全部属性信息确定为待匹配参数,即待匹配参数为对象客户号、电话号码、终端设备号、银行卡号、身份证号码和家庭地址信息,或者也可以将部分属性信息确定为待匹配参数,其具体可以根据应用的需要进行选择,此处不做限制。

S13:针对每个待匹配参数,对保单进行遍历,在具有相同参数值的不同保单之间建立基于该待匹配参数的直接关系,参数值用于标识直接关系。

具体地,针对步骤S12确定的每个待匹配参数,首先从保单信息中获取该待匹配参数的所有参数值,然后根据每个参数值对保单进行遍历,将具有相同参数值的不同保单进行关联,得到不同保单之间基于该待匹配参数的直接关系。

例如,若待匹配参数为电话号码,则遍历每个保单,提取每个保单中的电话号码,将具有相同电话号码的保单进行关联,得到基于该电话号码的不同保单之间的直接关系。比如,保单A中投保人的电话号码与保单B中受益人的电话号码相同,则通过该电话号码将保单A与保单B进行关联,得到保单A与保单B之间基于该电话号码的直接关系。若待匹配参数为家庭地址信息,假设保单B中被保险人的家庭地址信息与保单C中申请人的家庭地址信息相同,则通过该家庭地址信息将保单B与保单C进行关联,得到保单B与保单C之间基于该家庭地址信息的直接关系。

进一步地,由于保单A与保单B之间具有基于电话号码的直接关系,保单B与保单C之间具有基于家庭地址信息的直接关系,且保单A与保单C之间不具有直接关系,则保单A与保单C之间具有间接关系。

需要说明的是,由于保单数据库存储了保险公司的每个客户的全部保单,其保单信息的数据量庞大,在本步骤的执行过程中,采用MapReduce进行大数据并行计算,以提高计算效率。

MapReduce是面向大数据并行处理的平台、框架和计算模型,用于大规模数据集的并行运算。它允许用市场上普通的商用服务器构成一个包含数十、数百至数千个节点的分布和并行计算集群;它还提供了一个庞大但设计精良的并行计算软件框架,能自动完成计算任务的并行化处理,自动划分计算数据和计算任务,在集群节点上自动分配和执行任务以及收集计算结果,将数据分布存储、数据通信、容错处理等并行计算涉及到的系统底层的复杂细节交由系统负责处理,大大减少了软件开发人员的负担;同时,它还提供了一种简便的并行计算模型,用Map和Reduce两个函数实现基本的并行计算任务,提供了抽象的操作和并行接口,以简单方便地完成大规模数据的计算处理。

S14:以保单标识信息为网络节点,以待匹配参数的参数值为关系节点,将互相具有直接关系的网络节点与建立该直接关系的关系节点进行关联,构建保单关系网络。

在本发明实施例中,保单关系网络包括网络节点、关系节点,以及不同网络节点之间基于关系节点建立的直接关系。其中,网络节点为保单标识信息,用于标识保单,关系节点为待匹配参数的参数值,用于标识不同网络节点之间的直接关系。

进一步地,保单关系网络可以采用图数据的方式体现。图数据由一系列的点以及连接点的边构成。一个图G通常表示为G(V,E),其中,V表示顶点的集合,称为图G的顶点集,E是集合V*V的一个子集,即边的集合,称为图G的边集。在本发明实施例中,将保单关系网络以网络结构图的形式存储,该保单关系网络的网络节点和关系节点组成顶点集,不同网络节点之间基于关系节点建立的直接关系组成边的集合,通过顶点和边来存储保单关系网络的数据。

在网络结构图中,直接关系和间接关系的区别可以通过网络节点之间的距离远近来体现,具有间接关系的两个网络节点之间的距离大于具有直接关系的两个网络节点之间的距离。

需要说明的是,根据保单数据库中的保单信息最终构建出的保单关系网络可能存在多个,每个保单关系网络中的网络节点之间都必然存在直接关系或间接关系,而不同保单关系网络中的网络节点之间不存在直接关系和间接关系。

为了更好的理解本发明实施例中的保单关系网络,现通过一个具体的保单关系网络的网络结构图举例进行说明。详述如下:

请参阅图3,图3示出了一个由四个保单构成的保单关系网络的网络结构图。其中,网络节点包括保单标识信息1、保单标识信息2、保单标识信息3和保单标识信息4,关系节点包括身份证号1、身份证号2、客户号1、客户号2、银行卡号1和家庭地址信息1,网络节点用圆形图形表示,关系节点用椭圆形图形表示。在该网络结构图中,保单标识信息1对应的保单中投保人的身份证号1与保单标识信息2对应的保单中受益人的身份证号1相同,因此,身份证号1为保单标识信息1和保单标识信息2之间的关系节点;保单标识信息1对应的保单中被保险人的家庭地址信息1与保单标识信息2对应的保单中投保人的家庭地址信息1相同,同时保单标识信息1对应的保单中投保人的家庭地址信息1与保单标识信息3对应的保单的中受益人的家庭地址信息1相同,同时保单标识信息1对应的保单中被保险人的家庭地址信息1与保单标识信息4对应的保单中受益人的家庭地址信息1相同,因此,家庭地址信息1为保单标识信息1、保单标识信息2、保单标识信息3、保单标识信息4之间共同的关系节点。

在图2对应的实施例中,通过获取保单信息,得到保单标识信息和属性信息,根据属性信息确定待匹配参数,并针对每个待匹配参数,对保单数据中的保单进行遍历,在具有相同参数值的不同保单之间建立基于该待匹配参数的直接关系,然后以保单标识信息为网络节点,以待匹配参数的参数值为关系节点,将互相具有直接关系的网络节点与建立该直接关系的关系节点进行关联,构建保单关系网络,该保单关系网络中体现了不同保单之间存在的关联性,通过分析该关联性能够精准高效的进行团伙骗保风险的识别和预警,从而提高团伙骗保风险的识别率。

在以上实施例的基础之上,下面通过一个具体的实施例对步骤S30中提及的根据样本数据构建评分模型的具体实现方法进行详细说明。

请参阅图4,图4示出了本发明实施例提供的步骤S30的具体实现流程,详述如下:

S31:根据预设的N个风险指标,从样本数据中采集满足每个风险指标的样本数,其中,N为正整数。

在本发明实施例中,预先进行设置N个对团伙欺诈特征有影响的风险指标,其中,N为正整数,风险指标的数量可以根据应用的需要进行设置,风险指标根据保险环境和保险类型的不同而有不同的设定,具体可以根据实际应用进行设置,此处不做限制。

对样本数据中的每一个历史团伙保单案件的信息按照预设的风险指标进行统计,得到历史团伙保单案件中满足每个风险指标的样本数。

例如,风险指标可以根据历史团伙保单案件中的欺诈特征设置为120个,风险指标可以是身份证号相同案件、客户是黑名单案件和不同案件就诊医院和就诊科室相同案件等,第一个历史团伙保单案件中身份证号相同案件为4,客户是黑名单案件为1,不同案件就诊医院和就诊科室相同案件为5。

S32:对每个风险指标及其对应的样本数,使用决策树算法筛选出目标风险指标以及每个目标风险指标对应的评分条件。

在本发明实施例中,根据步骤S31得到的历史团伙保单案件中满足每个风险指标的样本数,进行合理分段处理,该合理分段是指通过对每个风险指标的样本数进行分段,使得该风险指标的信息增益最大。

具体地,分段方式为将每个风险指标的样本数按照数值大小顺序进行排列,每两个相邻数值的之间都可做为分段点,从第一个分段点到最后一个分段点,分别对样本数据进行分段并按照该分段计算风险指标的信息增益,选取具有最大信息增益的点作为该风险指标的合理分段点,其信息增益为该风险指标的最大信息增益。

按照如下公式进行计算风险指标的信息增益:

其中,D为历史团伙保单案件,info(D)为历史团伙保单案件的信息熵,m为历史团伙保单案件是否为团伙保单欺诈案件的取值,Pi为历史团伙保单案件取值为i时的概率,infoL(D)为风险指标进行分段的信息熵,P(xi)为样本数据在风险指标的分段范围内的数据占样本数据的比例,gain(L)为风险指标的信息增益。

通过公式(1)进行计算每个风险指标的信息增益,并获取每个风险指标的最大信息增益,以样本数据中团伙保单欺诈案件和团伙保单非欺诈案件的数量作为根节点,以每个风险指标的合理分段范围为分支,合理分段范围内团伙保单欺诈案件和团伙保单非欺诈案件的数量为分支节点,生成决策树,其中,决策树从上到下的分支对应风险指标的信息增益大小的顺序从大到小生成。

根据决策树树形结构的特点,越靠近根节点则风险指标重要性越大,越远离根节点则重要性越小,通过预设信息增益阈值,筛选出大于信息增益阈值的目标风险指标以及每个目标风险指标对应的评分条件,若风险指标的信息增益小于预设的信息增益阈值,则将影响团伙保单风险评估准确性的分支剪除,提高对团伙保单的风险评估准确率。其中,该信息增益阈值可以根据具体应用需要进行设置,此处不做限制。

S33:根据目标风险指标和评分条件,对样本数据进行机器学习,得到每个评分条件的重要性系数。

在本发明实施例中,对样本数据、目标风险指标和评分条件使用逻辑回归算法进行机器学习,将目标风险指标和评分条件设置为自变量,将样本数据是否为团伙保单欺诈案件设置为因变量,根据目标风险指标预测历史团伙保单案件是否为团伙保单欺诈案件的概率,通过多元回归分析,得到自变量对因变量的影响程度,获取每个目标风险指标与历史团伙保单案件中是否为团伙保单欺诈案件的相关性,得出每个目标风险指标以及对应评分条件的重要性系数。

S34:将目标风险指标作为评分项,将重要性系数按照预设的转换方式进行转换后得到的系数值作为评分条件的评分值,得到评分模型。

在本发明实施例中,根据步骤S33得到每个目标风险指标以及对应评分条件的重要性系数,按照预设的转换方式进行转换,得到对应的系数值,该转换方式可以是对重要性系数等比缩放预设的倍数,例如放大100倍,转换方式还可以是按照目标风险指标对团伙保单案件评估的影响程度进行转换,将重要性系数装换为具体的系数值,以目标风险指标作为评分模型的评分项,以转换后的系数值作为评分项对应评分条件的评分值,生成评分模型,用于预测保单关系网络存在团伙保单欺诈案件的可能性。

在图4对应的实施例中,通过预设对团伙欺诈特征有影响的风险指标,使用决策树算法筛选出目标风险指标以及每个目标风险指标对应的评分条件,并将影响团伙保单风险评估准确性的分支剪除,从而提高对团伙保单的风险评估准确率,使用逻辑回归算法对样本数据、目标风险指标和评分条件进行机器学习,通过多元回归分析,获取每个目标风险指标与历史团伙保单案件中是否为团伙保单欺诈案件的相关性,并以目标风险指标与对应的评分条件的评分值构建保单评估模型,用于预测保单关系网络存在团伙保单欺诈案件的可能性,提高对团伙保单风险评估的效率。

在图1对应的实施例的基础之上,下面通过一个具体的实施例对步骤S40中提及的使用评分模型对保单关系网络进行评估,得到评估总分的具体实现方法进行详细说明。详述如下:

按照预设条数的评分项和每条评分项在不同评分条件下的评分值逐条对保单关系网络进行评估,得到保单关系网络在每条评分项的评估分值,并按照公式(2)计算保单关系网络的评估总分:

其中,S为评估总分,n为评分模型的评分项条数,Ri为保单关系网络在第i条评分项的评估分值。

在本发明实施例中,通过按照评分模型的评分项逐条对保单关系网络进行评估,能够全面地对保单关系网络中的保单欺诈风险进行评估,并根据每条评估分值通过公式(2)计算得到评估总分,直接输出对保单关系网络的风险识别结果,从而辅助相关人员精准高效地识别团伙骗保风险,提高对保单风险识别的效率和团伙骗保风险的识别率。

在图1对应的实施例的基础之上,下面通过一个具体的实施例对步骤S50中提及的根据评估总分分析该保单关系网络中的保单欺诈风险的具体实现方法进行详细说明。

请参阅图5,图5示出了本发明实施例提供的步骤S50的具体实现流程,详述如下:

S51:若评估总分大于预设的第一风险阈值,则对保单关系网络进行定期监控。

在本发明实施例中,根据评分模型每条评分项以及每条评分项在不同评分条件下的评分值,结合历史保单案件中的团伙保单欺诈案件的信息,进行预设第一风险阈值,第一风险阈值的具体数值可以根据实际应用需要进行设置,此处不做限制,例如,评分模型的最高分为100分,第一风险阈值可以设为70分。

具体地,根据步骤S40计算得到保单关系网络的评估总分,对保单关系网络中的保单欺诈风险进行分析,若评估总分大于预设的第一风险阈值,则确认该保单关系网络存在保单欺诈风险,对该保单关系网络进行定期监控,并将该保单关系网络的信息以及在评分模型每条评分项的得分发送给相关监控人员进行重点关注。

需要说明的是,定期监控包括实时监控保单关系网络中的保单变化情况和加强理赔审核过程的监控,若监控到保单发现变化,例如保单信息发生变更或者新增保单等,则及时将变化情况输出,提醒相关监控人员关注。

S52:若评估总分大于预设的第二风险阈值,则启动紧急风险控制措施,其中,第二风险阈值大于第一风险阈值。

在本发明实施例中,根据评分模型每条评分项以及每条评分项在不同评分条件下的评分值,结合历史保单案件中的团伙保单欺诈案件的信息,进行预设第二风险阈值,第二风险阈值的具体数值可以根据实际应用需要进行设置,此处不做限制,例如,评分模型的最高分为100分,第二风险阈值可以设为90分。

具体地,根据步骤S40计算得到保单关系网络的评估总分,对保单关系网络中的保单欺诈风险进行分析,若评估总分大于预设的第二风险阈值,则确认该保单关系网络的保单欺诈风险等级最高,并启动紧急风险控制措施,及时对当前情况进行处理,以免造成更大的经济损失。例如,紧急风险控制措施具体可以是报警请求协助、停止保险理赔程序的进行或者请求银行对已经理赔的资金进行冻结。

在图5对应的实施例中,通过使用评分模型对保单关系网络进行评估,将得到的评估总分与预设风险阈值进行比较分析,能够根据分析结果及时发现该保单关系网络是否存在团伙骗保风险,根据不同的保单欺诈风险等级采取相应的风险监控管理措施,有效地增强了风险管控能力,以便能够及时减少保单欺诈案件发生的可能性,或者减少保单欺诈案件发生时造成的损失,从而降低保险公司承担的骗保风险。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

实施例2

对应于实施例1中的保单风险评估方法,图6示出与实施例1所示的保单风险评估方法一一对应的保单风险评估装置,为了便于说明,仅示出了与本发明实施例相关的部分。

如图6所示,该保单风险评估装置包括保单关系网络构建模块61、保单样本数据采集模块62、保单评估模型构建模块63、保单关系网络评估模块64和保单欺诈风险分析模块65。各功能模块详细说明如下:

保单关系网络构建模块61,用于构建保单关系网络,其中,保单关系网络由相互之间通过相同的属性信息进行关联的保单生成;

保单样本数据采集模块62,用于获取历史保单案件信息,将历史保单案件信息作为样本数据;

保单评估模型构建模块63,用于根据样本数据构建评分模型,其中,评分模型包含预设条数的评分项和每条评分项在不同评分条件下的评分值;

保单关系网络评估模块64,用于使用评分模型对保单关系网络进行评估,得到评估总分;

保单欺诈风险分析模块65,用于根据评估总分分析保单关系网络中的保单欺诈风险。

进一步地,保单关系网络构建模块61包括:

保单信息获取单元611,用于从保单数据库中获取每个保单的保单信息,其中,保单信息包括保单标识信息和保单对象的属性信息,保单标识信息用于唯一标识保单;

保单信息匹配单元612,用于根据属性信息确定待匹配参数;

保单关系建立单元613,用于针对每个待匹配参数,对保单进行遍历,在具有相同参数值的不同保单之间建立基于该待匹配参数的直接关系,参数值用于标识直接关系;

保单信息关联单元614,用于以保单标识信息为网络节点,以待匹配参数的参数值为关系节点,将互相具有直接关系的网络节点与建立该直接关系的关系节点进行关联,构建保单关系网络;

进一步地,保单评估模型构建模块63包括:

风险指标预设单元631,用于根据预设的N个风险指标,从样本数据中采集满足每个风险指标的样本数,其中,N为正整数;

风险指标筛选单元632,用于对每个风险指标及其对应的样本数,使用决策树算法筛选出目标风险指标以及每个目标风险指标对应的评分条件;

样本数据训练单元633,用于根据目标风险指标和评分条件,对样本数据进行机器学习,得到每个评分条件的重要性系数;

评分模型生成单元634,用于将目标风险指标作为评分项,将重要性系数按照预设的转换方式进行转换后得到的系数值作为评分条件的评分值,得到评分模型。

进一步地,保单关系网络评估模块64包括:

模型评分单元641,用于按照预设条数的评分项和每条评分项在不同评分条件下的评分值逐条对保单关系网络进行评估,得到保单关系网络在每条评分项的评估分值;

评分汇总单元642,用于按照如下公式计算保单关系网络的评估总分:

其中,S为评估总分,n为评分模型的评分项条数,Ri为保单关系网络在第i条评分项的评估分值。

进一步地,保单欺诈风险分析模块65包括:

第一预警单元651,用于若评估总分大于预设的第一风险阈值,则对保单关系网络进行定期监控;

第二预警单元652,用于若评估总分大于预设的第二风险阈值,则启动紧急风险控制措施,其中,第二风险阈值大于第一风险阈值。

本实施例提供的一种保单风险评估装置中各模块实现各自功能的过程,具体可参考前述方法实施例1的描述,此处不再赘述。

实施例3

本实施例提供一计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现实施例1中保单风险评估方法,为避免重复,这里不再赘述。或者,该计算机程序被处理器执行时实现实施例2中保单风险评估装置中各模块/单元的功能,为避免重复,这里不再赘述。

实施例4

图7是本发明一实施例提供的终端设备的示意图。如图7所示,该实施例的终端设备7包括:处理器70、存储器71以及存储在存储器71中并可在处理器70上运行的计算机程序72,例如保单风险评估程序。处理器70执行计算机程序72时实现上述各个保单风险评估方法实施例中的步骤,例如图1所示的步骤S10至S50。或者,处理器70执行计算机程序72时实现上述各装置实施例中各模块/单元的功能,例如图6所示模块61至65的功能。

示例性的,计算机程序72可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器71中,并由处理器70执行,以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序72在终端设备7中的执行过程。计算机程序72可以被分割成保单关系网络构建模块、保单样本数据采集模块、保单评估模型构建模块、保单关系网络评估模块和保单欺诈风险分析模块,各模块详细说明如下:

保单关系网络构建模块,用于构建保单关系网络,其中,保单关系网络由相互之间通过相同的属性信息进行关联的保单生成;

保单样本数据采集模块,用于获取历史保单案件信息,将历史保单案件信息作为样本数据;

保单评估模型构建模块,用于根据样本数据构建评分模型,其中,评分模型包含预设条数的评分项和每条评分项在不同评分条件下的评分值;

保单关系网络评估模块,用于使用评分模型对保单关系网络进行评估,得到评估总分;

保单欺诈风险分析模块,用于根据评估总分分析保单关系网络中的保单欺诈风险。

进一步地,保单关系网络构建模块包括:

保单信息获取单元,用于从保单数据库中获取每个保单的保单信息,其中,保单信息包括保单标识信息和保单对象的属性信息,保单标识信息用于唯一标识保单;

保单信息匹配单元,用于根据属性信息确定待匹配参数;

保单关系建立单元,用于针对每个待匹配参数,对保单进行遍历,在具有相同参数值的不同保单之间建立基于该待匹配参数的直接关系,参数值用于标识直接关系;

保单信息关联单元,用于以保单标识信息为网络节点,以待匹配参数的参数值为关系节点,将互相具有直接关系的网络节点与建立该直接关系的关系节点进行关联,构建保单关系网络;

进一步地,保单评估模型构建模块包括:

风险指标预设单元,用于根据预设的N个风险指标,从样本数据中采集满足每个风险指标的样本数,其中,N为正整数;

风险指标筛选单元,用于对每个风险指标及其对应的样本数,使用决策树算法筛选出目标风险指标以及每个目标风险指标对应的评分条件;

样本数据训练单元,用于根据目标风险指标和评分条件,对样本数据进行机器学习,得到每个评分条件的重要性系数;

评分模型生成单元,用于将目标风险指标作为评分项,将重要性系数按照预设的转换方式进行转换后得到的系数值作为评分条件的评分值,得到评分模型。

进一步地,保单关系网络评估模块包括:

模型评分单元,用于按照预设条数的评分项和每条评分项在不同评分条件下的评分值逐条对保单关系网络进行评估,得到保单关系网络在每条评分项的评估分值;

评分汇总单元,用于按照如下公式计算保单关系网络的评估总分:

其中,S为评估总分,n为评分模型的评分项条数,Ri为保单关系网络在第i条评分项的评估分值。

进一步地,保单欺诈风险分析模块包括:

第一预警单元,用于若评估总分大于预设的第一风险阈值,则对保单关系网络进行定期监控;

第二预警单元,用于若评估总分大于预设的第二风险阈值,则启动紧急风险控制措施,其中,第二风险阈值大于第一风险阈值。

终端设备7可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。终端设备可包括,但不仅限于,处理器70、存储器71。本领域技术人员可以理解,图7仅仅是终端设备7的示例,并不构成对终端设备7的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如终端设备7还可以包括输入输出设备、网络接入设备、总线等。

所称处理器70可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器71可以是终端设备7的内部存储单元,例如终端设备7的硬盘或内存。存储器71也可以是终端设备7的外部存储设备,例如终端设备7上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器71还可以既包括终端设备7的内部存储单元也包括外部存储设备。存储器71用于存储计算机程序以及终端设备所需的其他程序和数据。存储器71还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。

以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1