单位类型确定方法及相关产品与流程

文档序号:17188086发布日期:2019-03-22 21:37阅读:271来源:国知局
单位类型确定方法及相关产品与流程

本申请涉及数据处理技术领域,主要涉及了一种单位类型确定方法及相关产品。



背景技术:

随着社会经济的发展,国家为了给老百姓提供更好的医保环境,医保政策越来越好。然而,总有一些人通过各种各样的手段来骗取医保。当前的医疗保险,行业整体业务经营与管理比较粗放,缺乏风险把控;粗放的理赔服务和条款赔付,缺乏对疾病治疗的深度分析、医疗费用的风险把控、医疗服务的合理性判断,导致大量欺诈、不合理医疗,严重损害了其他真正需要医保救治人的权益,给危害了国家医疗保险制度,如何避免骗取医保基金,提高医保基金的风控是本领域技术人员待解决的技术问题。



技术实现要素:

本申请实施例提供了一种单位类型确定方法及相关产品,可提高识别可疑参保单位的准确率。

第一方面,本申请实施例提供一种单位类型确定方法,其中:

从预设数据库中确定与目标参保单位关联的关联参保单位;

从所述预设数据库中分别获取所述目标参保单位和与所述关联参保单位的基本信息集,以得目标基本信息集和关联基本信息集;

分别确定所述目标基本信息集和所述关联基本信息集中每一基本信息集与多个预设特征维度中每一预设特征维度对应的特征信息,以得到目标特征信息集和关联特征信息集;

将所述目标特征信息集和所述关联特征信息集输入至预先建立的识别模型,以得到所述目标参保单位的骗保概率;

当所述骗保概率大于第一阈值时,确定所述目标参保单位为骗保单位。

第二方面,本申请实施例提供一种单位类型确定装置,其中:

确定单元,用于从预设数据库中确定与目标参保单位关联的关联参保单位;

获取单元,用于从所述预设数据库中分别获取所述目标参保单位和与所述关联参保单位的基本信息集,以得目标基本信息集和关联基本信息集;

所述确定单元,还用于分别确定所述目标基本信息集和所述关联基本信息集中每一基本信息集与多个预设特征维度中每一预设特征维度对应的特征信息,以得到目标特征信息集和关联特征信息集;将所述目标特征信息集和所述关联特征信息集输入至预先建立的识别模型,以得到所述目标参保单位的骗保概率;当所述骗保概率大于第一阈值时,确定所述目标参保单位为骗保单位。

第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,所述程序包括用于如第一方面中所描述的部分或全部步骤的指令。

第四方面,本申请实施例提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。

第五方面,本申请实施例提供了一种计算机程序产品,其中,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。

实施本申请实施例,将具有如下有益效果:

采用了上述的单位类型确定方法及相关产品之后,从预设数据库中确定与目标参保单位关联的关联参保单位,再获取所述目标参保单位的目标基本信息集和所述关联参保单位的关联基本信息集,确定所述目标基本信息集与多个预设特征维度中每一预设特征维度对应的特征信息以得到目标特征信息集,确定所述关联基本信息集与所述多个预设特征维度中每一预设特征维度对应的特征信息以得到关联特征信息集,将所述目标特征信息集和所述关联特征信息集输入至识别模型以得到所述目标参保单位的骗保概率,当所述骗保概率大于第一阈值时,确定该目标参保单位为骗保单位,如此,根据一个预先建立的识别模型对目标参保单位的目标特征信息集和与目标参保单位关联的关联参保单位的关联特征信息集进行识别,提高了识别参保单位是否为骗保单位的准确性,便于提高风险识别能力。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

其中:

图1为本申请实施例提供的一种单位类型确定方法的流程示意图;

图2为本申请实施例提供的一种单位类型确定装置的结构示意图;

图3为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。根据本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

下面对本申请实施例进行详细介绍。

参保单位是指报告期内己在统筹范围内办理了社会保险登记手续的各类单位。即使是非独立法人单位,如分支机构和办事处,也是可以办理社保登记开户的。实际办理中需要上级授权委托书。然而,总有一些参保单位通过各种各样的手段来骗取医保。根据此,本申请实施例提供了一种单位类型确定方法及相关产品,可提高识别可疑参保单位的准确率。

请参照图1,本申请实施例提供一种单位类型确定方法的流程示意图。该单位类型确定方法应用于电子设备。本申请实施例所涉及到的电子设备可以包括各种具有无线通信功能的手持设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(userequipment,ue),移动台(mobilestation,ms),终端设备(terminaldevice)等等。为方便描述,上面提到的设备统称为电子设备。

具体的,如图1所示,一种单位类型确定方法,应用于电子设备,其中:

s101:从预设数据库中确定与目标参保单位关联的关联参保单位。

在本申请实施例中,预设数据库可以预先存储于电子设备中,或者,存储在云端服务器中,电子设备通过访问云端服务器获取该预设数据库。该预设数据库可根据医保服务平台对应的存储数据得到,也可根据可访问医保服务平台的第三方应用所登录的参保成员的数据得到,可包括所有的参保单位,也可包括参保时长超过一个指定时长的参保单位,还可包括参考单位类型与目标参保单位一致的参保单位,在此不做限定。

该预设数据库中以参保单位的标识信息对该参保单位的存储信息进行存储,该标识信息可以是单位代码、工商备注号码等,参保成员对应的标识信息可以是姓名、身份证号、社保账号、联系电话等。该存储信息可包括基本信息集和骗保结果,还可包括报销记录、缴费记录等,在此不做限定。

本申请对于获取预设数据库的方法不做限定,在一种实现方式中,所述方法还包括:确定所述目标参保单位的参保参数;获取与所述参保参数匹配的参保单位以得到多个匹配参保单位;根据所述多个匹配参保单位中每一参保单位对应的存储信息以得到所述预设数据库。

其中,参保参数包括但不限于以下一项:参保地区、参保时长、参保人数、参保单位类型。

可以理解,确定所述目标参保单位的参保参数,然后根据其参保参数确定多个匹配成功的匹配参保单位,再由各个匹配参保单位对应的存储信息以得到所述预设数据库。也就是说,以目标参保单位的参保参数查找对应的预设数据库,由于目标参保单位对应的目标特征信息集会被输入至根据预设数据库建立的识别模型,从而便于提高确定骗保概率的准确性。

在本申请实施例中,关联参保单位可以是与目标参保单位中的目标参保成员关联的参保成员(例如:配偶、亲属、朋友等)所缴纳医保的参保单位,也可以是与该目标参保成员具有类似身份信息的参保成员所缴纳医保的参保单位,还可以是与目标参保单位的法人代表或其他负责人所在的其他单位等等。

本申请对于确定关联参保单位的方法不做限定,可从预设数据库中输入的基本信息进行确定,也可从第三方应用上与目标参保成员之间的联系信息进行确定等,其中,第三方应用可以是即时聊天应用、邮件应用等,与此对应的联系信息可以是文字、语音、图像或邮件等,本申请均在此不做限定。

在一种实现方式中,所述目标参保单位包括多个目标参保成员,所述从预设数据库中确定与目标参保单位关联的关联参保单位包括:从所述预设数据库中确定所述多个目标参保成员中每一目标参保成员对应的身份信息以得到多个身份信息;根据所述多个身份信息确定关联参保成员;确定所述关联参保成员所在的参保单位为所述关联参保单位。

其中:身份信息包括该目标参保成员的年龄、地区、兴趣等,还可包括目标参保成员的配偶、亲属、联系人等。每一身份信息对应一个目标参保成员,本申请对于根据身份信息确定关联参保成员的方法不做限定,可以根据年龄、地域、兴趣、联系人等各个维度查找关联参考成员。

可以理解,在预设数据库中获取各个目标参保成员对应的身份信息,并根据各个目标参保成员的身份信息确定多个关联参保成员,再由各个关联参保成员所在的参保单位作为关联参保单位,即可根据该关联参保单位对目标参保单位进行识别,提高了识别参保单位是否为骗保单位的准确性。

s102:从所述预设数据库中分别获取所述目标参保单位和与所述关联参保单位的基本信息集以得目标基本信息集和关联基本信息集。

在本申请实施例中,参保单位的基本信息集包括但不限于以下一项:参保人数、就诊人数、参保成员的年龄集、就诊机构集、诊断信息集、开药信息集。目标参保单位为待识别是否为骗保单位的医保单位,目标基本信息集为目标参保单位对应的基本信息集,关联基本信息集为关联参保单位对应的基本信息集。

s103:分别确定所述目标基本信息集和所述关联基本信息集中每一基本信息集与多个预设特征维度中每一预设特征维度对应的特征信息以得到目标特征信息集和关联特征信息集。

在本申请实施例中,预设特征维度包括开取药品与诊断信息之间的关联关系、就诊比例、参保成员对应的群体、就诊机构分布、就诊时间分布等,在此不做限定。

具体的,就诊比例为就诊人数与参保人数之间的比值,进一步的可包括各个年龄段中就诊人数与参保人数之间的比值;参保成员对应的群体包括以年龄段、学校、学历、专业、职业等分类得到的群体;就诊机构分布包括各个就诊机构的就诊人数之比、集中开药地点、异常就诊机构等;就诊时间分布包括集中开药时段、异常就诊时间等;开取药品与诊断信息之间的关联关系包括合理关系和异常关系等。

本申请对于获取预设特征维度的方法不做限定,在一种实现方式中,所述方法还包括:从所述预设数据库中查找骗保结果为骗保单位的参保单位以得到多个第三参保单位;获取所述多个第三参保单位中每一参保单位对应的基本信息集以得到多个参考基本信息集;获取所述多个参考基本信息集对应的特征信息以得到多个特征信息;对所述多个特征信息进行分类以得到多类特征信息集;统计所述多类特征信息集中每一类特征信息的数量以得到多个数量;确定所述多个数量中大于第二阈值的数量对应的特征信息集的类型为所述预设特征维度。

在本申请实施例中,对于第二阈值不做限定,第二阈值可以是多类特征信息对应的多个数量的平均值,或者是各个数量进行加权平均。

可以理解,从预设数据库中查找骗保结果为骗保单位对应的多个第三参保单位,再获取各个第三参保单位的基本信息集以得到多个参考基本信息集,再由多个参考基本信息集确定多个特征信息,对多个特征信息进行分类以得到多类特征信息集,并确定每一类特征信息对应的参保单位的数量,然后,从多类特征信息中选取大于第二阈值的特征信息,由该类特征信息对应的类型确定预设特征维度,如此,从大数据的方向选取其中符合骗保单位的基本信息,并进行分析,可提高预设特征维度的准确性,便于提高确定目标参保单位是否为骗保单位的准确性。

在本申请实施例中,目标特征信息集中包括目标基本信息集与各个预设特征维度之间对应的目标特征信息,目标特征信息集包括多个目标特征信息,每一目标特征信息对应一个预设特征维度。与此对应的,关联特征信息集中包括关联基本信息集与各个预设特征维度之间对应的关联特征信息,关联特征信息集包括多个关联特征信息,每一关联特征信息对应一个预设特征维度。

可以理解,根据目标基本信息集确定与各个预设特征维度对应的特征信息以得到目标特征信息集,根据关联基本信息集确定与各个预设特征维度对应的特征信息以得到关联特征信息集,可提高计算的准确性和计算效率,从而便于提高确定该目标参保单位是否为骗保单位的准确性。

本申请对于如何确定目标特征信息的方法不做限定,所述目标参保单位包括多个目标参保成员,在一种实现方式中,根据所述就诊人数和所述参保人数之间的第一比值确定所述就诊比例;将所述多个目标参保成员按照年龄、学校、学历、专业、职业、就诊机构进行分类以得到多个目标参保成员对应的群体;对所述多个目标参保成员的就诊机构进行分析以得到就诊机构分布;对所述多个目标参保成员的就诊时间进行分析以得到就诊时间分布;对所述多个目标参保成员的诊断信息和开药信息进行分析以得到开取药品与诊断信息之间的关联关系。

可以理解,分别确定就诊比例、参保成员对应的群体、就诊机构分部、就诊时间分部,开取药品与诊断信息之间的关联关系,如此,可依据不同的特征信息识别目标参保单位是否为骗保单位。

进一步的,在一种实现方式中,获取所述就诊机构集中每一就诊机构的就诊人数和所述参保人数之间的比值以得到多个目标比值;根据所述多个目标比值确定集中就诊机构;从所述诊断信息集中获取所述集中就诊机构对应的多个目标诊断信息,从所述开药信息集中获取所述多个目标诊断信息中每一目标诊断信息对应的开药信息以得到多个目标开药信息;确定所述多个目标诊断信息中每一目标诊断信息对应的就诊对象的指定就诊机构以得到多个指定就诊机构;获取所述集中就诊机构和所述多个指定就诊机构中每一指定就诊机构之间的距离以得到多个距离;根据所述多个距离确定所述集中就诊机构的第一合理值;根据所述多个目标开药信息和所述多个目标诊断信息确定开取的异常药品;获取所述异常药品的数量或金额;根据所述数量或所述金额确定所述集中就诊机构的第二合理值;根据所述第一合理值和所述第二合理值确定所述开取药品与诊断信息之间的关联关系。

其中,集中就诊机构为目标比值大于一个阈值的就诊机构;指定就诊机构为该就诊对象对应的区域所分配的就诊机构,例如:就诊对象所在的家庭地址位于南岸区,则指定就诊机构为南岸区人民医院。进一步的,可根据诊断信息对应的挂号种类确定该区域对应的多个医院,再由各个医院和家庭地址之间的距离确定指定就诊机构。

异常药品为诊断信息与开取药品之间的关联性较小的药品,可根据诊断信息对应的药品类型和开取药品的药品类型之间的关联值,当该关联值小于一阈值时,确定异常药品。例如:就诊信息对应胃病类药品,而开取药品为滴眼液,则确定滴眼液为异常药品。

可以理解,获取所述就诊机构集中每一就诊机构的就诊人数和所述参保人数之间的比值以得到多个目标比值,再根据多个目标比值确定集中就诊机构,再从所述诊断信息集中获取所述集中就诊机构对应的多个目标诊断信息,从所述开药信息集中获取所述多个目标诊断信息中每一目标诊断信息对应的开药信息以得到多个目标开药信息,然后获取目标诊断信息对应的指定就诊机构与集中就诊机构之间的距离,由距离确定该集中就诊机构的第一合理值,再获取目标开药信息对应的开取药品中的异常药品的数量或金额,由数量或金额确定集中集中就诊机构的第二合理值,最后由第一合理值和第二合理值确定开取药品与诊断信息之间的关联关系,如此,可根据开取药品与诊断信息之间的关联关系确定目标参保单位是否异常,经过集中就诊机构对应的第一合理值和第二合理值确定其关联关系,可进一步提高确定关联关系的准确性。

s104:将所述目标特征信息集和所述关联特征信息集输入至预先建立的识别模型以得到所述目标参保单位的骗保概率。

在本申请实施例中,在本申请实施例中,识别模型用于识别待验证的参保单位是否为骗保单位,是经过大量的数据分析训练得到识别模型,对于识别模型的建立方法不做限定。

在一种实现方式中,所述方法还包括:从所述预设数据库中确定训练参保单位集和验证参保单位集;确定与所述训练参保单位集和所述验证参保单位集中每一参保单位对应的关联参保单位以得到训练关联参保单位集和验证关联参保单位集;根据所述训练参保单位集、所述验证参保单位集、所述训练关联参保单位集和所述验证关联参保单位集中每一参保单位对应的基本信息集,分别获取与所述多个预设特征维度中每一预设特征维度对应的特征信息以得到所述训练参保单位集、所述验证参保单位集、所述训练关联参保单位集和所述验证关联参保单位集中每一参保单位对应的特征信息集;根据所述训练关联参保单位集中每一参保单位包括对应的特征信息集,以及所述训练参保单位集中每一参保单位对应的特征信息集和骗保结果进行分类以得到待验证模型;根据所述验证关联参保单位集中每一参保单位包括对应的特征信息集,以及所述验证参保单位集中每一参保单位对应的特征信息集和骗保结果,对所述待验证模型进行训练以得到所述识别模型。

在本申请实施例中,训练参保单位集包括多个训练参保单位,验证参保单位集包括多个验证参保单位,训练参保单位集和验证参保单位集中每一参保单位包括该参保单位对应的基本信息集和骗保信息。

训练关联参保单位集包括多个与所述多个训练参保单位中至少一个训练参保单位关联的训练关联参保单位,验证关联参保单位集包括多个与所述多个验证参保单位中至少一个验证参保单位关联的验证关联参保单位,训练关联参保单位集和验证关联参保单位集中每一参保单位包括该关联参保单位对应的基本信息集和骗保信息,在本申请中仅采用关联参保单位对应的基本信息集进行验证、验证或测试。

对于获取训练参保单位集、验证参保单位集、训练关联参保单位集和验证关联参保单位集中每一参保单位对应的特征信息集可参照目标参保单位获取目标特征信息集的方法,在此不再赘述。

本申请对于如何训练待验证模型的方法不做限定,可采用逻辑回归或者决策树算法进行分类,从而得到待验证模型。简单来说,待验证模型相当于一个函数,每一个训练特征信息为一个常数,每一个训练特征信息乘以一个参数可得到对应的骗保结果。

本申请对于如何验证识别模型的方法不做限定,可采用神经网络中常用的训练方法,例如:梯度下降法(gradientdescent)、牛顿算法(newton’smethod)、共轭梯度法(conjugategradient)、准牛顿法(quasi-newtonmethod)、衰减的最小平方法levenberg-marquardt算法等。

以梯度下降法举例来说,将验证参保单位的特征信息集和与该验证参保单位关联的验证关联参保单位的特征信息集输入待验证模型得到一个骗保结果,将该骗保结果与该验证参保单位对应的骗保结果进行匹配,若匹配成功,则输入下一个验证参保单位的特征信息集和与该验证参保单位关联的验证关联参保单位的特征信息集,否则,根据该匹配得到误差函数进行反向运算,从而调整待验证模型,并在最后一个验证参保单位的特征信息集和与该验证参保单位关联的验证关联参保单位的特征信息集匹配成功或反向运算结束之后得到识别模型,从而对待验证模型进行验证,提高了识别模型的准确性。

可以理解,从预设数据库中确定训练参保单位集和验证参保单位集,再确定训练参保单位集和验证参保单位集中每一参保单位对应的关联参保单位以得到训练关联参保单位集和验证关联参保单位集,分别确定所述训练参保单位集、所述验证参保单位集、所述训练关联参保单位集和所述验证关联参保单位集中每一参保单位对应的基本信息集与所述多个预设特征维度中每一预设特征维度对应的特征信息以得到对应的特征信息集,然后,根据所述训练关联参保单位集中每一参保单位对应的特征信息集,以及所述训练参保单位集中每一参保单位对应的特征信息集和骗保结果进行分类得到待验证模型,根据所述验证关联参保单位集中每一参保单位对应的特征信息集,以及所述验证参保单位集中每一参保单位对应的特征信息集和骗保结果,对所述待验证模型进行训练得到所述识别模型。即本申请可以通过训练和验证方法得到识别模型,提高了根据该识别模型识别目标参保单位是否为骗保单位的准确性,便于提高风险识别能力。且依据关联参保单位的骗保结果得到识别模型,可进一步提高根据识别模型确定骗保单位的准确性。

本申请对于确定训练参保单位集和验证参保单位集的方法不做限定,在一种实现方式中,所述预设数据库对应多个第一参保单位,所述从所述预设数据库中确定训练参保单位集和验证参保单位集包括:获取所述多个第一参保单位中每一参保单位的参保参数以得到多个参保参数;从所述多个第一参保单位中选取参保参数满足预设条件的参保单位以得到多个第二参保单位;按照预设比例将所述多个第二参保单位进行分类以得到所述训练参保单位集对应的多个训练参保单位和所述验证参保单位集对应的多个验证参保单位;

本申请对于预设条件不做限定,可以是参保时长大于指定时长,其中,指定时长可以为一年、2年等较长的时间;也可以是参保人数大于指定人数,其中,指定人数可以该参保地区对应的参保总人数的万分之一;也可以是与目标参保单位的参保单位类型或参保地区一致的单位等等。

在一种实现方式中,所述多个第一参保单位包括参考参保单位,所述方法还包括:当所述参保参保单位的参保时长大于指定时长、参保人数大于指定人数、参保单位类型与所述目标参保单位的参保单位类型匹配,且参保低于与所述目标参保单位的参保地区匹配时,确定所述参考参保单位满足所述预设条件。

也就是说,以多个第一参保单位中的参考参保单位为例,当参考参保单位的参保时长、参保人数、参保单位类型和参保地区均满足对应要求时,确定该参考参保单位满足预设条件,即该参考参保单位为第二参保单位,也就是训练参保单位集和验证参保单位集中对应的参保单位。

本申请对于预设比例也不做限定,例如:训练参保单位集和验证参保单位集中参保单位的数量之比为7:3。

可以理解,从预设数据库对应的多个第一参保单位中选取参保参数满足预设条件的参保单位以得到多个第二参保单位,按照预设比例将多个第二参保单位分为训练参保单位集和验证参保单位集,如此,可采用与目标参保单位关联的第二参保单位进行训练和验证,提高了识别模型的准确性,便于提高确定目标参保单位是否为骗保单位的准确性。

在一种实现方式中,所述将所述目标特征信息集和所述关联特征信息集输入至预先建立的识别模型以得到所述目标参保单位的骗保概率包括:根据所述关联特征信息集和所述目标特征信息集确定输入特征信息集;将所述输入特征信息集输入至所述识别模型,以得到所述目标参保单位的骗保概率。

其中,输入特征信息集包括关联特征信息集和目标特征信息集对应的输入特征,如此,将该输入特征信息集输入至识别模型,可提高确定目标参保单位的骗保概率。

本申请对于确定输入特征信息集的方法不做限定,在一种实现方式中,所述根据所述关联特征信息集和所述目标特征信息集确定输入特征信息集包括:根据所述关联基本信息集和所述目标基本信息集确定所述关联参保单位和所述目标参保单位之间的相似度;确定所述关联参保单位和所述目标参保单位之间的关联关系;根据所述关联关系和所述相似度确定所述关联参保单位与所述目标参保单位之间的关联值;根据所述关联值、所述关联特征信息集和所述目标特征信息集确定所述输入特征信息集。

其中,相似度用于描述关联基本信息集和目标基本信息集之间的相似程度。

关联关系用于描述关联参保单位和目标参保单位之间的关系,例如:签订合同的双方单位之间的合同关系,母公司和分公司对应的上下级关系,债务关系等。

关联值可以是大于0的数字,关联值可以用于表示目标参保单位与关联参保单位之间的亲密程度,关联度越大,表示目标参保单位与关联参保单位之间的亲密程度越高。

对于如何根据关联值、关联特征信息集和目标特征信息集确定输入特征信息集的方法不做限定,可获取关联值与关联特征信息集之间的乘积,再获取该乘积与目标特征信息集之间对应特征维度的和值确定输入特征信息集;也可获取关联特征信息集和目标特征信息集之间对应特征维度的和值,再获取该和值与关联值之间的乘积确定输入特征信息集等。

可以理解,确定关联参保单位与目标参保单位之间的相似值和关联关系,再根据关联关系和相似值确定关联参保单位与目标参保单位之间的关联值,然后,根据关联值、关联特征信息集和目标特征信息集确定所述输入特征信息集,如此,对关联特征信息集和目标特征信息集进行归类,便于提高确定目标参保单位的骗保概率。

在一种实现方式中,若所述关联参保单位的个数为多个,所述根据所述关联值、所述关联特征信息集和所述目标特征信息集确定所述输入特征信息集包括:确定与所述多个关联值中每一关联值对应的预设权值以得到多个预设权值;对各个所述关联参保单位对应的关联特征信息集和预设权值进行加权计算以得到目标关联特征信息集;根据所述目标关联特征信息集和所述目标特征信息集确定所述输入特征信息集。

其中,本申请可预先存储不同关联值对应的预设权值,例如:关联值为3,对应的预设权值为0.3;关联值为2,对应的预设权值为0.2;关联值为1,对应的预设权值为0.1。需要说明的是,多个预设权值之间的和为1。

可以理解,当目标参保单位对应多个关联参保单位时,先确定各个关联参保单位与目标参保单位之间的关联值以得到多个关联值,再确定各个关联值对应的预设权值,根据各个关联参保单位对应的关联骗保结果和其对应的关联之的预设权值进行加权计算得到目标关联特征信息集,最后根据目标关联特征信息集和目标特征信息集确定输入特征信息集,如此,由多个关联参保单位确定输入特征信息集,进一步提高了确定输入特征信息集的准确性,便于提高确定目标参保单位的骗保概率。

s105:当所述骗保概率大于第一阈值时,确定所述目标参保单位为骗保单位。

在如图1所示的单位类型确定方法中,从预设数据库中确定与目标参保单位关联的关联参保单位,再获取所述目标参保单位的目标基本信息集和所述关联参保单位的关联基本信息集,确定所述目标基本信息集与多个预设特征维度中每一预设特征维度对应的特征信息以得到目标特征信息集,确定所述关联基本信息集与所述多个预设特征维度中每一预设特征维度对应的特征信息以得到关联特征信息集,将所述目标特征信息集和所述关联特征信息集输入至识别模型以得到所述目标参保单位的骗保概率,当所述骗保概率大于第一阈值时,确定该目标参保单位为骗保单位,如此,根据一个预先建立的识别模型对目标参保单位的目标特征信息集和与目标参保单位关联的关联参保单位的关联特征信息集进行识别,提高了识别参保单位是否为骗保单位的准确性,便于提高风险识别能力。

与图1的实施例一致,请参照图2,图2是本申请实施例提供的一种单位类型确定装置的结构示意图,所述装置应用于电子设备。如图2所示,上述单位类型确定装置200包括:

确定单元201用于从预设数据库中确定与目标参保单位关联的关联参保单位;

获取单元202用于从所述预设数据库中分别获取所述目标参保单位和与所述关联参保单位的基本信息集,以得目标基本信息集和关联基本信息集;

所述确定单元201还用于分别确定所述目标基本信息集和所述关联基本信息集中每一基本信息集与多个预设特征维度中每一预设特征维度对应的特征信息,以得到目标特征信息集和关联特征信息集;将所述目标特征信息集和所述关联特征信息集输入至预先建立的识别模型,以得到所述目标参保单位的骗保概率;当所述骗保概率大于第一阈值时,确定所述目标参保单位为骗保单位。

可以理解,从预设数据库中确定与目标参保单位关联的关联参保单位,再获取所述目标参保单位的目标基本信息集和所述关联参保单位的关联基本信息集,确定所述目标基本信息集与多个预设特征维度中每一预设特征维度对应的特征信息以得到目标特征信息集,确定所述关联基本信息集与所述多个预设特征维度中每一预设特征维度对应的特征信息以得到关联特征信息集,将所述目标特征信息集和所述关联特征信息集输入至识别模型以得到所述目标参保单位的骗保概率,当所述骗保概率大于第一阈值时,确定该目标参保单位为骗保单位,如此,根据一个预先建立的识别模型对目标参保单位的目标特征信息集和与目标参保单位关联的关联参保单位的关联特征信息集进行识别,提高了识别参保单位是否为骗保单位的准确性,便于提高风险识别能力。

在一个可能的示例中,在所述将所述目标特征信息集和所述关联特征信息集输入至预先建立的识别模型,以得到所述目标参保单位的骗保概率方面,所述确定单元201具体用于根据所述关联特征信息集和所述目标特征信息集确定输入特征信息集;将所述输入特征信息集输入至所述识别模型,以得到所述目标参保单位的骗保概率。

在一个可能的示例中,在所述根据所述关联特征信息集和所述目标特征信息集确定输入特征信息集方面,所述确定单元201具体用于根据所述关联基本信息集和所述目标基本信息集确定所述关联参保单位和所述目标参保单位之间的相似度;确定所述关联参保单位和所述目标参保单位之间的关联关系;根据所述关联关系和所述相似度确定所述关联参保单位与所述目标参保单位之间的关联值;根据所述关联值、所述关联特征信息集和所述目标特征信息集确定所述输入特征信息集。

在一个可能的示例中,所述目标参保单位包括多个目标参保成员,在所述从预设数据库中确定与目标参保单位关联的关联参保单位方面,所述确定单元201具体用于从所述预设数据库确定所述多个目标参保成员中每一目标参保成员对应的身份信息,以得到多个身份信息;根据所述多个身份信息确定关联参保成员;确定所述关联参保成员所在的参保单位为所述关联参保单位。

在一个可能的示例中,所述确定单元201还用于从所述预设数据库中确定训练参保单位集和验证参保单位集,所述训练参保单位集和所述验证参保单位集中每一参保单位包括对应的基本信息集和骗保结果;确定与所述训练参保单位集和所述验证参保单位集中每一参保单位对应的关联参保单位,以得到训练关联参保单位集和验证关联参保单位集,所述训练关联参保单位集和所述验证关联参保单位集中每一参保单位包括对应的基本信息集;根据所述训练参保单位集、所述验证参保单位集、所述训练关联参保单位集和所述验证关联参保单位集中每一参保单位对应的基本信息集,分别获取与所述多个预设特征维度中每一预设特征维度对应的特征信息,以得到所述训练参保单位集、所述验证参保单位集、所述训练关联参保单位集和所述验证关联参保单位集中每一参保单位对应的特征信息集;

所述装置200还包括:

训练单元203用于根据所述训练关联参保单位集中每一参保单位包括对应的特征信息集,以及所述训练参保单位集中每一参保单位对应的特征信息集和骗保结果进行分类,以得到待验证模型;

验证单元204用于根据所述验证关联参保单位集中每一参保单位包括对应的特征信息集,以及所述验证参保单位集中每一参保单位对应的特征信息集和骗保结果,对所述待验证模型进行训练,以得到所述识别模型。

在一个可能的示例中,所述预设数据库对应多个第一参保单位,在所述从所述预设数据库中确定训练参保单位集和验证参保单位集方面,所述确定单元201具体用于获取所述多个第一参保单位中每一参保单位的参保参数,以得到多个参保参数;从所述多个第一参保单位中选取参保参数满足预设条件的参保单位,以得到多个第二参保单位;按照预设比例将所述多个第二参保单位进行分类,以得到所述训练参保单位集对应的多个训练参保单位和所述验证参保单位集对应的多个验证参保单位;从所述预设数据库中确定与所述多个训练参保单位和所述多个验证参保单位对应的存储信息,以得到所述训练参保单位集和所述验证参保单位集。

在一个可能的示例中,所述获取单元202还用于从所述预设数据库中查找骗保结果为骗保单位的参保单位,以得到多个第三参保单位;获取所述多个第三参保单位中每一参保单位对应的基本信息集,以得到多个参考基本信息集;获取所述多个参考基本信息集对应的特征信息,以得到多个特征信息;对所述多个特征信息进行分类,以得到多类特征信息集;统计所述多类特征信息集中每一类特征信息的数量,以得到多个数量;将所述多个数量中大于第二阈值的数量对应的特征信息集的类型作为所述预设特征维度。

与图1的实施例一致,请参照图3,图3是本申请实施例提供的一种电子设备的结构示意图。如图3所示,该电子设备300包括处理器310、存储器320、通信接口330以及一个或多个程序340,其中,上述一个或多个程序340被存储在上述存储器320中,并且被配置由上述处理器310执行,上述程序340包括用于执行以下步骤的指令:

从预设数据库中确定与目标参保单位关联的关联参保单位;

从所述预设数据库中分别获取所述目标参保单位和与所述关联参保单位的基本信息集,以得目标基本信息集和关联基本信息集;

分别确定所述目标基本信息集和所述关联基本信息集中每一基本信息集与多个预设特征维度中每一预设特征维度对应的特征信息,以得到目标特征信息集和关联特征信息集;

将所述目标特征信息集和所述关联特征信息集输入至预先建立的识别模型,以得到所述目标参保单位的骗保概率;

当所述骗保概率大于第一阈值时,确定所述目标参保单位为骗保单位。

可以理解,从预设数据库中确定与目标参保单位关联的关联参保单位,再获取所述目标参保单位的目标基本信息集和所述关联参保单位的关联基本信息集,确定所述目标基本信息集与多个预设特征维度中每一预设特征维度对应的特征信息以得到目标特征信息集,确定所述关联基本信息集与所述多个预设特征维度中每一预设特征维度对应的特征信息以得到关联特征信息集,将所述目标特征信息集和所述关联特征信息集输入至识别模型以得到所述目标参保单位的骗保概率,当所述骗保概率大于第一阈值时,确定该目标参保单位为骗保单位,如此,根据一个预先建立的识别模型对目标参保单位的目标特征信息集和与目标参保单位关联的关联参保单位的关联特征信息集进行识别,提高了识别参保单位是否为骗保单位的准确性,便于提高风险识别能力。

在一个可能的示例中,在所述将所述目标特征信息集和所述关联特征信息集输入至预先建立的识别模型,以得到所述目标参保单位的骗保概率方面,所述程序340具体用于执行以下步骤的指令:

根据所述关联特征信息集和所述目标特征信息集确定输入特征信息集;

将所述输入特征信息集输入至所述识别模型,以得到所述目标参保单位的骗保概率。

在一个可能的示例中,在所述根据所述关联特征信息集和所述目标特征信息集确定输入特征信息集方面,所述程序340具体用于执行以下步骤的指令:

根据所述关联基本信息集和所述目标基本信息集确定所述关联参保单位和所述目标参保单位之间的相似度;

确定所述关联参保单位和所述目标参保单位之间的关联关系;

根据所述关联关系和所述相似度确定所述关联参保单位与所述目标参保单位之间的关联值;

根据所述关联值、所述关联特征信息集和所述目标特征信息集确定所述输入特征信息集。

在一个可能的示例中,所述目标参保单位包括多个目标参保成员,在所述从预设数据库中确定与目标参保单位关联的关联参保单位方面,所述程序340具体用于执行以下步骤的指令:

从所述预设数据库确定所述多个目标参保成员中每一目标参保成员对应的身份信息,以得到多个身份信息;

根据所述多个身份信息确定关联参保成员;

确定所述关联参保成员所在的参保单位为所述关联参保单位。

在一个可能的示例中,所述程序340还用于执行以下步骤的指令:

从所述预设数据库中确定训练参保单位集和验证参保单位集,所述训练参保单位集和所述验证参保单位集中每一参保单位包括对应的基本信息集和骗保结果;

确定与所述训练参保单位集和所述验证参保单位集中每一参保单位对应的关联参保单位,以得到训练关联参保单位集和验证关联参保单位集,所述训练关联参保单位集和所述验证关联参保单位集中每一参保单位包括对应的基本信息集;

根据所述训练参保单位集、所述验证参保单位集、所述训练关联参保单位集和所述验证关联参保单位集中每一参保单位对应的基本信息集,分别获取与所述多个预设特征维度中每一预设特征维度对应的特征信息,以得到所述训练参保单位集、所述验证参保单位集、所述训练关联参保单位集和所述验证关联参保单位集中每一参保单位对应的特征信息集;

根据所述训练关联参保单位集中每一参保单位包括对应的特征信息集,以及所述训练参保单位集中每一参保单位对应的特征信息集和骗保结果进行分类,以得到待验证模型;

根据所述验证关联参保单位集中每一参保单位包括对应的特征信息集,以及所述验证参保单位集中每一参保单位对应的特征信息集和骗保结果,对所述待验证模型进行训练,以得到所述识别模型。

在一个可能的示例中,所述预设数据库对应多个第一参保单位,在所述从所述预设数据库中确定训练参保单位集和验证参保单位集方面,所述程序340具体用于执行以下步骤的指令:

获取所述多个第一参保单位中每一参保单位的参保参数,以得到多个参保参数;

从所述多个第一参保单位中选取参保参数满足预设条件的参保单位,以得到多个第二参保单位;

按照预设比例将所述多个第二参保单位进行分类,以得到所述训练参保单位集对应的多个训练参保单位和所述验证参保单位集对应的多个验证参保单位;

从所述预设数据库中确定与所述多个训练参保单位和所述多个验证参保单位对应的存储信息,以得到所述训练参保单位集和所述验证参保单位集。

在一个可能的示例中,所述程序340还用于执行以下步骤的指令:

从所述预设数据库中查找骗保结果为骗保单位的参保单位,以得到多个第三参保单位;

获取所述多个第三参保单位中每一参保单位对应的基本信息集,以得到多个参考基本信息集;

获取所述多个参考基本信息集对应的特征信息,以得到多个特征信息;

对所述多个特征信息进行分类,以得到多类特征信息集;

统计所述多类特征信息集中每一类特征信息的数量,以得到多个数量;

将所述多个数量中大于第二阈值的数量对应的特征信息集的类型作为所述预设特征维度。

本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于存储计算机程序,该计算机程序使得计算机执行如方法实施例中记载的任一方法的部分或全部步骤,计算机包括电子设备。

本申请实施例还提供一种计算机程序产品,计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,计算机程序可操作来使计算机执行如方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,计算机包括电子设备。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模式并不一定是本申请所必须的。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模式的形式实现。

集成的单元如果以软件程序模式的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。根据这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储器包括:u盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、rom、ram、磁盘或光盘等。

以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1