一种基于关联网络分析技术的保险黑产识别与应对系统的制作方法

文档序号:37309134发布日期:2024-03-13 20:56阅读:35来源:国知局
一种基于关联网络分析技术的保险黑产识别与应对系统的制作方法

本发明涉及保险黑产,具体涉及一种基于关联网络分析技术的保险黑产识别与应对系统。


背景技术:

1、本发明对于背景技术的描述属于与本发明相关的相关技术,仅仅是用于说明和便于理解本发明的
技术实现要素:
,不应理解为申请人明确认为或推定申请人认为是本发明在首次提出申请的申请日的现有技术。

2、在保险行业,黑产指的是通过教唆、伪造证据等手段诱导和协助他人进行退保、理赔,并以此谋利的群体。目前,急需一种高效准确的黑产识别和应对系统,以保护保险公司自身的利益并为消费者提供更可靠的保险服务。

3、传统的黑产识别及应对方法主要依赖黑名单和规则引擎,这种方法通常效率低下且易受欺诈者的规避。因此,一种基于先进技术的、自动化的、高度精准的保险黑产识别与应对系统变得至关重要。

4、传统的黑产识别及应对方法主要依赖黑名单和规则引擎,然而传统的黑名单仅收录了涉及黑产的电话号码,通过匹配黑名单的方法进行黑产的识别和拦截,一旦黑产群体更换电话号码或者使用其他的方式进行欺诈,就会出现无法识别和拦截的情况,因此这种方法通常效率低下且易受欺诈者的规避。


技术实现思路

1、本发明旨在提供一种基于关联网络分析技术的保险黑产识别与应对系统,利用多层次的数据收集和数据挖掘技术,帮助保险公司有效地识别和应对黑产行为。该系统能够自动化地分析大量的保险投诉或索赔数据,找出可能存在的黑产行为,并提供针对性的应对措施,从而降低保险黑产带来的风险和损失。

2、一种基于关联网络分析技术的保险黑产识别与应对系统,包括:

3、数据收集模块:被配置为用于收集与保险黑产欺诈相关的全面数据;

4、数据预处理模块:与所述的数据收集模块信号连接,被配置为用于在数据收集后,该模块对数据进行预处理;

5、关联网络构建模块:与所述的数据预处理模块信号连接,被配置为用于该模块利用关联网络分析技术,基于数据预处理后的信息,构建黑产群体与保险公司客户之间的关联网络;

6、关联规则挖掘模块:与关联网络构建模块信号连接,被配置为用于在构建关联网络后,该模块可以通过关联规则挖掘技术,发现潜在的黑产群体与保险公司客户之间的关联模式;

7、欺诈识别与应对模块:与关联规则挖掘模块信号连接,被配置为用于通过关联规则挖掘,系统可以识别出潜在的黑产群体以及其与保险公司客户的关联关系。

8、进一步的,全面数据包括黑产群体和保险公司客户的电话号码,通话联系人,通话数据,社交平台账户信息,交易信息等;

9、预处理包括数据清洗、去重、标准化等操作,以确保数据质量和一致性,便于后续的关联网络分析;

10、关联网络可以使用图论等方法来表示,其中黑产群体和保险公司客户分别表示为网络中的节点,其中节点具有的属性包括但不限于:手机号,社交平台id,交易账户等,而节点之间的关联关系则表示为网络中的边,节点之间的关系包括但不限于:移动通话关系,社交平台互动关系,账户交易关系等;

11、关联规则可以帮助系统更好地理解黑产欺诈活动的模式,进而提高识别的准确性。

12、进一步的,

13、对于关联规则挖掘,可以使用包括apriori或fp-growth算法,当使用apriori算法时,可以使用下面的步骤进行关联规则挖掘:

14、统计通话节点数、社交平台互动节点数和交易节点数:对于每个节点,根据通话关系的边权重(通话频次)、社交平台互动关系的边权重(互动频率)和交易关系的边权重(交易金额),分别统计节点具有特定通话频次、社交平台互动频率和交易金额的节点数。

15、挖掘频繁项集:频繁项集是在数据集中频繁出现的项的集合。将统计得到的通话节点数、社交平台互动节点数和交易节点数作为节点属性,作为条件来挖掘频繁项集。

16、计算支持度:支持度是指某个频繁项集在数据集中出现的频率,用来衡量一个规则在整个数据集中的普遍程度。支持度的计算公式为:

17、

18、其中:

19、ai表示特定的项集(如通话节点数大于10),

20、表示项集的并集(如通话节点数>10且交易金额大于1000元)

21、n表示样本总数

22、计算支持度的步骤如下:

23、统计项集出现的次数:对于每个频繁项集(由通话节点数、社交平台互动节点数和交易节点数组成),遍历整个数据集,计算该项集在数据集中出现的次数。项集的出现次数就是包含该项集的数据样本数量。

24、计算总的数据样本数:统计数据集中的总数据样本数,即数据集中的总记录数。

25、计算支持度:将项集出现的次数除以总的数据样本数,得到支持度的值。支持度的值是一个介于0到1之间的实数,表示项集在整个数据集中的出现频率。

26、设定特地阈值(如0.1),保留支持度大于等于阈值的频繁项集。

27、构建候选规则:将频繁项集组合形成候选规则。这些候选规则由一个或多个前提项(条件)和一个结论项组成,其中前提项是通话节点数、社交平台互动节点数和交易节点数的组合,而结论项是“是否黑产”、“非黑产或未发现和黑产有关联”或“是否与黑产有关联”。

28、计算置信度:

29、对于每个候选规则,计算其置信度。置信度是指规则成立的概率,即在前提项出现的情况下,结论项出现的概率。计算公式如下:

30、

31、其中:

32、support(x)表示前提项x出现的支持度;support(x->y)表示前提项x和结论项y同时出现的支持度;

33、筛选规则:根据设定的置信度阈值,筛选出置信度大于或等于阈值的规则,这些规则是系统挖掘出的更可能是黑产或与黑产有关联的规则。

34、进一步的,所述的系统还包括信息更新模块,被配置为执行如下步骤:

35、s1:保险数据库根据可能与保险黑产关联的保险公司客户生成待应对客户名单,所述的待应对客户名单上标记有待应对客户名单日期,所述的可能与保险黑产关联的保险公司客户包括:客户在保险信息,出险单和最新要出险申请单;

36、s2:将同一客户在保险信息的客户在待应对客户名单归至同一待应对客户名单集,将日期最早的待应对客户名单作为原始待应对客户名单,其他待应对客户名单作为刷新名单;将所述的原始待应对客户名单划分为原始模块和待处理模块;所述的原始模块包括出险单区、最新要出险申请单区和更新模块;所述的待处理模块由上到下划分为与所述的刷新名单数量相等的操作模块;

37、s3:提取刷新名单内的出险单并将所述的出险单进行时间标记,所述的时间标记为出险单对应的刷新名单的日期;将带有时间标记的出险单发送至原始待应对客户名单的待处理模块;按照时间标记的顺序将所述的时间出险单条依次发送至操作模块中,按照时间先后顺序由上到下排列在所述的操作模块中;

38、s4:提取最后一个操作模块中的最新要出险申请单得到更新最新要出险申请单条,清空最新要出险申请单区,将所述的更新最新要出险申请单条发送至所述的最新要出险申请单区得到更新的最新要出险申请单区;

39、s5:将待处理模块内的操作模块由上到下依次与所述的出险单区内的信息进行比对,所述的比对为先提取所述的出险单区内的时间信息和操作模块的时间信息,将操作模块的时间信息与所述的出险单区内的时间信息相同的时间信息对应的操作模块内的出险信息与所述的出险单区内对应的出险信息进行比对,判断所述的操作模块内的出险信息与所述的出险单区的对应的出险信息是否一致;

40、s6:若操作模块内的出险信息与所述的出险单区的对应的出险信息一致,则判断在所述的操作模块中是否包含出险单区内最后一条时间信息之后的时间信息,若包含,则将出险单区内最后一条时间信息之后的时间信息及对应的出险信息定义为更新出险单条,将所述的更新出险单条发送至出险单区中更新所述的出险单区,删除所述的操作模块;更新保险数据库。

41、进一步的,还包括信息拓展模块:被配置为执行如下步骤:在保险客户申请出险后,获取保险客户的申请出险时间和之前可能涉及保险黑产的出险时间;将保险客户的申请出险时间和之前可能涉及保险黑产的出险时间所在的设定时间区域内,调取保险客户的通话记录和社交记录得到风险通话记录、风险社交记录、最新录通话记录和最新社交记录;将最新通话记录与风险通话记录进行比对,最新社交记录和风险社交记录进行比对,对相同的通话记录和社交记录涉及的账号进行提取,并将该账号出现的次数进行标记。

42、进一步的,对相同的通话记录和社交记录涉及的账号进行提取,与潜在保险黑产风险的电话号码和社交账号进行比对,若在潜在保险黑产风险的电话号码和社交账号中,则将申请出险单进行上报并附详细信息。

43、进一步的,对相同的通话记录和社交记录涉及的账号进行提取,并将相同的通话记录和社交记录涉及的账号的设定时间范围内的通话记录和社交记录进行提取,将涉及到的所有通话记录和社交记录涉及的账号与潜在保险黑产风险的电话号码和社交账号进行比对,若在潜在保险黑产风险的电话号码和社交账号中,则将申请出险单进行上报并附详细信息。

44、本发明实施例具有如下有益效果:

45、相较于传统的黑名单和规则引擎方法,本发明利用关联网络分析技术,收集更全面的黑产行为数据,包括但不限于电话号码,通话联系人,通话数据,社交平台账户信息,交易信息等,并通过关联网络分析发现隐藏的黑产群体与保险公司客户之间的关联,从而提高了识别黑产欺诈的精准度和效率。同时,由于系统不是仅依赖手机号等单一信息,而是多维度数据的综合分析,使得黑产欺诈者更难逃避识别,保障了保险行业的安全与稳定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1