一种基于知识图谱的团体欺诈识别系统的制作方法

文档序号:16583692发布日期:2019-01-14 18:12阅读:329来源:国知局
一种基于知识图谱的团体欺诈识别系统的制作方法

本发明涉及贷款风险防控系统技术领域,具体为一种基于知识图谱的团体欺诈识别系统。



背景技术:

知识图谱的本质是语义网络,是一种基于图的数据结构,由节点和边组成。知识图谱里,每个节点表示现实世界的“实体”,每条边表示实体与实体之间的关系。知识图谱是描述关系最有效的表达方式。通俗的讲,知识图谱就是将所有不同种类的信息连接在一起而得到的关系网络,知识图谱提供了“关系”的角度去分析问题的能力。

目前,在互联网金融领域,风险防控主要是用于客户在申请贷款提供的客户信息的真实性校验,主要停留在个体特征的识别和验证。而金融欺诈的模式随时间不断演化和发展,已经不再仅限于个体行为模式,目前金融欺诈越来越多的是通过团伙有组织的进行,且团伙中个体的欺诈特征单独来看有时并不显著,导致在某些情况下仅根据个体特征对用户进行识别的结果不甚理想。

知识图谱是一门新兴技术,2012年才开始从理论转至实践,其在金融领域主要运用于银行业金融机构对企业的授信审查。银行通过构建一个企业维度的关联图谱以核查与之关联的企业。企业及其关联企业的负面信息成为行方对企业授信核查的重要方面。在互联网金融领域,知识图谱的运用主要停留在一度关系的识别,对于团伙案件的深度挖掘以及多度关系的识别尚未有较为深入的研究。



技术实现要素:

本发明意在提供一种基于知识图谱的团体欺诈识别系统,能够对于借贷人的异常进行分析,并找出可能存在欺诈风险的团体,减少银行不必要的损失。

为了解决上述技术问题,本专利提供如下技术方案:

一种基于知识图谱的团体欺诈识别系统,包括:

信息收集模块,所述信息收集模块用于收集借贷人的个人信息,所述个人信息包括基本信息和行为信息;

异常分析模块,所述异常分析模块用于检测和分析借贷人的异常行为,并将有异常行为的用户标记为疑似欺诈用户;

关联分析模块,所述关联分析模块用于根据疑似欺诈用户的个人信息、异常行为以及异常数据分析疑似欺诈用户与其他借贷人或第三方黑名单人员的关联关系;

团体识别模块,所述团体识别模块用于根据所述的关联关系找出与疑似欺诈用户相关的其他疑似欺诈用户并形成疑似欺诈团体供案件调查人员进行判断。

本发明技术方案中,先收集借贷人的个人信息,然后对个人信息进行分析,找到其中用户的异常行为,然后利用借贷人的个人信息分析其与其他借贷人之间的关联关系,实现数据的整合处理,然后根据所有借贷人之间的相互的关联关系筛选出其他疑似欺诈的用户,并这些用户划分到一个疑似欺诈团体中,供管理人员进行核实确认,本申请的技术方案可以对用户的异常行为和异常数据进行监控,并深入挖掘这些数据,从已有的数据中找出存在团伙欺诈风险的人员,实现团体欺诈的识别和防控,避免银行受损。

进一步,还包括展示模块,所述展示模块用于疑似欺诈团体的各个疑似欺诈用户之间存在的关联关系图谱。

通过展示模块,让管理人员可以直观的看到借贷人的关联关系图谱,进而快速找到关联人可能存在的风险。

进一步,还包括展示设置模块,所述展示设置模块用于设置展示的关系度和关系类型。

通过展示设置模块可以对借贷人配置不同的维度、不同的关系类型和关系度,有利于管理人员通过展示模块充分了解借贷人的关联关系网络。

进一步,还包括调查挖掘模块,所述调查挖掘模块用于根据借贷人的关联关系图谱筛选出潜在联系人。

在实际欺诈案件调查取证过程中,欺诈客户一般都处于失联的状态,调查员可以通过知识图谱挖掘出更多潜在的新的联系人,即失联修复,从而能够提高案件调查的有效性。

进一步,还包括一致性校验模块,所述一致性校验模块用于根据借贷人的信息与其他借贷人的信息进行比较,判断是否存在数据冲突,并将冲突数据标记为异常数据,所述一致性校验模块还用于将有异常数据的用户标记为疑似欺诈用户。通过一致性校验模块,可以发现数据冲突异常,例如两个人手机号相同,又如两个人工作单位不同,但是单位电话相同等情况,通过一致性校验可以挖掘出这些数据之间的冲突异常。

进一步,所述关联分析模块包括社交关系分析模块、行为关联分析模块以及金融关系分析模块,所述社交关系分析模块用于分析疑似欺诈用户与其他借贷人或第三方黑名单人员之间在社交上的关联关系,所述行为关联分析模块用于分析疑似欺诈用户与其他借贷人之间在行为上的关联关系;所述金融关系分析模块用于分析疑似欺诈用户与其他借贷人或第三方黑名单人员在金融以及经济方面上的关联关系。

社交关系是指两个人之间联系沟通的关系,如两个人之间的通话关系、社交软件好友关系、手机联系人关系、日常生活关系等,通话关系包括通话频率、通话次数、通话时长等;社交软件关系包括相互关注度、社交软件互动程度等;日常生活关系则是指两个人的工作单位、居住位置、定位位置等之间的关系。行为关联关系是指两个人的行为有共性或关联,如共同登录过一台设备,都在半夜到银行取款等;金融和经济的关联关系是指两个人在经济上的往来关系,例如转账关系、投资关系、债务关系、实际控制人关系等。通过这些关系可以全面的分析两个人之间的关联,进而为团伙的划分和识别提供基础。

附图说明

图1为本发明一种基于知识图谱的团体欺诈识别系统实施例中的逻辑框图;

图2为本发明一种基于知识图谱的团体欺诈识别系统实施例中的示例图。

具体实施方式

下面通过具体实施方式进一步详细说明:

实施例一

如图1所示,本实施例中一种基于知识图谱的团体欺诈识别系统、包括信息收集模块、异常分析模块、关联分析模块、团体识别模块、展示模块、展示设置模块以及调查挖掘模块,其中:

信息收集模块用于收集借贷人的个人信息,个人信息包括基本信息、行为信息以及三方数据,基本信息包括结构化数据、半结构化数据以及非结构化数据,结构化数据包括客户的身份证号、设备指纹、手机号、家庭地址、居住地址、联系人信息等基础数据以及银行账户和借款数据等;

半结构化数据包括客户通信信息、客户网银信息、客户社保信息、客户公积金信息、客户信用卡信息、客户信用审查信息等。

非结构化数据包括客户图片信息和客户视频信息数据,客户图像信息包括身份证复印件图像、户口本复印件图像、纸质申请材料图像等;客户视频信息数据包括谈话视频、签约视频以及活体认证视频等。

结构化数据:主要指客户基础信息及借款信息数据,采用sqoop的方式直连数据库完成数据接入,实现对客户实体的提取和基本属性的梳理。半结构化数据:主要指行内获取的部分客户通信、网银、社保、公积金、信用卡、信审等数据,我们重点通过此类半结构化数据进行数据挖掘和关联关系分析,例如:

1、通过通信和网银信息,解析客户和其他人员实体的关联关系。

2、通过社保和公积金信息,解析客户和所属公司的关联关系。

3、通过信用卡及信审信息,解析客户的资金往来状况等。

非结构化数据:主要指客户相关图片信息以及客户谈话录音机签约视频信息,通过保存存储路径的方式建立索引,能够实现根据客户相关的非结构化数据的快速识别。

行为信息包括注册、登入、支付的一些操作习惯、登录地点、设备指纹、定位数据、登录ip数据,三方数据如电商信息、金融投资信息、黑名单、涉诉信息、企业工商信息等以及企业关联关系数据(法人、股东、分公司、子公司等)。

异常分析模块用于检测和分析借贷人的异常行为,并将有异常行为或异常数据的用户标记为疑似欺诈用户;一致性校验模块用于根据借贷人的信息与其他借贷人的信息进行比较,判断是否存在数据冲突,并将冲突数据标记为异常数据,所述一致性校验模块还用于将有异常数据的用户标记为疑似欺诈用户。例如两个人手机号相同,又如两个人工作单位不同,但是单位电话相同等情况,又如一个人与另两个人都是好朋友的关系,而另外两个人却是爷孙关系,则证明这三个人的关系存在虚假的可能性,通过一致性校验可以挖掘出这些数据之间的冲突异常。

异常分析模块包括行为异常分析模块以及其他异常分析模块,行为异常分析模块用于从用户的行为中分析用户的异常行为,例如用户的经常半夜取款、用户的定位数据短时间内发生巨大改变等,其他异常用于分析用户在第三方平台的一些异常如用户属于失信黑名单人员、用户在征信平台的征信数据非常差、用户银行账户被冻结等等。

关联分析模块用于根据疑似欺诈用户的个人信息、异常行为以及异常数据分析疑似欺诈用户与其他借贷人或第三方黑名单人员的关联关系;关联分析模块包括社交关系分析模块、行为关联分析模块以及金融关系分析模块,所述社交关系分析模块用于分析疑似欺诈用户与其他借贷人或第三方黑名单人员之间在社交上的关联关系,所述行为关联分析模块用于分析疑似欺诈用户与其他借贷人之间在行为上的关联关系,所述金融关系分析模块用于分析疑似欺诈用户与其他借贷人或第三方黑名单人员在金融以及经济方面上的关联关系。

社交关系是指两个人之间联系沟通的关系,如两个人之间的通话关系、社交软件好友关系、手机联系人关系、日常生活关系等,通话关系包括通话频率、通话次数、通话时长等;社交软件关系包括相互关注度、社交软件互动程度等;日常生活关系则是指两个人的工作单位、居住位置、定位位置等之间的关系。行为关联关系是指两个人的行为有共性或关联,如共同登录过一台设备,都在半夜到银行取款等;金融和经济的关联关系是指两个人在经济上的往来关系,例如转账关系、投资关系、债务关系、实际控制人关系等。通过这些关系可以全面的分析两个人之间的关联,进而为团伙的划分和识别提供基础。

如图2所示,张三和李四有共同的登录行为,因此他们具有行为关联关系,王五与两者都具有通话的关系,也即上述的社交关系,而刘六与王五之间存在金融关系,刘六与张三之间的工作单位相同,因此又存在生活上的联系,当王五为疑似欺诈用户时,通过知识图谱的延伸和挖掘,可以将其关联人员即张三、李四、刘六全部找出来供后面分析使用。

团体识别模块用于根据所述的关联关系找出与疑似欺诈用户相关的其他疑似欺诈用户并形成疑似欺诈团体供案件调查人员进行判断,一般来说,团伙作案的借贷人在某些维度具有较高的集中度,例如借贷人的身份证均来自同一村庄或者申请时间都较为集中。团体识别模块根据已经找出的关联关系,对每个人进行排查,分析每个人的异常,例如上述中,经过分析发现张三和李四共同登录过设备a,但定位出的设备a的位置却相差很大,则说明这两个人有可能使用软件修改了定位数据,存在一定的欺诈风险;又分析出刘六与王五的转账的记录中,转账的金额、时间、频率不在正常的预设范围内,不符合正常的关系,则说明刘六也存在欺诈风险,因此将他们四个人划分为一个疑似欺诈团体里面,由管理人员再深入的进行调查、关联和确认。

展示模块用于疑似欺诈团体的各个疑似欺诈用户之间存在的关联关系图谱。通过展示模块,让管理人员可以直观的看到借贷人的关联关系图谱,进而快速找到关联人可能存在的风险。展示设置模块用于设置展示的关系度和关系类型。通过展示设置模块可以对借贷人设置不同的维度、不同的关系类型和关系度,有利于管理人员通过展示模块多角度地了解借贷人的关联关系网络。

调查挖掘模块用于根据借贷人的关联关系图谱筛选出多维度的联系人。在实际欺诈案件调查取证过程中,欺诈客户一般都处于失联的状态,调查员可以通过知识图谱挖掘出更多潜在的新的联系人,例如,在张三失联后,根据之前的知识图谱关系,发现王五与张三以及李四均存在通话关系,进而可以考虑从李四那里调查张三的下落,从而能够提高案件调查的有效性。

本实施例中,先收集借贷人的个人信息,然后对个人信息进行分析,找到其中的异常数据或者找出用户的异常行为,然后利用借贷人的个人信息分析其与其他借贷人之间的关联关系,实现数据的整合处理,然后根据所有借贷人之间的相互的关联关系筛选出其他疑似欺诈的用户,并这些用户划分到一个疑似欺诈团体中,供管理人员进行核实确认,本申请的技术方案可以对用户的异常行为和异常数据进行监控,并深入挖掘这些数据,从已有的数据中找出存在团伙欺诈风险的人员,实现团体欺诈的识别和防控,避免银行受损。

实施例二

本实施例与实施例一的区别在于,本实施例中信息收集模块还包括联系人验证模块,所述联系人验证模块用于在用户填写联系人信息时,向相应联系人发送验证短信,所述联系人验证模块还用于通过第三方接口获取相应联系人的定位信息,所述联系人验证模块用于将借贷人的定位信息与联系人的定位信息进行对比,判断借贷人与对应联系人的距离是否小于预设值,本实施例中为10米,所述联系人验证模块用于在检测到最近的三天内借贷人与对应联系人的距离一直小于10米后,判定该联系人为无效联系人。通过发送验证短信,让联系人得知借贷人借贷情况,避免在联系人不知情的情况下被后续催款电话骚扰,通过联系人验证模块判断借贷人与所填联系人之间的的距离,进而判断是否是借贷人自己的另一个手机号码,进而验证联系人的有效性。

以上的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未作过多描述,所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能力,所属领域普通技术人员可以在本申请给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1