一种团伙欺诈的发现方法及装置与流程

文档序号:11293278阅读:409来源:国知局
一种团伙欺诈的发现方法及装置与流程
本发明实施例涉及社会复杂网络
技术领域
,尤其涉及一种团伙欺诈的发现方法及装置。
背景技术
:随着互联网金融的快速发展,基于互联网开展的借贷业务越来越多,同时出现很多不法分子利用各平台的漏洞进行作弊、诈骗等各种欺诈行为,给企业造成巨大损失。随着反欺诈技术的进步,金融欺诈越来越难以由个体完成,金融欺诈的模式也随时间不断演化,金融欺诈行为逐渐向团伙化、组织化的趋势发展。现有技术中,主要针对各借贷个体进行全方位评估来进行反欺诈,缺乏对团伙欺诈类风险进行有效监控和调查的方法。技术实现要素:本发明实施例提供一种团伙欺诈的发现方法及装置,以实现对团伙欺诈的监控,提高金融互联网的安全性。第一方面,本发明实施例提供了一种团伙欺诈的发现方法,该方法包括:每隔预设时间段对网络数据库中的网络关系数据进行社区划分,得到至少一个第一社区;根据所述至少一个第一社区中的每个节点的特征信息计算所述第一社区的特征指标信息;根据所述特征指标信息对所述第一社区的团伙欺诈风险进行预测。进一步地,所述每隔预设时间段对网络数据库中的网络关系数据进行社区划分,得到至少一个第一社区包括:每隔预设时间段获取网络数据库中的网络关系数据中的节点信息;按照网络关系构建所述节点信息间的关系边;根据所述关系边形成节点关系图;根据所述关系图中节点信息的连通性和所述关系边的权重进行社区划分,得到至少一个第一社区。进一步地,所述根据所述至少一个第一社区中的每个节点特征信息计算所述第一社区的特征指标信息包括:获取所述至少一个第一社区中的每个节点的特征信息;将每个节点的特征信息累加去重,获取所述第一社区的特征指标信息。进一步地,所述根据所述特征指标信息对所述第一社区的团伙欺诈风险进行预测,包括:利用历史社区中团伙欺诈社区的特征指标信息和非团伙欺诈社区的特征指标信息进行数据训练,获取训练模型;将所述第一社区的特征指标信息代入所述训练模型进行团伙欺诈风险预测。进一步地,所述将所述第一社区的特征指标信息代入所述训练模型进行团伙欺诈风险预测包括:将所述第一社区的特征指标信息代入所述训练模型获取计算结果;若所述计算结果大于预设概率值,则所述第一社区存在团伙欺诈风险。第二方面,本发明实施例还提供了一种团伙欺诈的发现装置,该装置包括:社区划分模块,用于每隔预设时间段对网络数据库中的网络关系数据进行社区划分,得到至少一个第一社区;特征指标信息计算模块,用于根据所述至少一个第一社区中的每个节点的特征信息计算所述第一社区的特征指标信息;团伙欺诈风险预测模块,用于根据所述特征指标信息对所述第一社区的团伙欺诈风险进行预测。进一步地,所述社区划分模块,还用于:每隔预设时间段获取网络数据库中的网络关系数据中的节点信息;按照网络关系构建所述节点信息间的关系边;根据所述关系边形成节点关系图;根据所述关系图中节点信息的连通性和所述关系边的权重进行社区划分,得到至少一个第一社区。进一步地,所述特征指标信息计算模块,还用于:获取所述至少一个第一社区中的每个节点的特征信息;将每个节点的特征信息累加去重,获取所述第一社区的特征指标信息。进一步地,所述团伙欺诈风险预测模块,还用于:利用历史社区中团伙欺诈社区的特征指标信息和非团伙欺诈社区的特征指标信息进行数据训练,获取训练模型;将所述第一社区的特征指标信息代入所述训练模型进行团伙欺诈风险预测。进一步地,所述团伙欺诈风险预测模块,还用于:将所述第一社区的特征指标信息代入所述训练模型获取计算结果;若所述计算结果大于预设概率值,则所述第一社区存在团伙欺诈风险。本发明实施例,首先每隔预设时间段对网络数据库中的网络关系数据进行社区划分,得到至少一个第一社区,然后根据至少一个第一社区中的每个节点的特征信息计算第一社区的特征指标信息,最后根据特征指标信息对第一社区的团伙欺诈风险进行预测。现有技术中,在进行反欺诈时,主要针对个体进行全方位评估来进行反欺诈,缺乏对团伙欺诈类风险进行有效监控和调查的方法。本实施例的技术方案,利用社区划分方法对网络关系数据进行社区划分后,对划分后的社区根据特征指标信息进行团伙欺诈风险预测,实现了对团伙欺诈的监控,可以提高金融互联网的安全性。附图说明图1是本发明实施例一中的一种团伙欺诈的发现方法的流程图;图2a是本发明实施例二中的一种团伙欺诈的发现方法的流程图;图2b是本发明实施例二中的进行社区划分的过程图;图3是本发明实施例三中的一种团伙欺诈的发现方法的流程图;图4是本发明实施例四中的一种团伙欺诈的发现装置的结构示意图。具体实施方式下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。实施例一图1为本发明实施例一提供的一种团伙欺诈的发现方法的流程图,本实施例可适用于发现团伙欺诈行为的情况,该方法可以由团伙欺诈的发现装置来执行,该装置可以是服务器,如图1所述,该方法具体包括如下步骤:步骤110,每隔预设时间段对网络数据库中的网络关系数据进行社区划分,得到至少一个第一社区。其中,预设时间段可以按照业务需求进行设置,例如:可以设置为1小时、12小时或1天等。网络数据库可以用于存储各网络用户节点间的网络关系数据,本应用场景下,网络数据库用于存储涉及借贷业务的用户节点间的网络关系数据。网络关系可以包括社交网络关系、通讯网络关系、ip地址网络关系、收货地址网络关系及设备号机器码网络关系等。第一社区可以是由网络关系紧密的多个节点组成的社区。社区划分方法可以采用任意的社区划分算法,如基于标签传播的的社区划分算法或基于模块度分组的快速算法等。本实施例中,利用社区算法进行社区划分时,采用分布式的计算框架对网络关系数据进行分析,其中,分布式的计算框架的基本原理是将网络关系数据中的节点信息划分至多台服务器并行处理分析,这种方式与单机串行处理的方式相比,计算速度快,效率高。具体的,每隔预设时间段对网络数据库中的网络关系数据进行社区划分,得到至少一个第一社区的过程可以是,首先每隔预设时间段获取网络数据库中的节点信息,然后按照网络关系构建节点信息的关系边,再然后根据构建的关系边形成节点关系图,最后根据节点图中节点信息的连通性和各关系边的权重进行社区划分,从而得到至少一个第一社区。步骤120,根据至少一个第一社区中的每个节点的特征信息计算第一社区的特征指标信息。其中,节点的特征信息可以是反映节点基本特征的信息,节点包括至少一个特征信息。在不同的网络业务下,关注的节点的特征信息不同。具体的,根据至少一个第一社区中的每个节点的特征信息计算第一社区的特征指标信息的过程可以是,首先获取至少一个第一社区中的每个节点的特征信息,然后将每个节点的特征信息累加去重,获取第一社区的特征指标信息。其中,获取节点的特征信息的方式可以是分析节点在网络中的历史行为,根据历史行为统计特征信息。示例性的,表1为在分期借贷业务下节点包括的特征信息。表1特征信息1非空收货地城市数特征信息2不用设备注册数特征信息3群组中机器码连接用户最大数特征信息4注册设备为缺失用户数特征信息5注册停留时间特征信息6户籍城市特征信息7不同设备注册数特征信息8不同代理人数如表1所示,节点的特征信息包括非空收货地城市数、不用设备注册数、群组中机器码连接用户最大数、户籍城市、注册设备为缺失用户数、注册停留时间、不同设备注册数及不同代理人数等。统计第一社区中每个节点的特征信息,然后将第一社区中的所有节点的特征信息分别累加去重,获得第一社区的特征指标信息。示例性的,假设第一社区包括节点a、b和c,以特征信息1为例,a的非空收货地城市数为3个,分别为北京、广州和上海,b的非空收货地城市数为5个,分别为北京、天津、武汉、哈尔滨和深圳,c的非空收货地城市数为3个,分别为上海、南京和杭州。对三个节点的特征信息1进行累加去重得到第一社区的非空收货城市数为9个,分别为北京、广州、上海、天津、武汉、哈尔滨、深圳、南京和杭州。按照同样的方法,根据节点的其他特征信息计算第一社区对应的特征指标信息,从而得到第一社区的各个特征指标信息。步骤130,根据特征指标信息对第一社区的团伙欺诈风险进行预测。具体的,根据特征指标信息对第一社区的团伙欺诈风险进行预测的过程可以是,首先利用历史社区中团伙欺诈社区的特征指标信息和非团伙欺诈社区的特征指标信息进行数据训练,获取训练模型,然后将获得的第一社区的特征指标信息代入训练模型中获取计算结果,将计算结果与预设概率值进行比较,若计算结果大于预设概率值,则第一社区存在团伙欺诈风险。本实施例的技术方案,首先每隔预设时间段对网络数据库中的网络关系数据进行社区划分,得到至少一个第一社区,然后根据至少一个第一社区中的每个节点的特征信息计算第一社区的特征指标信息,最后根据特征指标信息对第一社区的团伙欺诈风险进行预测。现有技术中,在进行反欺诈时,主要针对个体进行全方位评估来进行反欺诈,缺乏对团伙欺诈类风险进行有效监控和调查的方法。本实施例的技术方案,利用社区划分方法对网络关系数据进行社区划分后,对划分后的社区根据特征指标信息进行团伙欺诈风险预测,实现了对团伙欺诈的监控,可以提高金融互联网的安全性。实施例二图2a为本发明实施例二提供的一种团伙欺诈的发现方法的流程图,以上述实施例为基础,如图2a所示,步骤110包括:步骤111,每隔预设时间段获取网络数据库中的网络关系数据中的节点信息。其中,节点信息可以包括用户在网络中注册的用户名、登记的手机号、ip地址及使用的设备号等。具体的,每隔预设时间段,将网络数据库中构成网络关系数据的每个节点信息提取出来,然后对节点信息进行分析。步骤112,按照网络关系构建节点信息间的关系边。具体的,按照网络关系构建节点信息间的关系边的方式可以是,在具有网络关系的节点信息之间构建一条关系边,例如:节点信息a和节点信息b之间互为好友关系,则在节点信息a和节点信息b之间构建一条关系边,其形式可以是(a,b)或a-b。步骤113,根据关系边形成节点关系图。其中,节点关系图可以是由网络关系数据中的所有节点信息以及节点信息间的关系边构成的关系图。具体的,在按照网络关系构建了节点信息间的关系边之后,将构建的关系边组合形成节点关系图。步骤114,根据关系图中节点信息的连通性和关系边的权重进行社区划分,得到至少一个第一社区。其中,连通性可以是节点信息间具有直接或间接的网络关系,例如,a与b间有直接网络关系,b与c间有直接网络关系,而a与c之间没有直接网络关系,但是a与c间有间接网络关系,则a、b和c三者间具有连通性。关系边的权重可以根据节点信息间的网络关系的紧密程度进行设置,权重的值可以为0-1之间的任意数值。示例性的,假设a与b、a与c互为好友关系,a与b之间经常联系,而a与c之间在加了好友之后没有联系过,那么a与b之间的关系边的权重可以设置为0.7,而a与c之间的关系边的权重可以设置为0.2,即a与b之间的关系边的权重比a与c之间的关系边的权重大。具体的,根据关系图中节点信息的连通性和关系边的权重进行社区划分的过程可以是,首先将具有连通性的节点信息划分为一组,然后根据关系边的权重对节点信息进行筛选,将满足权重条件的节点信息保留,得到第一社区。其中,权重条件为权重值大于等于预设值,预设值可以设置为0.4-0.6之间的任意值。示例性的,图2b为本发明实施例二提供的进行社区划分的过程图,如图2b所示,节点a与b、b与c、c与d之间分别具有网络关系,分别构建它们之间的关系边。a、b、c和d四个节点信息具有连通性。假设预设值设置为0.5,其中,b与c之间的关系边的权重为0.1,小于0.5,则需将c除去,最后形成的第一社区包括的节点信息为a、b和d。本实施例的技术方案,根据关系图中节点信息的连通性和关系边的权重进行社区划分,能够划分出节点信息间关系更紧密的社区,利于对团伙欺诈的预测。实施例三图3为本发明实施例三提供的一种团伙欺诈的发现方法的流程图,以上述实施例为基础,如图3所示,步骤130包括:步骤131,利用历史社区中团伙欺诈社区的特征指标信息和非团伙欺诈社区的特征指标信息进行数据训练,获取训练模型。其中,训练模型可以选择决策树模型或者逻辑回归模型。利用历史社区中团伙欺诈社区的特征指标信息和非团伙欺诈社区的特征指标信息进行数据训练的过程可以是,分别将团伙欺诈社区的特征指标信息和非团伙欺诈社区的特征指标信息代入训练模型,计算训练模型的参数值。其中,团伙欺诈社区是已经确定为具有团伙欺诈行为的社区,其训练模型值为1,非团伙欺诈社区是已经确定为没有团伙欺诈行为的社区,其训练模型值为0。示例性的,以逻辑回归模型为例,逻辑回归模型的公式为其中,θtx=θ1x1+...+θnxn,x1,x2…xn为社区中各个特征指标信息值,θ1,θ2…θn为逻辑回归模型的参数,为待求值。历史社区中团伙欺诈社区的特征指标信息和非团伙欺诈社区的特征指标信息都是已知的,将历史社区中团伙欺诈社区的特征指标信息和非团伙欺诈社区的特征指标信息代入上述逻辑回归模型公式中,求得θ1,θ2…θn的值,从而得到逻辑回归模型。步骤132,将第一社区的特征指标信息代入训练模型进行团伙欺诈风险预测。获取到训练模型后,将第一社区的特征指标信息代入训练模型得到第一社区的训练模型值,根据训练模型值预测第一社区是否存在团伙欺诈风险。优选的,将第一社区的特征指标信息代入训练模型进行团伙欺诈风险预测的方法可以是,将第一社区的特征指标信息代入训练模型获取计算结果,若计算结果大于预设概率值,则第一社区存在团伙欺诈风险。其中预设概率值可以设置为0.6-0.9之间的任意值。示例性的,预设概率值设置为0.8,将第一社区的特征指标信息代入训练模型计算后,得到训练模型值为0.85,则该第一社区存在团伙欺诈风险,相关人员可对该社区采取相应的措施。本实施例的技术方案,利用历史社区中团伙欺诈社区的特征指标信息和非团伙欺诈社区的特征指标信息进行数据训练,获取训练模型,将第一社区的特征指标信息代入训练模型进行团伙欺诈风险预测,利用训练模型对社区的团伙欺诈风险进行预测,提高风险预测的准确性。实施例四图4为本发明实施例四提供的一种团伙欺诈的发现装置的结构示意图,如图4所示,该装置包括:社区划分模块410,特征指标信息计算模块420,团伙欺诈风险预测模块430。社区划分模块410,用于每隔预设时间段对网络数据库中的网络关系数据进行社区划分,得到至少一个第一社区;特征指标信息计算模块420,用于根据至少一个第一社区中的每个节点的特征信息计算第一社区的特征指标信息;团伙欺诈风险预测模块430,用于根据特征指标信息对第一社区的团伙欺诈风险进行预测。优选的,社区划分模块410,还用于:每隔预设时间段获取网络数据库中的网络关系数据中的节点信息;按照网络关系构建节点信息间的关系边;根据关系边形成节点关系图;根据关系图中节点信息的连通性和关系边的权重进行社区划分,得到至少一个第一社区。优选的,特征指标信息计算模块420,还用于:获取至少一个第一社区中的每个节点的特征信息;将每个节点的特征信息累加去重,获取第一社区的特征指标信息。优选的,团伙欺诈风险预测模块430,还用于:利用历史社区中团伙欺诈社区的特征指标信息和非团伙欺诈社区的特征指标信息进行数据训练,获取训练模型;将第一社区的特征指标信息代入训练模型进行团伙欺诈风险预测。优选的,团伙欺诈风险预测模块430,还用于:将第一社区的特征指标信息代入训练模型获取计算结果;若计算结果大于预设概率值,则第一社区存在团伙欺诈风险。上述装置可执行本发明前述所有实施例所提供的方法,具备执行上述方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明前述所有实施例所提供的方法。注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1