基于Neo4j的异常用户处理方法、装置、计算机设备和介质与流程

文档序号:22613304发布日期:2020-10-23 19:10阅读:187来源:国知局
本申请涉及大数据领域,特别是涉及一种基于neo4j的异常用户处理方法、装置、计算机设备和存储介质。
背景技术
:目前,各大互联网平台为了争夺用户,往往会采用让利补贴的方式提高活跃度,但同时也滋养了一群特殊的用户——“羊毛党”。“羊毛党”逐渐从个体玩家发展为有组织、有规模的职业集体,这些异常用户不仅为企业带来了负担,还为后台服务器的数据处理带来了困难。现有技术中通常会将检测到的异常用户加入黑名单,但这种对异常用户验证处理的方式过于简单粗暴,这就会导致一类倾向于从异常用户转为正常用户的用户也无法享受正常的权限,给异常用户的验证处理造成极大的不准确性。技术实现要素:基于此,有必要针对上述技术问题,本申请提供一种基于neo4j的异常用户处理方法、装置、计算机设备及存储介质,以解决现有技术中对异常用户的处理不准确的技术问题。一种基于neo4j的异常用户处理方法,所述方法包括:对获取到的用户数据进行用户特征提取;将提取到的用户特征输入到neo4j算法中进行预测,得到所述用户数据中具有相同属性标签的用户群体,作为异常用户群体;基于预设权重比例,根据所述异常用户群体中的用户数量、标定特征以及共同特征对所述异常用户群体进行评分;并根据评分为异常用户群体生成对应的靶向标签,并根据所述靶向标签对检测到的具有特定操作的异常用户群体进行验证处理。一种基于neo4j的异常用户处理装置,所述装置包括:提取模块,用于对获取到的用户数据进行用户特征提取;检测模块,用于将提取到的用户特征输入到neo4j算法中进行预测,得到所述用户数据中具有相同属性标签的用户群体,作为异常用户群体;评分模块,用于基于预设权重比例,根据所述异常用户群体中的用户数量、标定特征以及共同特征对所述异常用户群体进行评分;以及处理模块,用于根据评分为异常用户群体生成对应的靶向标签,并根据所述靶向标签对检测到的具有特定操作的异常用户群体进行验证处理。一种计算机设备,包括存储器和处理器,以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于neo4j的异常用户处理方法的步骤。一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于neo4j的异常用户处理方法的步骤。上述基于neo4j的异常用户处理方法、装置、计算机设备和存储介质,通过根据异常用户群体中的用户数量、特征对异常用户进行评级分级,然后根据评级分级生成靶向标签,当异常用户触发特定操作后根据靶向标签触发不同的处理机制,对异常用户进行针对性的验证处理,解决了现有技术中对异常用户的验证处理不准确的技术问题。附图说明为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为基于neo4j的异常用户处理方法的应用环境示意图;图2为基于neo4j的异常用户处理方法的流程示意图;图3为图2中步骤204的流程示意图;图4a为步骤302中一个关系图谱示意图;图4b为步骤302中另一个关系图谱示意图;图4c为步骤302中的另一关系图谱示意图;图5为图2中步骤206的流程示意图;图6为基于neo4j的异常用户处理装置的示意图;图7为一个实施例中计算机设备的示意图。具体实施方式除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
技术领域
的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。为了使本申请的目的、技术方案及优点更加清楚明白,下面结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明实施例提供的基于neo4j的异常用户处理方法,可以应用于如图1所示的应用环境中。其中,该应用环境可以包括终端102、网络以及服务端104,网络用于在终端102和服务端104之间提供通信链路介质,网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端102通过网络与服务端104交互,以接收或发送消息等。终端102上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。终端102可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、mp3播放器(movingpictureexpertsgroupaudiolayeriii,动态影像专家压缩标准音频层面3)、mp4(movingpictureexpertsgroupaudiolayeriv,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。服务端104可以是提供各种服务的服务器,例如对终端102上显示的页面提供支持的后台服务器。需要说明的是,本申请实施例所提供的基于neo4j的异常用户处理方法一般由服务端/终端执行,相应地,基于neo4j的异常用户处理装置一般设置于服务端/终端设备中。应该理解,图1中的终端、网络和服务端的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。其中,终端102通过网络与服务端104进行通信。服务端104通过网络从终端102获取用户数据,并对用户数据进行特征提取,将用户特征输入neo4j算法预测出异常用户群体,然后根据异常用户群体中的用户数量、标定特征以及共同特征对异常用户群体中进行分评分,并根据评分生成对应的靶向标签,最后根据靶向标签对异常用户群体中的异常用户进行对应的验证处理。其中,终端102和服务端104之间通过网络进行连接,该网络可以是有线网络或者无线网络,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务端104可以用独立的服务器或者是多个组成的服务器集群来实现。在一个实施例中,如图2所示,提供了一种基于neo4j的异常用户处理方法,以该方法应用于图1中的服务端为例进行说明,包括以下步骤:步骤202,对获取到的用户数据进行用户特征提取。用户数据包括用户的手机号码、ip地址、设备号以及手机号码、ip地址、设备号之间的联系、不同用户的用户特征之间的关系等等,另外,还包括不同的用户所参与的活动类型,比如每日签到、新人注册、邀新注册等等。其中,一个用户可以使用一个手机号、多个ip地址和设备号。用户特征提取是为了提取出以用户的手机号码、ip地址、设备号为维度的特征值,以及手机号码、ip地址、设备号三种特征之间的关联关系的过程。需要强调的是,为进一步保证上述用户数据的私密和安全性,上述用户数据还可以分布式存储于区块链的节点中。步骤204,将提取到的用户特征输入到neo4j算法中进行预测,得到用户数据中具有相同属性标签的用户群体,作为异常用户群体。neo4j是一个高性能的,nosql图形数据库,它将结构化数据存储在网络上而不是表中。标签传播算法(labelpropagation)是neo4j中通过节点之间的边传播标签的算法。用户的手机号码、ip地址以及设备号都有一个标注特征,标注该手机号码、ip地址或者设备号是否在服务端的黑名单、白名单或者未确认名单中中,其中,一个用户的手机号码、与该手机号码对应的设备号可以在白名单、但是其所对应的ip地址可以在黑名单中;也有可能是该用户的手机号码、ip地址以及设备号都在黑名单中。黑名单和白名单中的数据是根据历史经验获取的,黑名单数据有些是用户举报、拉黑得到的,白名单是根据用户在某app中的活动参与量等特征得到的。将提取得到的用户特征输入到标签传播算法中,标签传播算法会以手机号码、ip以及设备号这三类作为关系节点,基于三类关系节点之间的联系构建关系网络。其中,两关系节点之间的关系,在关系网络中表现为连接两关系节点的边。用户数据中包括实时用户数据,可以将实时用户数据直接应用实时采集到的用户数据,保证异常用户预测的及时性。然后根据构建的关系网络预测得到异常用户群体。本实施例通过neo4j算法进行异常用户群体的预测,无需根据既定的节点模板得到风险图,使得预测过程的灵活性更强,普适性更强。步骤206,基于预设权重比例,根据异常用户群体中的用户数量、标定特征以及共同特征对异常用户群体进行评分。预设权重比例是根据历史经验得到的用于整合异常用户群体各特征值的比例,可以根据具体应用场景设定;标定特征包括但不限于用户的每日签到、新人注册、邀新注册、特定活动等维度的特征;特定活动包括但不限于双十一活动、618活动等对用户来说具有获得高回报卡券、优惠券等虚拟对象的活动;共同特征指的是异常用户群体中的异常用户可能具有的相同特征维度的特征,比如一个异常用户群体中超过50%的异常用户具有相同的设备号、手机归属地、注册时间或相同的ip。步骤208,根据评分为异常用户群体生成对应的靶向标签,并根据靶向标签对检测到的具有特定操作的异常用户群体进行验证处理。特定操作一般包括:异常用户群体中异常用户的请求登录某app账号的操作、请求获取某app中某功能模块的操作等。不同范围的评分对应不同的靶向标签,不同的靶向标签会触发不同的验证处理机制。比如,当得到某一异常用户群体的评分为91时,可以为该异常用户群体生成一个靶向标签为拒绝登录和/或拒绝参与活动的标签,限制该异常用户群体的活动,比如拒绝登录的验证处理,以实现对不同异常用户群体进行不同验证处理的目的,还可以实现降低异常用户群体产生的冗余数据,从而提高服务端数据处理效率的目的。上述基于neo4j的异常用户处理方法中,通过在服务端通过neo4j算法预测出异常用户群体,然后根据异常用户群体的三类指定的特征对其进行评分,根据评分结果生成对应的靶向标签,根据不同的靶向标签对异常用户群体中异常用户的登录、活动等行为进行不同程度的处理,实现对不同异常用户群体进行不同验证处理目的,还可以实现降低异常用户群体产生的冗余数据,从而提高服务端数据处理效率的目的。在一个实施例中,如图3所示,步骤204,包括:步骤302,通过neo4j算法构建基于各用户特征之间关联关系的关系网络,其中,关系网络主要由关系节点为手机号码、ip地址以及设备号组成。如图4a、4b关系图谱示意图所示,三角形代表ip地址、圆形代表手机号码、五边形代表设备号,一个ip地址可以对应多个手机号、一个手机号码也可以对应多个设备号、一个设备号也可以对应多个ip地址,通常,设备号与ip地址通过手机号码进行关联,形成二度关系,而手机号码分别与设备号、ip地址进行直接关联,形成一度关系。其中,图4a是根据正常用户数据(白名单用户、非白非黑未确认节点的用户数据)构建出的关系网络,可以看出在单点特征上正常用户的关系网络较为分散;图4b是根据黑名单用户数据构建的关系网络,在一些单点特征上,同正常用户一样呈现出分散的特点,使得单点特征防御难以奏效,但是如果将用户特征用网络的形式建模展示,会发现在一些特殊的图形特征上,异常行为明显异于正常行为。其中,单点特征指的是单个特征。比如,用户使用的设备号数量、ip数量这是两个特征,单单从一个特征上看,比如设备号数量这一个单点特征看,无法区分异常用户和正常用户。用户特征是指用户在某个时间(段)做了某一件事情,例如用户在凌晨1点到3点登陆了某app10次;用户30天内在某app中签到了20次,这些都属于用户特征。进一步地,通过neo4j构建基于用户数据的关系网络如图4c中关系图谱示意图所示,其中,图4c只是示例性的。步骤304,获取关系节点的标注特征,并根据标注特征对关系节点进行分类,得到黑名单节点、白名单节点以及未确认节点,其中,标注特征为关系节点的初始类别。标注特征表示用户的手机号码、ip地址或者设备号是属于黑名单中的黑名单节点、白名单中的白名单节点或者未确认名单中的未确认节点中的哪一种。刚获取到的关系网络都会有一个初始类别,初始类别包括该ip地址、手机号码或设备号属于黑名单、白名单还是未确认名单,其中,可为黑名单的关系节点生成的标签为1,为白名单以及未确认名单的关系节点生成的标签为0。步骤306,为关系节点生成属性标签,其中,属性标签包括异常、正常。特别的,黑名单中的手机号码、设备号以及ip地址的标注特征,用于标注各关系节点的初始的属性标签属于异常,还有一个属性标签:black标签;而白名单中的关系节点的标注特征,用于标注各关系节点的初始的属性标签属于正常,且还具有一个属性标签:white标签,black标签和white标签是为了防止黑、白名单中关系节点的属性标签在后续节点标签更新时被刷新;而未确认名单中的关系节点(手机号码、ip地址以及设备号)的属性标签为:unidentified(意为未确认标签),在后续的标签预测中可以被刷新,其初始的标注特征为正常。即,位于黑名单或者白名单中的ip地址、设备号或手机号码的属性标签最终不会被更新或改变。步骤308,分别以属性标签为异常的手机号码、ip地址的关系节点为种子节点,从关系网络中获取路径长度不大于第一预设值的节点路径,得到节点关系图谱,其中,关系图谱包括基于异常手机号码节点的异常号码关系图谱和基于异常ip节点的异常ip关系图谱。以属性标签为异常的ip地址为种子节点,获取路径长度不大于第一预设值的节点路径组成的基于异常ip节点的异常ip关系图谱,其中,第一预设值根据经验可以设置为10。还需要以属性标签为异常的手机号码为种子节点,获取路径长度不大于10的节点路径组成的基于异常手机号码节点的异常号码关系图谱。具体地,可以通过neo4j的cypher语言查找路径长度在1到10之间的关系节点组成的节点路径。表达方式可以为(a)-[*1..10]->(b),cypher语言类似sql查询语句。其中,a、b表示的是关系节点,[*1..10]表示的是1到10度的节点路径。本实施例以两个不同类型的关系节点作为种子节点进行关系图谱的构建是为了使得预测的图谱更加全面、预测的过程更加高效;若以一个关系节点作为种子节点构建一个大的关系图谱,则需要获取不大于n的节点路径,n为整数;而n需要远远大于10才能够保证大部分的节点连接情况能够被包含在关系图谱中,而这样就会导致在关系图谱构建过程中路径切分耗时过长,影响预测效率。所以使用两个节点构建两个关系图谱,即能够保证关系图谱的完整性,也能够保证切分的效率。步骤310,分别对异常号码关系图谱与异常ip关系图谱中的未确认节点进行标签预测,得到异常用户群体。这一步也是在标签传播算法里实现的,在首轮标签更新前,对于未确认名单中的关系节点的标签默认为正常,而其他的关系节点的属性标签要么确定是异常,要么确定是正常。例如,关系节点a的属性标签已更新完,从正常变成了异常,而关系节点b与关系节点a互为邻居节点,关系节点b的标签更新结果就会受到关系节点a的标签影响。具体地,对比未确认节点的属性标签为异常、正常的邻居节点的数量,得到标签对比结果。标签刷新时,对于未确认节点(unidentified节点),根据其邻居节点的标签,对其标签进行更新。根据标签对比结果更新未确认节点的属性标签。对于未确认名单中的某个未确认节点,结合该关系节点所有的邻居节点的属性标签,若所有邻居节点的属性标签为正常的大于属性标签为异常的,则为该关系节点生成正常的属性标签,反之,若则生成异常的属性标签。如果,属性标签为正常的数量和为异常的数量的邻居节点一样多,则给该关系节点随机生成标签异常或者正常,这时生成异常或正常的标签对异常用户群体的预测并无不利影响。按照预设修正条件对属性标签更新后的关系节点进行属性标签的修正,并重复属性标签对比、更新的操作,直到每个未确认节点的属性标签不再改变或者更新次数达到阈值,将最后一次属性标签更新后关系图谱,作为待预测图谱。其中,预设修正条件是在标签更新过程中对关系节点的标签进行调整的条件。具体地,在每一轮标签变更后,需要对一部分关系节点的标签结果进行修正:即与白名单中ip地址具有一度关系的未确认节点,其属性标签都置为正常。对两个关系图谱中的每个未确认节点,依次按这样的方式,进行标签刷新,直到每个关系节点的标签结果不变或刷新的轮数达到阈值10000。标签迭代过程中,仅仅针对未确认名单中的关系节点进行迭代,遍历时间短。在对异常号码关系图谱中的属性标签进行预测时,在每次迭代后,对与白名单中ip地址关联的一度节点(即手机号码节点),重新置为正常,在对异常ip关系图谱中的属性标签进行预测时,在每次迭代后,将与白名单手机号关联的一度节点(ip)的标签重置为0,防止使用企业wifi的用户被置为黑名单。提高异常用户群体预测的准确率。断开待预测图谱中的异常边,得到多个关系子图,其中,异常边为任意两关系节点直接相连组成的边中至少有一个关系节点的属性标签为正常的边。具体地,将与白名单节点中的ip地址具有一度关系的手机号码的属性标签设为正常,其中,一度关系是指两个直接相连的关系节点的关联关系。通过该方式生成的关系子图中,所有的关系节点的标签都为正常,以此保证每一个手机号节点的邻居节点的属性标签也都为正常。本实施例依照只有当同一用户的手机号节点、ip节点以及设备号节点的标签全部都是异常的时候,才会将该手机号结点所对应的用户标记为异常用户。统计关系子图中关系节点的属性标签,若属性标签为异常的手机号码或ip地址的数量大于第二预设值,则将关系子图中的关系节点对应的用户群体作为异常用户群体。用户是根据手机号码/ip地址来确认的。一般羊毛党的数量都是聚众出现,使用一个手机号码在不同ip地址下、不同设备号上刷数据,还有在同一ip地址下使用不同手机号、不同设备号;其用户欺诈类型又可以分为养号欺诈团伙、活动欺诈团伙,比如某个欺诈团伙,所有的手机号码的在某app上的签到次数为0,参加活动次数为0,则可以将该欺诈团伙定义为养号欺诈团伙;若某个欺诈团伙,所有的手机号参加活动的次数不为0,则该欺诈团伙定义为活动欺诈团伙。进一步地,还可以比较得到的异常用户群体对异常用户群体进行去重处理,具体地,若基于异常手机号码节点的异常用户群体与基于异常ip节点的异常用户群体相同,则合并异常用户群体,得到合并后的异常用户群体。因为基于不同节点为中心进行群体预测,可能会得到同一用户,即在异常手机号码为中心节点进行预测得到的a群体中,也在异常ip节点为中心得到的a群体中,所以需要查找得到的异常用户群体是否有相同标签,将相同标签的异常用户群体的同一用户,进行合并,以节省存储空间,并给合并后的异常用户群体生成相同的靶向标签,后续当检测到该异常用户群体中的异常用户的特定操作,比如登录操作后,会根据该异常用户的靶向标签,对其进行对应的验证处理。如果没有检测到,则说明预测得到的是不同的异常用户群体,则为不同的异常用户群体生成不同的靶向标签,并当检测到这些异常用户群体中的异常用户的特定操作后,比如登录操作后,根据其对应的靶向标签,调用对应的验证接口对该异常用户进行验证处理。通过本实施例提高了数据存储的效率。本实施例直接通过关系节点之间互为邻居标签,对需要确定标签的关系节点进行标签更新,不局限于为其中某一指定的关系节点更新标签,除特殊标签(黑名单、白名单)外,所有节点的标签在预测中都在不断被刷新,保证在标签预测时能够充分利用邻居标签的影响力,最后断开存在标签为正常的节点所在的关系边生成子图,使得预测过程的灵活性更强,普适性更强,而且在标签迭代过程中,仅仅针对未确认节点进行迭代,遍历时间短。且迭代一次后,将与白名单的ip地址关联的一度节点(即手机号码)的标签重新置为正常,防止使用企业wifi的用户被置为黑名单这类情况的错误预测。在一个实施例中,如图5所示,步骤206,包括:步骤502,获取异常用户群体的用户数量,并根据第一预设评级分数和用户数量设定异常用户群体的第一评级分数。用户数量指的是一个异常用户群体中异常用户的个数,可以根据该用户数量确定该异常用户群体的第一评级分数;具体地:异常用户群体的用户数量与第一评级分数如表1:用户数量/个第一评级分数/分<=1010(10,30]20(30,50]40(50,70]60(70,90]80>90100表1步骤504,获取异常用户群体中具有标定特征的异常用户的标定数量,根据标定特征的运算优先级确定异常用户群体的第二评级分数。标定特征的运算优先级是指示不同标定特征对第二评级分数影响的优先程度。比如每日签到40分,新人注册60分,邀新注册80分,特定活动100分,其中,特定活动的运算优先级大于日签到,新人注册以及邀新注册,邀新注册的运算优先级又大于每日签到和新人注册,而新人注册的又大于每日签到。当一个异常用户群体中超过50%的异常用户参与了每日签到、邀新注册以及特定活动,则以特定活动对应的分数作为该异常用户群体的第二评级分数。其中超过50%即是标定数量。比如,若标定数量低于50%,则可以不为该异常用户群体进行评分,也就是第二评级分数为0。步骤506,统计异常用户群体中具有共同特征的异常用户的共有数量,并根据共有数量以及第二预设评级分数确定异常用户群体的第三评级分数。共有数量是异常用户群体中具有某共同特征的异常用户的人数,可以用于评断是否根据共有特征对应的分数确定异常用户群体的第三评级分数。共同特征是指异常用户具有相同ip、手机归属地、相同注册时间以及相同设备号。相同ip-40、同手机归属地-60、同注册时间-80、同设备号-100;若一个异常用户群体有50%异常用户使用相同ip、同注册时间、同设备号,则该异常用户群体的得分依据分数最高的共有特征对应的分数,即同设备号100分。步骤508,按照预设权重比例联合第一评级分数、第二评级分数以及第三评级分数,得到异常用户群体的评分。依据以上3种分级分数条件,并按照预设权重比例1:2:2,给异常用户群体打分,其中,预设权重比例是根据经验得到的,以这种比例计算评分的准确率比较高:比如,异常用户群体a:第一分级分数:20分*0.2第二分级分数:80分*0.4第三分级分数:100分*0.4则,分数为:4+32+40=76分最后根据最终分数为该异常用户群体生成不同的靶向标签;具体地:不同的靶向标签的异常用户触发服务端不同的验证机制,登录时短信验证的靶向标签会在用户登录时触发短信验证机制,对用户进行验证等等,从而当异常用户登录app/网页时,采取不同的验证方式,增加异常用户的验证门槛,防止机器批量操作,降低服务端垃圾数据的处理量,提高数据处理效率。进一步地,若检测到异常用户的特定操作,则获取异常用户所在异常用户群体的靶向标签;该异常用户的靶向标签是在检测到还用户的特定操作之前预先生成的,当检测到该异常用户群体中的某个或某些异常用户的特定操作,比如登录操作后,则会获取该异常用户的靶向标签,并根据靶向标签调用对应的验证处理接口,对该异常用户的活动权限进行验证处理;判断对异常用户的活动权限的验证处理次数是否超过权限值,并将超过权限值的异常用户设为锁定用户。具体地,针对异常用户,根据他们的得分可以调用短信接口,发送短信验证码。如果在有效时间内,用户使用正确短信登录则登录成功,那么在有效时间内用户下一次登录时,则不会再次调用该短信接口。如果登录失败,则会再一次调用短信接口,直到调用短信接口的次数,即权限值连续3次,则意味着在有效时间内用户都没有输入正确的验证码,则登录失败,锁定账号,并将该异常用户设为锁定用户,并限制其其他操作。通过本实施例采取不同的验证方式,增加异常用户的验证门槛,防止机器批量操作,降低服务端垃圾数据的处理量,提高了数据处理效率。应该理解的是,虽然图2-图3、图5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-图3、图5中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。在一个实施例中,如图6所示,提供了一种基于neo4j的异常用户处理装置,该基于neo4j的异常用户处理装置与上述实施例中基于neo4j的异常用户处理方法一一对应。该基于neo4j的异常用户处理装置包括:提取模块602,用于对获取到的用户数据进行用户特征提取。检测模块604,用于将提取到的用户特征输入到neo4j算法中进行预测,得到用户数据中具有相同属性标签的用户群体,作为异常用户群体。评分模块606,用于基于预设权重比例,根据异常用户群体中的用户数量、标定特征以及共同特征对异常用户群体进行评分。以及处理模块608,用于根据评分为异常用户群体生成对应的靶向标签,并根据靶向标签对检测到的具有特定操作异常的用户群体进行验证处理。需要强调的是,为进一步保证上述用户数据的私密和安全性,上述用户数据还可以分布式存储于区块链的节点中。进一步地,检测模块604,包括:构建子模块,用于通过neo4j算法构建基于各用户特征之间关联关系的关系网络,其中,关系网络主要由关系节点为手机号码、ip地址以及设备号组成。分类子模块,用于获取关系节点的标注特征,并根据标注特征对关系节点进行分类,得到黑名单节点、白名单节点以及未确认节点,其中,标注特征为关系节点的初始类别。标签子模块,用于为关系节点生成属性标签,其中,属性标签包括异常、正常。筛选子模块,用于分别以属性标签为异常的手机号码、ip地址的关系节点为种子节点,从关系网络中获取路径长度不大于第一预设值的节点路径,得到节点关系图谱,其中,关系图谱包括基于异常手机号码节点的异常号码关系图谱和基于异常ip节点的异常ip关系图谱。预测子模块,用于分别对异常号码关系图谱与异常ip关系图谱中的未确认节点进行标签预测,得到异常用户群体。进一步地,预测子模块,包括:对比单元,用于对比未确认节点的属性标签为异常、正常的邻居节点的数量,得到标签对比结果。更新单元,用户根据标签对比结果更新未确认节点的属性标签。修正单元,用于按照预设修正条件对属性标签更新后的关系节点进行属性标签的修正,并重复属性标签对比、更新的操作,直到每个未确认节点的属性标签不再改变或者更新次数达到阈值,将最后一次属性标签更新后关系图谱,作为待预测图谱。断边单元,用于断开待预测图谱中的异常边,得到多个关系子图,其中,异常边为任意两关系节点直接相连组成的边中至少有一个关系节点的属性标签为正常的边。统计单元,用于统计关系子图中关系节点的属性标签,若属性标签为异常的手机号码或ip地址的数量大于第二预设值,则将关系子图中的关系节点对应的用户群体作为异常用户群体。进一步地,预测子模块,还包括:比较单元,用于比较得到的异常用户群体。合并单元,用于若基于异常手机号码节点的异常用户群体与基于异常ip节点的异常用户群体相同,则合并异常用户群体,得到合并后的异常用户群体。进一步地,评分模块606,包括:第一分数子模块,用于获取异常用户群体的用户数量,并根据第一预设评级分数和用户数量设定异常用户群体的第一评级分数;第二分数子模块,用于获取异常用户群体中具有标定特征的异常用户的标定数量,根据标定特征的运算优先级确定异常用户群体的第二评级分数;第三分数子模块,用于统计异常用户群体中具有共同特征的异常用户的共有数量,并根据共有数量以及第二预设评级分数确定异常用户群体的第三评级分数;综合分数子模块,用于按照预设权重比例联合第一评级分数、第二评级分数以及第三评级分数,得到异常用户群体的评分。进一步地,处理模块608,包括;获取子模块,用于若检测到异常用户的特定操作,则获取异常用户所在异常用户群体的靶向标签;以及调用子模块,用于根据接口调用类型调用对应的接口对异常用户的活动权限进行处理;以及锁定子模块,用于判断对异常用户的活动权限的处理次数是否超过权限值,并将超过权限值的异常用户设为锁定用户。上述基于neo4j的异常用户处理装置,通过根据异常用户群体中的用户数量、特征对异常用户进行评级分级,然后根据评级分级生成靶向标签,当异常用户触发特定操作后根据靶向标签触发不同的处理机制,对异常用户进行针对性的验证处理,解决了现有技术中对异常用户的处理不准确的技术问题。在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储用户数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于neo4j的异常用户处理方法。其中,本
技术领域
技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(applicationspecificintegratedcircuit,asic)、可编程门阵列(field-programmablegatearray,fpga)、数字处理器(digitalsignalprocessor,dsp)、嵌入式设备等。通过根据异常用户群体中的用户数量、特征对异常用户进行评级分级,然后根据评级分级生成靶向标签,当异常用户触发特定操作后根据靶向标签触发不同的处理机制,对异常用户进行针对性的验证处理,解决了现有技术中对异常用户的验证处理不准确的技术问题。在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中基于neo4j的异常用户处理方法的步骤,例如图2所示的步骤202至步骤208,或者,处理器执行计算机程序时实现上述实施例中基于neo4j的异常用户处理装置的各模块/单元的功能,例如图6所示模块602至模块608的功能。为避免重复,此处不再赘述。通过根据异常用户群体中的用户数量、特征对异常用户进行评级分级,然后根据评级分级生成靶向标签,当异常用户触发特定操作后根据靶向标签触发不同的处理机制,对异常用户进行针对性的验证处理,解决了现有技术中对异常用户的验证处理不准确的技术问题。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形、改进或者对部分技术特征进行等同替换,而这些修改或者替换,并不使相同技术方案的本质脱离本发明个实施例技术方案地精神和范畴,都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。当前第1页12
当前第1页1 2 
当前第1页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!
1