一种识别非法用户的方法和设备与流程

文档序号:12491232阅读:379来源:国知局
一种识别非法用户的方法和设备与流程

本申请涉及互联网信息处理技术领域,尤其涉及一种识别非法用户的方法和设备。



背景技术:

随着科学技术的飞速发展,出现了各种各样的资源服务平台,例如:资源共享平台、资源存储平台等。这些资源服务平台可以根据用户的需求为用户分配资源,使得用户利用获取的资源执行各种各样的业务,极大地方便了用户的日常生活。

为了更好地为用户提供资源服务,网络服务商可以根据用户在资源服务平台上产生的用户行为数据确定该用户的资源属性,并根据用户的资源属性确定为用户分配资源的数量,这里资源的数量表征用户能够从资源服务平台获取的由用户自由支配的资源的多少,通常情况下,用户的资源属性越好,网络服务商为用户分配的资源数量越多。

然而,在实际应用中,有些用户为了获取更多的资源,通过恶意手段提升用户的资源属性,例如:在不需要执行业务时,故意与其他用户之间发生业务故而产生用户行为数据,使得资源服务平台根据产生的这些用户行为数据增加用户的资源属性,这样,用户就能够从资源服务平台中获取更多的资源。但是,这对于资源服务平台来讲,属于一种高风险事件。

目前,为了避免这种高风险事件发生,资源服务平台通过获取不同用户之间的通信内容,根据该通信内容寻找恶意提高资源属性的非法用户,但是,这种方式存在片面性,导致识别非法用户的精度比较低,使得高风险事件发生的概率比较高,增加了资源服务平台的风险。



技术实现要素:

有鉴于此,本申请实施例提供了一种识别非法用户的方法和设备,用于解决现有技术中识别非法用户的精度比较低的问题。

一种识别非法用户的方法,包括:

获取待处理用户的基本信息以及与所述待处理用户建立社会化关系的N个第一用户的基本信息,其中,所述基本信息用于表征用户的基本属性的信息;

根据所述待处理用户的基本信息和所述N个第一用户的基本信息,计算所述待处理用户的信息相异值,其中,所述信息相异值用于表征所述待处理用户与所述N个第一用户之间的基本信息不相同的程度值;

根据所述信息相异值,识别所述待处理用户是否属于非法用户。

一种识别非法用户的设备,包括:

获取单元,用于获取待处理用户的基本信息以及与所述待处理用户建立社会化关系的N个第一用户的基本信息,其中,所述基本信息用于表征用户的基本属性的信息,N为自然数;

计算单元,用于根据所述待处理用户的基本信息和所述N个第一用户的基本信息,计算所述待处理用户的信息相异值,其中,所述信息相异值用于表征所述待处理用户与所述N个第一用户之间的基本信息相异的程度值;

识别单元,用于根据所述信息相异值,识别所述待处理用户是否属于非法用户。

本申请有益效果如下:

本申请实施例获取待处理用户的基本信息以及与所述待处理用户建立社会化关系的N个第一用户的基本信息,所述基本信息用于表征用户的基本属性的信息,N为自然数;根据所述待处理用户的基本信息和所述N个第一用户的基本信息,计算所述待处理用户的信息相异值,所述信息相异值用于表征所述待处理用户与所述N个第一用户之间的基本信息不相同的程度值;根据所述信息相异值,识别所述待处理用户是否属于非法用户。基于用户在互联网平台中 注册的基本信息,通过分析与目标用户建立社会化关系的其他用户的基本信息,进而确定目标用户与其他用户之间基本信息的差异程度,这样能够判断出目标用户与其他用户之间是否存在不正常的业务关系,进而识别出目标用户是否属于非法用户,有效提高识别非法用户的精度,同时能够降低高风险事件发生的概率,降低资源服务平台的风险。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种识别非法用户的方法的流程示意图;

图2为生成地理位置信息这一信息特征对应的信息分布图;

图3为本申请实施例提供的一种识别非法用户的设备的结构示意图。

具体实施方式

为了实现本申请的目的,本申请实施例提供了一种识别非法用户的方法和设备,获取待处理用户的基本信息以及与所述待处理用户建立社会化关系的N个第一用户的基本信息,所述基本信息用于表征用户的基本属性的信息,N为自然数;根据所述待处理用户的基本信息和所述N个第一用户的基本信息,计算所述待处理用户的信息相异值,所述信息相异值用于表征所述待处理用户与所述N个第一用户之间的基本信息不相同的程度值;根据所述信息相异值,识别所述待处理用户是否属于非法用户。基于用户在互联网平台中注册的基本信息,通过分析与目标用户建立社会化关系的其他用户的基本信息,进而确定目标用户与其他用户之间基本信息的差异程度,这样能够判断出目标用户与其他用户之间是否存在不正常的业务关系,进而识别出目标用户是否属于非法用户,有效提高识别非法用户的精度,同时能够降低高风险事件发生的概率,降 低资源服务平台的风险。

需要说明的是,本申请实施例中所记载的用户的基本信息是指表征用户的基本属性的信息,这里的基本属性可以是指用户所在的地理位置信息、用户的职业类型、用户的学历信息等等;还可以是指用户的兴趣爱好、用户所毕业院校等等,这里不做具体限定。

本申请实施例中所述的非法用户可以是指通过非法手段提高用户资源属性的用户,这里的非法手段可以是指在不需要执行业务时,故意与其他用户之间发生业务故而产生用户行为数据,使得资源服务平台根据产生的这些用户行为数据增加用户的资源属性,也可以是通过恶意执行业务,使得资源服务平台根据产生的这些用户行为数据增加用户的资源属性,例如:用户A为了增加资源属性(可以是信用分),通过与用户B的交流,与用户B之间制造购买业务,实现用户A资源属性的增加等等。

下面结合说明书附图对本申请各个实施例作进一步地详细描述。显然,所描述的实施例仅仅是本申请一部份实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。

图1为本申请实施例提供的一种识别非法用户的方法的流程示意图。所述方法可以如下所示。

步骤101:获取待处理用户的基本信息以及与所述待处理用户建立社会化关系的N个第一用户的基本信息。

其中,所述基本信息用于表征用户的基本属性的信息,N为自然数。

在步骤101中,不管是在现实生活中还是在互联网提供的虚拟环境中,不同用户之间建立的社会化关系还是存在一定的规律性的。俗话说:物以类聚,人以群分。那么在本申请实施例中可以基于这样的规律判断不同用户之间的建立的社会化关系属于正常的社会化关系还是异常的社会化关系。

本申请实施例中记载的与所述待处理用户建立社会化关系的N个第一用 户的基本信息可以预先存在在不同应用的服务器中,这样在获取到待处理用户的基本信息后,可以通过待处理用户的用户标识从不同服务器中获取与与所述待处理用户建立社会化关系的N个第一用户的用户标识,进而根据获取到的N个用户的用户标识分别查找这N个用户的基本信息。

具体地,确定待处理用户,获取待处理用户的基本信息以及与该待处理用户建立社会化关系的多个其他用户的基本信息,这里将其他用户称之为第一用户,“多个”解释为至少一个。

其中,本申请实施例中所记载的社会化关系可以是指同学关系(例如:包含小学、中学、大学以及研究生各个学习阶段建立的同学关系);也可以是指亲戚关系;还可以是指业务交互关系(例如:基于互联网平台产生的买卖关系;基于互联网平台产生的支付关系等等),这里对于社会化关系不做具体限定。

为了保证不同用户之间信息交互的安全性,服务商需要用户真实注册用户的基本信息,即用户在使用互联网平台建立社会化关系之前,用户在互联网平台上注册基本信息,使得服务器获取到的用户的基本信息是真实的,这样能够后续分析的准确性。

步骤102:根据所述待处理用户的基本信息和所述N个第一用户的基本信息,计算所述待处理用户的信息相异值。

其中,所述信息相异值用于表征所述待处理用户与所述N个第一用户之间的基本信息不相同的程度值。

在步骤102中,首先,在获取到待处理用户的基本信息时,根据所述待处理用户的基本信息,确定所述基本信息中包含的每一种属性信息的信息特征。

具体地,获取待处理用户的基本信息包含用户所在城市、用户的最高学历、用户的职业类型、用户的兴趣爱好、用户经常访问的网页等等。

这里“用户所在城市”、“用户的最高学历”、“用户的职业类型”、“用户的兴趣爱好”、“用户经常访问的网页”都可以分别称为一种属性信息,不同属性信息对应不同的信息特征。例如:“用户所在城市”这一属性信息,对应的信 息特征可以是地理位置信息。

其次,针对每一种信息特征,分别执行以下操作:选择其中一种信息特征,分别确定所述信息特征对应的所述待处理用户的信息内容和所述信息特征对应的所述N个第一用户的信息内容;根据所述待处理用户的信息内容和所述N个第一用户的信息内容,计算得到所述信息特征对应的所述待处理用户的第一信息相异值。

下面以信息特征为地理位置信息为例进行详细说明。

假设待处理用户所在城市为北京市,那么针对待处理用户的地址位置信息这一信息特征对应的信息内容为北京市;分别确定获取到的N个第一用户的地理位置信息这一信息特征对应的信息内容,假设N为10,这10位第一用户的地址位置信息这一信息特征对应的信息内容分别是:北京市、北京市、北京市、上海市、杭州市、苏州市、重庆市、成都市、西安市和广州市。

分析可以得出,与待处理用户属于同一个城市的用户个数占N的30%,与待处理用户不属于同一个城市的用户个数占N的70%。

此时,根据分析结果,可以计算出地理位置信息这一信息特征对应的待处理用户的第一信息相异值。

为了准确分析出待处理用户与N个第一用户之间基本信息相异的程度,将为每一种信息特征设定两个阈值:一个阈值是待处理用户与第一用户之间基本信息相同的最大阈值,另一个阈值是待处理用户与第一用户之间基本信息相同的最小阈值,这两个阈值的设置可以通过机器学习确定,也可以通过分析大量历史数据确定。需要说明的是,针对不同的信息特征,所设定的两个阈值的大小可能不同。

例如:针对地理位置信息这一信息特征,假设以待处理用户与N个第一用户之间的属于同一个地理位置为前提设置阈值,那么设定的最大阈值为a,可以表示与待处理用户属于同一个城市的用户个数占N的最大百分数;设定的最小阈值为b,可以表示与待处理用户属于同一个城市的用户个数占N的最小百 分数,那么计算出地理位置信息这一信息特征对应的待处理用户的第一信息相异值可以表示为(30%-b)与(a-b)的商值。

假设以待处理用户与N个第一用户之间的不属于同一个地理位置为前提设置阈值,那么设定的最大阈值为a,可以表示与待处理用户不属于同一个城市的用户个数占N的最大百分数;设定的最小阈值为b,可以表示与待处理用户不属于同一个城市的用户个数占N的最小百分数,那么计算出地理位置信息这一信息特征对应的待处理用户的第一信息相异值可以表示为(70%-b)与(a-b)的商值。

可选地,在本申请实施例中,根据所述待处理用户的信息内容和所述N个第一用户的信息内容,计算得到所述信息特征对应的所述待处理用户的第一信息相异值,包括:

针对选择的信息特征,根据所述待处理用户的信息内容和所述N个第一用户的信息内容,生成选择的信息特征对应的信息分布图;

基于所述信息分布图,计算得到所述信息特征对应的所述待处理用户的第一信息相异值。

仍以上述事实为例,假设待处理用户所在城市为北京市,那么针对待处理用户的地址位置信息这一信息特征对应的信息内容为北京市;分别确定获取到的N个第一用户的地理位置信息这一信息特征对应的信息内容,假设N为10,这10位第一用户的地址位置信息这一信息特征对应的信息内容分别是:北京市、北京市、北京市、上海市、杭州市、苏州市、重庆市、成都市、西安市和广州市,那么基于得到的信息内容,生成地理位置信息这一信息特征对应的信息分布图,如图2所示。

从图2中可以看出,分布在北京的人数比较多,即与待处理用户属于同一个地理位置的用户个数占N的百分数数值比较大。

那么基于图2,可以采用上述方式计算得到地理位置信息这一信息特征对应的待处理用户的第一信息相异值。

需要说明的是,假设以与待处理用户之间产生业务关系的M个用户为研究对象,在确定待处理用户与这M个用户之间的信息相异值时,也可以根据业务关系中包含的信息(例如:M个用户所分布的城市、待处理用户与M个用户发生业务的次数等等)确定不同信息对应的信息特征,基于确定的信息特征分别计算所述待处理用户的第一信息相异值,计算方式可以采用上述方式,这里不再做详细描述。

最后,在得到每一个信息特征对应的所述待处理用户的第一信息相异值时,根据得到的所述第一信息相异值,计算得到的所述待处理用户的信息相异值。

具体地,确定不同信息特征对应的权重值;并根据每一种信息特征对应的权重值和所述信息特征对应的第一信息相异值,计算得到所述待处理用户的信息相异值。

本申请实施例中所记载的不同信息特征对应的权重值,可以根据不同信息特征对信息相异值的影响程度确定,也可以根据经验值确定,这里不做限定。

例如:通过以下方式计算得到所述待处理用户的信息相异值:

信息相异值=∑(信息特征的权重值*该信息特征对应的第一信息相异值)。

步骤103:根据所述信息相异值,识别所述待处理用户是否属于非法用户。

在步骤103中,在计算得到信息相异值时,根据所述信息相异值,确定所述待处理用户属于非法用户的概率值;并在所述概率值大于设定阈值时,识别所述待处理用户属于非法用户。

由于信息相异值的大小说明待处理用户与所述N个第一用户之间的基本信息相异的程度值,信息相异值越大,说明待处理用户通过建立社会化关系恶意提高资源属性的概率越高,那么当概率值大于设定阈值时,说明需要对该待处理用户进行预防,即可识别出该待处理用户属于非法用户,这样对于该待处理用户产生能够导致资源属性增加的用户行为进行处理,以保证该待处理用户的资源属性比较合理,这样后续在为该用户分配资源时,能够有效降低高风险 事件发生的概率,降低资源服务平台的风险。

通过本申请实施例的方案,获取待处理用户的基本信息以及与所述待处理用户建立社会化关系的N个第一用户的基本信息,所述基本信息用于表征用户的基本属性的信息,N为自然数;根据所述待处理用户的基本信息和所述N个第一用户的的基本信息,计算所述待处理用户的信息相异值,所述信息相异值用于表征所述待处理用户与所述N个第一用户之间的基本信息不相同的程度值;根据所述信息相异值,识别所述待处理用户是否属于非法用户。基于用户在互联网平台中注册的基本信息,通过分析与目标用户建立社会化关系的其他用户的基本信息,进而确定目标用户与其他用户之间基本信息的差异程度,这样能够判断出目标用户与其他用户之间是否存在不正常的业务关系,进而识别出目标用户是否属于非法用户,有效提高识别非法用户的精度,同时能够降低高风险事件发生的概率,降低资源服务平台的风险。

图3为本申请实施例提供的一种识别非法用户的设备的结构示意图。所述设备包括:获取单元31、计算单元32和识别单元33,其中:

获取单元31,用于获取待处理用户的基本信息以及与所述待处理用户建立社会化关系的N个第一用户的基本信息,其中,所述基本信息用于表征用户的基本属性的信息,N为自然数;

计算单元32,用于根据所述待处理用户的基本信息和所述N个第一用户的基本信息,计算所述待处理用户的信息相异值,其中,所述信息相异值用于表征所述待处理用户与所述N个第一用户之间的基本信息相异的程度值;

识别单元33,用于根据所述信息相异值,识别所述待处理用户是否属于非法用户。

在本申请的另一实施例中,所述计算单元32根据所述待处理用户的基本信息和所述N个第一用户的的基本信息,计算所述待处理用户的信息相异值,包括:

根据所述待处理用户的基本信息,确定所述基本信息中包含的每一种信息 的信息特征;

针对每一种信息特征,分别执行以下操作:

选择其中一种信息特征,分别确定所述信息特征对应的所述待处理用户的信息内容和所述信息特征对应的所述N个第一用户的信息内容;

根据所述待处理用户的信息内容和所述N个第一用户的信息内容,计算得到所述信息特征对应的所述待处理用户的第一信息相异值;

在得到每一个信息特征对应的所述待处理用户的第一信息相异值时,根据得到的所述第一信息相异值,计算得到的所述待处理用户的信息相异值。

在本申请的另一实施例中,所述计算单元32根据所述待处理用户的信息内容和所述N个第一用户的信息内容,计算得到所述信息特征对应的所述待处理用户的第一信息相异值,包括:

针对选择的信息特征,根据所述待处理用户的信息内容和所述N个第一用户的信息内容,生成选择的信息特征对应的信息分布图;

基于所述信息分布图,计算得到所述信息特征对应的所述待处理用户的第一信息相异值。

在本申请的另一实施例中,所述计算单元32根据得到的所述第一信息相异值,计算得到的所述待处理用户的信息相异值,包括:

确定不同信息特征对应的权重值;

根据每一种信息特征对应的权重值和所述信息特征对应的第一信息相异值,计算得到所述待处理用户的信息相异值。

在本申请的另一实施例中,所述识别单元33根据所述信息相异值,识别所述待处理用户是否属于非法用户,包括:

根据所述信息相异值,确定所述待处理用户属于非法用户的概率值;

在所述概率值大于设定阈值时,识别所述待处理用户属于非法用户。

需要说明的是,本申请实施例中所述的识别设备可以通过软件方式实现,也可以通过硬件方式实现,例如,控制设备等,这里不做限定。

本申请实施例中所记载的识别设备基于用户在互联网平台中注册的基本信息,通过分析与目标用户建立社会化关系的其他用户的基本信息,进而确定目标用户与其他用户之间基本信息的差异程度,这样能够判断出目标用户与其他用户之间是否存在不正常的业务关系,进而识别出目标用户是否属于非法用户,有效提高识别非法用户的精度,同时能够降低高风险事件发生的概率,降低资源服务平台的风险。

本领域的技术人员应明白,本申请的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1