一种用户识别方法、装置及服务器与流程

文档序号:15845410发布日期:2018-11-07 08:57阅读:137来源:国知局
一种用户识别方法、装置及服务器与流程

本发明涉及计算机技术领域,特别是涉及一种用户识别方法、装置及服务器。

背景技术

当前,随着互联网技术的不断发展,越来越多的用户选择通过网络来发布各类信息,例如,拍摄的视频、撰写的小说、产品广告等。这些用户通常都希望自己发布的信息能够获得更高的关注度,例如,更高的视频播放量、更高的小说阅读量、更高的广告点击率等。

然而,在很多情况下,上述关注度可能并不真实,上述信息的访问用户中存在模拟生成的并不真实存在的用户,即作弊用户。以广告为例,通常,广告商都希望发布的广告能够获得更高的点击量或者播放量,但是,可能出现作弊用户对广告进行点击或者播放的情况,导致广告的点击量或者播放量并不真实。

为了能够对作弊用户进行相应的处理,各类信息网站需要对信息访问用户中哪些是作弊用户进行识别,也就是进行反作弊。现有技术中,反作弊的方式通常为:在接收到访问请求后,服务器通过基于深度神经网络的模型来判断该访问请求对应的访问用户是否为作弊用户,进而,在用户识别过程中,服务器需要使用上述基于深度神经网络的模型对较多的参数进行较复杂的计算,以得到用户识别结果。

然而,发明人在通过上述方式识别作弊用户的过程中发现,该方式至少存在如下问题:由于服务器在识别过程中需要对较多的参数进行复杂的计算,因此,识别过程中服务器需要耗费的计算资源较多,进而,需要耗费的时间较多,用户识别的实时性较差。



技术实现要素:

本发明实施例的目的在于提供一种用户识别方法、装置及服务器,以减少用户识别过程中耗费的计算资源,缩短耗费的时间,提高用户识别的实时性。具体技术方案如下:

第一方面,本发明实施例提供了一种用户识别方法,应用于服务器,所述方法包括:

接收终端发送的访问请求,其中,所述访问请求中携带目标用户信息,所述目标用户信息包括多种类型的用户信息;

将所述目标用户信息与预先离线建立的对应关系进行匹配,确定匹配用户信息的类型及其对应的类型权重,其中,所述对应关系为:预先获取的作弊用户信息、作弊用户信息的类型及预设的类型权重的对应关系,所述匹配用户信息为:所述对应关系包括的与所述目标用户信息包括的各类型的用户信息相匹配的作弊用户信息;

根据所确定的类型及其所对应的类型权重,按照预设方式,计算作弊评估值;

根据所述作弊评估值与预设风险阈值的大小关系,确定所述访问请求对应的访问用户是否为作弊用户。

一种实现方式中,所述对应关系的建立方式包括:

获取多个离线反作弊系统中存储的预设类型的用户信息,其中,所述多个离线反作弊系统用于离线确定并存储接收到的访问请求对应的访问用户中作弊用户的各类型的用户信息;

针对所获取的用户信息中的每一个,判断该用户信息对应的第一在线频率是否符合第一预设频率条件;

若符合第一预设频率条件,将该作弊用户信息确定为备选作弊用户信息;

判断每个备选作弊用户信息对应的来源占有率是否达到预设占有率;

若达到预设占有率,确定该备选作弊用户信息为作弊用户信息;

建立所确定的作弊用户信息、作弊用户信息的类型及预设的类型权重的对应关系。

一种实现方式中,所述判断每个备选作弊用户信息对应的来源占有率是否达到预设占有率的步骤,包括:

针对每个备选作弊用户信息,确定该备选作弊用户信息的来源的数量,其中,所述来源为所述多个离线反作弊系统中的一个或多个;

计算所确定的来源的数量与所述多个离线反作弊系统的数量的比值;

判断计算得到的比值是否达到预设占有率。

一种实现方式中,所述判断每个备选作弊用户信息对应的来源占有率是否达到预设占有率的步骤,包括:

设定所述多个离线反作弊系统中每个离线反作弊系统的权重值;

针对每个备选作弊用户信息,确定该备选作弊用户信息的来源,其中,所述来源为所述多个离线反作弊系统中的一个或多个;

计算所确定的来源对应的权重值的加和值;

判断所述权重值的加和值是否达到预设占有率。

一种实现方式中,所述对应关系的建立方式包括:

设定多个离线反作弊系统中的每一个离线反作弊系统对应的类型,其中,所述多个离线反作弊系统用于离线确定并存储接收到的访问请求对应的访问用户中作弊用户的各类型的用户信息;

针对所述多个离线反作弊系统中的每一个离线反作弊系统,获取该离线反作弊系统中存储的所设定的类型的用户信息;

针对所获取的用户信息中的每一个,判断该用户信息对应的第二在线频率是否符合第二预设频率条件;

若符合第二预设频率条件,确定该用户信息为作弊用户信息;

建立所确定的作弊用户信息、作弊用户信息的类型及预设的类型权重的对应关系。

一种实现方式中,所述方法还包括:

记录预设周期内确定的作弊用户的用户信息,作为校准用户信息;

获取目标离线反作弊系统在所述预设周期内确定的作弊用户的用户信息,作为对比用户信息,其中所述目标离线反作弊系统为:所述多个离线反作弊系统中的一个或多个;

计算所述校准用户信息及所述对比用户信息的相似度;

根据所述相似度,调整所述对应关系中的类型权重。

一种实现方式中,所述根据所确定的类型及其所对应的类型权重,按照预设方式,计算作弊评估值的步骤,包括:

利用如下公式,计算作弊评估值:

m=[a1,a2,…,an]*[b1,b2,…,bn]

其中,n≥1,m为作弊评估值,[a1,a2,…,an]为类型权重向量,[b1,b2,…,bn]为类型向量;

ai为第i维对应的作弊用户信息的类型的类型权重,所述类型权重向量与所述类型向量中第i维对应的作弊用户信息的类型相同,1≤i≤n;

所述类型向量中匹配用户信息的类型所对应的元素的数值为第一预设数值,其他元素的数值为第二预设数值。

一种实现方式中,所述根据所述作弊评估值与预设风险阈值的大小关系,确定所述访问请求对应的访问用户是否为作弊用户的步骤,包括:

判断所述作弊评估值是否不小于所述预设风险阈值;

若所述作弊评估值不小于所述预设风险阈值,确定所述访问请求对应的访问用户为作弊用户;

若所述作弊评估值小于所述预设风险阈值,确定所述访问请求对应的访问用户为非作弊用户。

一种实现方式中,所述方法还包括:

当确定所述访问请求对应的访问用户为作弊用户时,屏蔽携带所述用户信息的访问请求。

第二方面,本发明实施例提供了一种用户识别装置,应用于服务器,所述装置包括:

访问请求接受模块,用于接收终端发送的访问请求,其中,所述访问请求中携带目标用户信息,所述目标用户信息包括多种类型的用户信息;

类型及权重确定模块,用于将所述目标用户信息与预先离线建立的对应关系进行匹配,确定匹配用户信息的类型及其对应的类型权重,其中,所述对应关系为:关系建立模块建立的预先获取的作弊用户信息、作弊用户信息的类型及预设的类型权重的对应关系,所述匹配用户信息为:所述对应关系包括的与所述目标用户信息包括的各类型的用户信息相匹配的预先获取的作弊用户信息;

计算模块,用于根据所确定的类型及其所对应的类型权重,按照预设方式,计算作弊评估值;

识别模块,用于根据所述作弊评估值与预设风险阈值的大小关系,确定所述访问请求对应的访问用户是否为作弊用户。

一种实现方式中,所述关系建立模块包括:

第一用户信息获取子模块,用于获取多个离线反作弊系统中存储的预设类型的用户信息,其中,所述多个离线反作弊系统用于离线确定并存储接收到的访问请求对应的访问用户中作弊用户的各类型的用户信息;

第一条件判断子模块,用于针对所获取的用户信息中的每一个,判断该用户信息对应的第一在线频率是否符合第一预设频率条件,若符合,触发备用信息确定子模块;

所述备用信息确定子模块,用于将该作弊用户信息确定为备选作弊用户信息;

占有率判断子模块,用于判断每个备选作弊用户信息对应的来源占有率是否达到预设占有率,若达到,触发第一作弊信息确定子模块;

所述第一作弊信息确定子模块,用于确定该备选作弊用户信息为作弊用户信息;

第一关系建立子模块,用于建立所确定的作弊用户信息、作弊用户信息的类型及预设的类型权重的对应关系。

一种实现方式中,所述占有率判断子模块,包括:

来源数据确定单元,用于针对每个备选作弊用户信息,确定该备选作弊用户信息的来源的数量,其中,所述来源为所述多个离线反作弊系统中的一个或多个;

比值计算单元,用于计算所确定的来源的数量与所述多个离线反作弊系统的数量的比值;

第一占有率判断单元,用于判断计算得到的比值是否达到预设占有率。

一种实现方式中,所述占有率判断子模块,包括:

权重值设定单元,用于设定所述多个离线反作弊系统中每个离线反作弊系统的权重值;

来源确定单元,用于针对每个备选作弊用户信息,确定该备选作弊用户信息的来源,其中,所述来源为所述多个离线反作弊系统中的一个或多个;

权重和计算单元,用于计算所确定的来源对应的权重值的加和值;

第二占有率判断单元,用于判断所述权重值的加和值是否达到预设占有率。

一种实现方式中,所述关系建立模块包括:

类型设定子模块,用于设定多个离线反作弊系统中的每一个离线反作弊系统对应的作弊用户信息的类型,其中,所述多个离线反作弊系统用于离线确定并存储接收到的访问请求对应的访问用户中作弊用户的各类型的用户信息;

第二用户信息获取子模块,用于针对所述多个离线反作弊系统中的每一个离线反作弊系统,获取该离线反作弊系统中存储的设定的作弊用户信息的类型的用户信息;

第二条件判断子模块,用于针对所获取的用户信息中的每一个,判断该用户信息对应的第二在线频率是否符合第二预设频率条件,若符合,触发第二作弊信息确定子模块;

所述第二作弊信息确定子模块,用于确定该用户信息为作弊用户信息;

第二关系建立子模块,用于建立所确定的作弊用户信息、作弊用户信息的类型及预设的类型权重的对应关系。

一种实现方式中,所述装置还包括:

校准信息记录模块,用于按照预设周期,记录所述预设周期内确定的作弊用户的用户信息,作为校准用户信息;

对比信息获取模块,用于获取目标离线反作弊系统在所述预设周期内确定的接收到的访问请求对应的访问用户中的作弊用户的用户信息,作为对比用户信息,其中所述目标离线反作弊系统为:所述多个离线反作弊系统中的一个或多个;

相似度计算模块,用于计算所述校准用户信息及所述对比用户信息的相似度;

权重调整模块,用于根据所述相似度,调整所述对应关系中的类型权重。

一种实现方式中,所述计算模块具体用于:

利用如下公式,计算作弊评估值:

m=[a1,a2,…,an]*[b1,b2,…,bn]

其中,n≥1,m为作弊评估值,[a1,a2,…,an]为类型权重向量,[b1,b2,…,bn]为类型向量;

ai为第i维对应的作弊用户信息的类型的类型权重,所述类型权重向量与所述类型向量中第i维对应的作弊用户信息的类型相同,1≤i≤n;

所述类型向量中匹配用户信息的类型所对应的元素的数值为第一预设数值,其他元素的数值为第二预设数值。

一种实现方式中,所述识别模块包括:

阈值判断子模块,用于判断所述作弊评估值是否不小于所述预设风险阈值,若不小于,触发作弊用户确定子模块,所小于,触发非作弊用户确定子模块;

所述作弊用户确定子模块,用于确定所述访问请求对应的访问用户为作弊用户;

所述非作弊用户确定子模块,用于确定所述访问请求对应的访问用户为非作弊用户。

一种实现方式中,所述装置还包括:

请求屏蔽模块,用于当确定所述访问请求对应的访问用户为作弊用户时,屏蔽携带所述用户信息的访问请求。

第三方面,本发明实施例提供了一种服务器,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现上述第一方面提供的用户识别方法中任一所述的方法步骤。

在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的用户识别方法。

在本发明实施的又一方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的用户识别方法。

可见,本发明实施例提供的方案中,服务器可以接收终端发送的携带有目标用户信息的访问请求,该目标用户信息包括多种类型的用户信息;将目标用户信息与预先离线建立的对应关系进行匹配,可以确定匹配用户信息的类型及其对应的类型权重,其中,对应关系为:预先获取的作弊用户信息、作弊用户信息的类型及预设的类型权重的对应关系,匹配用户信息为:所述对应关系包括的与所述目标用户信息包括的各类型的用户信息相匹配的预先获取的作弊用户信息;然后根据所确定的类型及其所对应的类型权重,按照预设方式,可以计算作弊评估值;最后根据作弊评估值与预设风险阈值的大小关系,服务器就可以确定访问请求对应的访问用户是否为作弊用户。

以上可见,本发明实施例提供的方案中,对应关系是预先离线建立的,因此,服务器接收到访问请求后,实时对访问请求对应的访问用户是否为作弊用户进行确定的过程中,只需要匹配目标用户信息与对应关系、计算作弊评估值以及判断作弊评估值与预设风险阈值的大小关系即可,不需要利用基于深度神经网络的模型对非常多的数据进行复杂计算,因此,在用户识别过程中,服务器需要处理的数据较少,进而,用户识别过程中耗费的计算资源大大减少,耗费的时长大大缩短,用户识别的实时性大大提高。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例提供的一种用户识别方法的流程示意图;

图2为本发明实施例提供的一种对应关系建立方式的流程示意图;

图3为本发明实施例提供的另一种对应关系建立方式的流程示意图;

图4为本发明实施例提供的一种用户识别装置的结构示意图;

图5为本发明实施例提供的一种服务器的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。

在现有技术中,服务器在实时对访问请求对应的访问用户进行识别,确定其是否为作弊用户时,通常需要对较多的参数进行复杂的计算,因此,识别过程中服务器需要耗费的计算资源较多,进而,需要耗费的时间较多,用户识别的实时性较差。

为了解决现有技术中存在的问题,本发明实施例提供了一种用户识别方法,应用于服务器,该方法包括:

接收终端发送的访问请求,其中,访问请求中携带目标用户信息,目标用户信息包括多种类型的用户信息;

将目标用户信息与预先离线建立的对应关系进行匹配,确定匹配用户信息的类型及其对应的类型权重,其中,对应关系为:预先获取的作弊用户信息、作弊用户信息的类型及预设的类型权重的对应关系,匹配用户信息为:对应关系包括的与目标用户信息包括的各类型的用户信息相匹配的预先获取的作弊用户信息;

根据所确定的类型及其所对应的类型权重,按照预设方式,计算作弊评估值;

根据作弊评估值与预设风险阈值的大小关系,确定访问请求对应的访问用户是否为作弊用户。

以上可见,本发明实施例提供的方案中,对应关系是预先离线建立的,因此,服务器接收到访问请求后,实时对访问请求对应的访问用户是否为作弊用户进行确定的过程中,只需要匹配目标用户信息与对应关系、计算作弊评估值以及判断作弊评估值与预设风险阈值的大小关系即可,不需要利用基于深度神经网络的模型对非常多的数据进行复杂计算,因此,在用户识别过程中,服务器需要处理的数据较少,进而,用户识别过程中耗费的计算资源大大减少,耗费的时长大大缩短,用户识别的实时性大大提高。

下面对本发明实施例提供的一种用户识别方法进行具体介绍。

如图1所示,为本发明实施例提供的一种用户识别方法的流程示意图,该方法包括:

s101:接收终端发送的访问请求。

其中,访问请求中携带目标用户信息,目标用户信息包括多种类型的用户信息;

s102:将目标用户信息与预先离线建立的对应关系进行匹配,确定匹配用户信息的类型及其对应的类型权重。

其中,对应关系为:预先获取的作弊用户信息、作弊用户信息的类型及预设的类型权重的对应关系,匹配用户信息为:对应关系包括的与目标用户信息包括的各类型的用户信息相匹配的预先获取的作弊用户信息;

s103:根据所确定的类型及其所对应的类型权重,按照预设方式,计算作弊评估值。

s104:根据作弊评估值与预设风险阈值的大小关系,确定访问请求对应的访问用户是否为作弊用户。

以上可见,本发明实施例提供的方案中,对应关系是预先离线建立的,因此,服务器接收到访问请求后,实时对访问请求对应的访问用户是否为作弊用户进行确定的过程中,只需要匹配目标用户信息与对应关系、计算作弊评估值以及判断作弊评估值与预设风险阈值的大小关系即可,不需要利用基于深度神经网络的模型对非常多的数据进行复杂计算,因此,在用户识别过程中,服务器需要处理的数据较少,进而,用户识别过程中耗费的计算资源大大减少,耗费的时长大大缩短,用户识别的实时性大大提高。

需要说明的是,服务器应用上述用户识别方法可以对信息网站的所有访问请求对应的访问用户进行识别,确定其是否为作弊用户,例如,视频网站的所有访问请求、购物网站的所有访问请求等,也可以只针对信息网站中某个或某些资源的访问请求对应的访问用户进行识别,确定其是否为作弊用户,例如视频网站的某个电影资源的访问请求、购物网站的某产品的广告等,这都是合理的。

在上述步骤s101中,服务器可以接收终端发送的访问请求,该访问请求中携带目标用户信息,因此,服务器在接收到该访问请求时,便可以获取上述目标用户信息,该目标用户信息包括多种类型的用户信息,例如,用户ip、用户id、浏览器相关信息,例如浏览器类型,cookie等。目标用户仅仅用来指代服务器接收到的访问请求中携带的用户信息,并不具有其他限定意义。

在获取目标用户信息后,服务器可以确定所获取的目标用户信息中是否包括预先获取的作弊用户信息,进而,确定该访问请求对应的访问用户是否为作弊用户,那么服务器可以执行步骤s102,即将目标用户信息与预先离线建立的对应关系进行匹配,确定匹配用户信息的类型及其对应的类型权重。

其中,该对应关系中包括预先获取的作弊用户信息、作弊用户信息的类型及预设的类型权重。也就是说:服务器将目标用户信息与预先离线建立的对应关系进行匹配时,服务器可以在对应关系包括的预先获取的作弊用户信息中查找是否存在目标用户信息包括的信息。当对应关系包括的预先获取的作弊用户信息中存在目标用户信息包括的某个用户信息时,服务器可以确定该用户信息为匹配用户信息。也就是说,匹配用户信息为:对应关系包括的与目标用户信息包括的各类型的用户信息相匹配的预先获取的作弊用户信息。进而,根据对应关系,服务器可以确定该匹配用户信息的类型及其对应的类型权重。

例如,服务器获取到的目标用户信息中包括:ip1、idabc、浏览器a,而预先离线建立的对应关系中包括:用户ip、ip1、70%的对应关系,其中,70%为用户ip的预设类型权重;以及用户id、abc、10%的对应关系,其中,10%为用户id的预设类型权重。则服务器将获取到的目标用户信息与预先离线建立的对应关系进行匹配时,可以确定上述对应关系中的作弊用户信息中包括ip1及abc,则服务器可以确定ip1及abc为匹配用户信息,并进一步地确定ip1的类型及其对应的类型权重分别为用户ip及70%,abc的类型及其对应的类型权重分别为用户id及10%。

需要说明的是,上述对应关系中的作弊用户信息可以是从多个离线反作弊系统中存储的作弊用户信息中获取的。其中,离线反作弊系统用于离线确定并存储接收到的访问请求对应的访问用户中作弊用户的各类型的用户信息。其可以在离线状态下,获取访问日志中的访问用户的用户信息,并确定这些用户信息对应的访问用户中哪些是作弊用户,并将确定的作弊用户的各类型的用户信息进行存储。多个离线反作弊系统中的每个离线反作弊系统的侧重点可以不同,例如,可以侧重于业务角度,也可以侧重于硬件角度等等。

在确定匹配用户信息的类型及其对应的类型权重后,服务器可以执行步骤s103,根据确定的类型及其对应的类型权重,按照预设方式,计算作弊评估值。例如,服务器可以将所确定的类型对应的预设的类型权重进行加和,将得到的加和值作为作弊评估值,假设确定的类型为用户ip及用户id,其所对应的类型权重分别为0.6及0.2,则将上述类型权重进行加和,得到加和值0.8即为作弊评估值。为了行文清晰,后续将会对步骤s103的具体实施方式进行举例说明。

进而,在计算得到作弊评估值后,服务器可以执行步骤s104,根据作弊评估值与预设风险阈值的大小关系,确定上述接收到的终端发送的访问请求对应的访问用户是否为作弊用户。例如,当作弊评估值大于预设风险阈值时,服务器可以确定上述接收到的终端发送的访问请求对应的访问用户为作弊用户。

需要说明的是,预设风险阈值可以根据对用户识别结果的精确度需求设定,本发明实施例不对预设风险阈值的具体数值进行限定。

作为本发明实施例的一种实施方式,如图2所示,为上述对应关系的一种建立方式的流程示意图,该方式可以包括:

s201:获取多个离线反作弊系统中存储的预设类型的用户信息。

其中,多个离线反作弊系统用于离线确定并存储接收到的访问请求对应的访问用户中作弊用户的各类型的用户信息。

离线反作弊系统可以在离线状态下,获取访问日志中的访问用户的用户信息,并确定这些用户信息对应的访问用户中哪些是作弊用户,每个离线反作弊系统的侧重点可能不同。例如,对于侧重于业务角度的离线反作弊系统,可以在离线状态下,获取访问日志,通过人工定义频次规则,对访问日志中的访问请求中携带的用户信息进行分析,确定访问请求对应的访问用户是否为作弊用户。例如,频次规则可以为:在预定时间内接收到的携带相同ip地址的访问请求的数量超过预定阈值,则携带该ip地址的访问请求对应的访问用户均为作弊用户。

对于侧重于硬件角度的离线反作弊系统,可以在离线状态下,通过分析发送访问请求的终端的硬件参数,来确定访问用户中哪些是作弊用户,并存储确定的作弊用户的各类型的用户信息。通常情况下,受限于手机终端的制作工艺及使用需求,用户所使用的手机的硬件参数具有数值极限,不可能达到极高的数值,同时,通常情况下手机终端所使用的某些硬件类型与电脑终端是不同的,因此,手机终端与电脑终端的硬件参数通常是具有很大差别的,进而,可以根据这些差别确定终端的类型。此外,手机终端是可以配置在模拟器中进行模拟运行的,在这种情况下,获得的硬件参数通常都会比较奇怪。

例如,由于通常情况下安装系统都安装于手机终端,因此,当服务器确定发送访问用户的终端为安装有安卓系统的终端,就可以确定该终端为手机终端,然而通过对该终端的硬件参数进行进一步分析,服务器确定该终端的处理器为intel处理器,内存为512g。然而,手机终端通常使用的是arm(advancedriscmachines,risc微处理器)处理器,而非intel处理器,且手机终端无法具有这么大的内存空间,因此,服务器可以确定该终端的操作系统与硬件参数是不对应的,该终端发送的访问请求不可能是手机终端发送的,进而,可以确定该终端发送的访问请求对应的访问用户为作弊用户。

每个离线反作弊系统在确定访问用户为作弊用户后,可以存储确定的作弊用户的各类型的用户信息。进而,在建立上述对应关系时,服务器便可以从多个离线反作弊系统中存储的作弊用户的各类型的用户信息中,获取预设类型的用户信息。

其中,预设类型可以为离线反作弊系统中存储的各类型的用户信息对应的所有类型,也可以是其中一部分类型,在此不做具体限定。例如,预设类型为用户ip、用户id及cookie,那么服务器也就可以在多个离线反作弊系统中存储的作弊用户的各类型的用户信息中,获取类型分别为用户ip、用户id、cookie的用户信息。

s202:针对所获取的用户信息中的每一个,判断该用户信息对应的第一在线频率是否符合第一预设频率条件,若该用户信息对应的在线频率符合第一预设频率条件,执行s203。

在获取了多个离线反作弊系统中存储的预设类型的用户信息后,服务器可以针对所获取的每一个用户信息,判断该用户信息对应的第一在线频率是否符合第一预设频率条件,当该用户信息对应的第一在线频率符合第一预设频率条件时,服务器可以继续执行步骤s203。

其中,该用户信息对应的第一在线频率可以为该用户信息对应的用户在预设时间段内发送的访问请求次数,以下简称为对应访问请求次数,则对应的第一预设频率条件可以为预设次数,进而,判断该用户信息对应的第一在线频率是否符合第一预设频率条件,可以为判断该用户信息的对应访问请求次数是否大于预设次数。例如,预设时间段为24小时,在24小时内用户信息a的对应访请求次数为20次,第一预设频率条件为50次,则用户信息a在预设时间段内的对应访请求次数小于预设次数,即用户信息a对应的第一在线频率不符合第一预设频率条件,服务器则可以不将该用户信息a作为作弊用户信息,进而针对所获取的用户信息中的下一个信息,执行步骤s202。

需要说明的是,对于服务器接收到的每一个访问请求,服务器都会在访问日志中生成对应的记录信息,这些信息中包括了每一个访问请求对应的访问用户的用户信息,在预设时间段内,服务器生成的访问日志中包括了该预设时间段内接收到的所有访问请求对应的记录信息。因此,服务器可以根据访问日志中的记录信息,通过每个访问请求对应的访问用户的用户信息进行分析来确定上述用户信息的对应访问请求次数。

该用户信息对应的第一在线频率也可以采用离线反作弊系统在预设天数内为该用户信息添加的时间标记的数量来表示,例如,离线反作弊系统在十天内确定的作弊用户的用户信息中有七天都包括用户信息b,则这十天内离线反作弊系统可以为用户信息b添加的时间标记,例如可以为7。进而,服务器在获取该用户信息时可以同时获取其时间标记,那么在判断该用户信息对应的第一在线频率是否符合第一预设频率条件时,可以通过判断该用户信息的时间标记的数量是否大于预设数量来确定。例如,预设天数为七天,在这七天内离线反作弊系统为用户信息c添加的时间标记为5,第一预设频率条件为4,则用户信息c的时间标记的数量大于预设数量,即用户信息c对应的第一在线频率符合第一预设频率条件,服务器可以继续执行步骤s203。

s203:将该用户信息确定为备选作弊用户信息。

当用户信息对应的第一在线频率符合第一预设频率条件时,说明该用户信息对应的访问用户多次被离线反作弊系统确定为作弊用户,因此,该用户信息是作弊用户信息的可能性较高,那么服务器便可以将该用户信息确定为备选作弊用户信息,用于后续从中确定作弊用户信息。

需要说明的是,服务器可以依次判断所获取的用户信息对应的第一在线频率是否符合第一预设频率条件,也可以同时判断所获取的每一个用户信息对应的在线频率是否符合第一预设频率条件,这都是合理的。

s204:判断每个备选作弊用户信息对应的来源占有率是否达到预设占有率,若备选作弊用户信息对应的来源占有率达到预设占有率,执行s205。

在确定备选作弊用户信息后,服务器可以判断每个备选作弊用户信息对应的来源占有率是否达到预设占有率,当备选作弊用户信息对应的来源占有率达到预设占有率时,服务器可以继续执行步骤s205。

需要说明的是,服务器可以在确定一个用户信息为备选作弊信息后,继续判断该备选作弊用户信息对应的来源占有率是否达到预设占有率;也可以在确定出所有备选作弊用户信息后,对所确定所有备选作弊用户信息依次判断其对应的来源占有率是否达到预设占有率;还可以在确定所有备选作弊用户信息后,同时判断每个备选作弊用户对应的来源占有率是否达到预设占有率,这都是合理的。

s205:确定该备选作弊用户信息为作弊用户信息;

在备选作弊用户信息对应的来源占有率达到预设占有率时,说明该备选作弊用户信息从不同的侧重点考察均可能被离线反作弊系统确定为作弊用户的用户信息,或者该备选作弊用户信息被准确率较高的离线反作弊系统确定为作弊用户的用户信息,因此,能够在较大程度上排除真实用户的用户信息被误判为备选作弊用户信息的可能性,那么,服务器则可以将该备选作弊用户信息确定为作弊用户信息。

需要说明的是,每个备选作弊用户信息都是根据步骤s202中的判断结果确定的,经过上述判断,确定的备选作弊用户信息是作弊用户信息的可能性极高,为了筛除备选作弊用户信息中可能存在的特殊情况,例如,某个真实用户被误判为作弊用户,进一步保证得到的作弊用户信息具有较高的准确率,服务器可以执行步骤s204,根据步骤s204中的判断结果对确定的备选作弊用户信息进行筛选,提升确定的作弊用户信息的准确率。

s206:建立所确定的作弊用户信息、作弊用户信息的类型及预设的类型权重的对应关系。

在确定作弊用户信息后,服务器也就可以建立所确定的作弊用户信息、作弊用户信息的类型及预设的类型权重之间的对应关系,也就是上述对应关系。

如下表所示,上述对应关系可以通过表格的形式表示。

当然,上述对应关系也可以通过其他形式进行表示,在此不做具体限定。需要说明的是,服务器可以在每确定一个作弊用户信息后,建立该作弊用户信息、作弊用户信息的类型及预设的类型权重的对应关系,当确定完所有的作弊用户信息后,将所建立的所有对应关系组合在一起,得到对应关系。也可以在确定所有作弊用户信息后,建立所有作弊用户信息、作弊用户信息的类型及预设的类型权重的对应关系,这都是合理的。

作为本发明实施例的一种实施方式,上述步骤s204中判断每个备选作弊用户信息对应的来源占有率是否达到预设占有率,可以包括:

步骤a1:针对每个备选作弊用户信息,确定该备选作弊用户信息的来源的数量。其中,来源为多个离线反作弊系统中的一个或多个。

例如,假设离线反作弊系统的数量为5个,分别为离线反作弊系统a、离线反作弊系统b、离线反作弊系统c、离线反作弊系统d和离线反作弊系统e,其中,离线反作弊系统a、离线反作弊系统c及离线反作弊系统d存储的用户信息中均包括备选作弊用户信息d,也就是说,备选作弊用户信息d的来源为离线反作弊系统a、离线反作弊系统c及离线反作弊系统d,其来源的数量为3。

步骤a2:计算所确定的来源的数量与多个离线反作弊系统的数量的比值;

例如,假设备选作弊用户信息e的来源的数量为3,多个离线反作弊系统的数量为5,则计算得到的比值为(3/5=)0.6。

步骤a3:判断计算得到的比值是否达到预设占有率。

在计算得到比值后,服务器可以判断计算得到的比值是否达到预设占有率,其中,预算占有率可以根据实际应用中对用户识别结果的精确度要求确定。

如果计算得到的比值达到预设占有率,则服务器可以确定该备选作弊用户信息为作弊用户信息,如果计算得到的比值未达到预设占有率,则服务器可以确定该备选作弊用户信息为非作弊用户信息。

作为本发明实施例的另一种实施方式,上述步骤s204中判断每个备选作弊用户信息对应的来源占有率是否达到预设占有率,可以包括:

步骤b1:设定多个离线反作弊系统中每个离线反作弊系统的权重值;

由于离线反作弊系统对作弊用户的识别精准度可能不同,所以为了提高获取的作弊用户信息的精确度,服务器可以根据每个离线反作弊系统对作弊用户的识别精准度,设定每个作弊系统的权重值。例如,通常侧重业务角度的离线反作弊系统对作弊用户的识别精准度较高,则可以将侧重业务角度的离线反作弊系统的权重值设定为较大的值。

示例性的,假设离线反作弊系统的数量为5个,分别为离线反作弊系统a、离线反作弊系统b、离线反作弊系统c、离线反作弊系统d和离线反作弊系统e,其对作弊用户的识别精准度依次下降,则服务器可以设定离线反作弊系统a、离线发作弊系统b、离线反作弊系统c、离线反作弊系统d和离线反作弊系统e的权重值也是依次下降的,例如可以分别为0.5、0.3、0.1、0.06、0.04。

步骤b2:针对每个备选作弊用户信息,确定该备选作弊用户信息的来源,其中,来源为多个离线反作弊系统中的一个或多个;

接下来,服务器可以针对每个备选作弊用户信息,确定该备选作弊用户信息的来源,也就是可以确定都有哪些离线反作弊系统存储有该备选作弊用户信息。

例如,假设离线反作弊系统的数量为4个,分别为离线反作弊系统a、离线发作弊系统b、离线反作弊系统c及离线反作弊系统d,其中,离线发作弊系统b,离线反作弊系统c及离线反作弊系统d存储有备选作弊用户信息f,则备选作弊用户信息f的来源为离线发作弊系统b、离线反作弊系统c及离线反作弊系统d。

步骤b3:计算所确定的来源对应的权重值的加和值;

例如,假设离线反作弊系统a、离线发作弊系统b、离线反作弊系统c、离线反作弊系统d和离线反作弊系统e的权重值分别为0.5、0.3、0.1、0.06、0.04,备选作弊用户信息g的来源为离线发作弊系统a、离线反作弊系统c及离线反作弊系统d,那么服务器可以计算得到的各来源对应的权重值的加和值为0.5+0.1+0.06=0.66。

步骤b4:判断权重和是否达到预设占有率。

在计算得到上述权重的加和值后,服务器可以判断该加和值是否达到预设占有率,即服务器可以判断加和值是否大于等于预设占有率,其中,预算占有率可以根据实际应用中对用户分类结果的精确度要求确定。

如果权重和达到预设占有率,则服务器可以确定该备选作弊用户信息为作弊用户信息,如果权重和未达到预设占有率,则服务器可以确定该备选作弊用户信息为非作弊用户信息。

作为本发明实施例的一种实施方式,如图3所示,为上述对应关系的另一种建立方式的流程示意图,该方式可以包括:

s301:设定多个离线反作弊系统中的每一个离线反作弊系统对应的作弊用户信息的类型。

其中,多个离线反作弊系统用于离线确定并存储接收到的访问请求对应的访问用户中作弊用户的各类型的用户信息。在本发明实施例中应用的离线反作弊系统与上述实施例步骤s201中应用的离线反作弊系统相同,这里不再赘述。;

由于每个离线反作弊系统的侧重点可能不同,因此,每个离线反作弊系统在依据访问请求中携带的用户信息确定作弊用户时,对各类型的用户信息重视程度也就可能不同。例如,对于侧重于业务角度的离线反作弊系统,其更重视用户信息中的用户ip,对于侧重于硬件角度的离线反作弊系统,其更重视用户信息中的cookie。

这样,服务器便可以根据不同的离线反作弊系统在确定作弊用户时对不同类型的用户信息的重视程度,设定每一个离线反作弊系统对应的作弊用户信息的类型,通常可以将离线反作弊系统重视程度较高或者最高的用户信息的类型设定为该离线反作弊系统对应的作弊用户信息的类型。

例如,假设多个离线反作弊系统的数量为4个,分别为离线反作弊系统a,离线发作弊系统b,离线反作弊系统c和离线反作弊系统d,则可以设定其对应的作弊用户信息的类型分别为用户ip、用户id、浏览器类型及cookie。

s302:针对多个离线反作弊系统中的每一个离线反作弊系统,获取该离线反作弊系统中存储的设定的作弊用户信息的类型的用户信息;

在设定每一个离线反作弊系统对应的作弊用户信息的类型后,服务器可以获取该离线反作弊系统中存储的该对应类型的用户信息。

例如,假设多个离线反作弊系统的数量为4个,分别为离线反作弊系统a、离线反作弊系统b、离线反作弊系统c和离线反作弊系统d,设定其对应的类型分别为用户ip、用户id、浏览器类型及cookie,则服务器可以从离线反作弊系统a存储的作弊用户信息中获取类型为用户ip的用户信息,从离线反作弊系统b存储的作弊用户信息中获取类型为用户id的用户信息,从离线反作弊系统c存储的作弊用户信息中获取类型为浏览器类型的用户信息,从离线反作弊系统d存储的作弊用户信息中获取类型为cookie的用户信息。

s303:针对所获取的用户信息中的每一个,判断该用户信息对应的第二在线频率是否符合第二预设频率条件,若符合,执行s304;

在从每个离线反作弊系统存储的作弊用户信息中获取该离线反作弊系统对应类型的作弊用户信息后,服务器可以针对所获取的每一个用户信息,判断该用户信息对应的第二在线频率是否符合第二预设频率条件,如果用户信息对应的第二在线频率符合第二预设频率条件时,服务器可以继续执行步骤s304。

需要说明的是,在上述步骤s301中,服务器通常根据每个离线反作弊系统在确定作弊用户时对不同类型的用户信息的重视程度,将其中重视程度较高或者最高的用户信息的类型设定为该离线反作弊系统对应的作弊用户信息的类型,因此,服务器从离线反作弊系统存储的作弊用户的用户信息中获取到的对应类型的用户信息是作弊用户信息的可能性较高。进而,为了进一步保证确定的作弊用户信息的准确性,服务器可以判断用户信息的在线频率是否符合第二预设频率条件,并根据判断结果确定获得的用户信息是否为作弊用户信息。这样,通过进一步地筛选,可以很大程度上筛除出现频率不高或者可能被误判的用户信息,使得确定的作弊用户信息更加准确。

其中,该用户信息对应的第二在线频率可以为该用户信息对应的用户在预设时间段内发送的访问请求次数,以下简称为对应访问请求次数,则对应的第二预设频率条件可以为预设次数,进而,判断该用户信息对应的在线频率是否符合第二预设频率条件,可以为判断该用户信息的对应访问请求次数是否大于预设次数。例如,预设时间段为24小时,在24小时内用户信息h的对应访请求次数为20次,第二预设频率条件为50次,则用户信息h在预设时间段内的对应访请求次数小于预设次数,即用户信息h对应的第二在线频率不符合第二预设频率条件,服务器则可以不将该用户信息h作为作弊用户信息,进而针对所获取的用户信息中的下一个信息,执行步骤s304。

需要说明的是,对于服务器接收到的每一个访问请求,服务器都会在访问日志中生成对应的记录信息,这些信息中包括了每一个访问请求对应的访问用户的用户信息,在预设时间段内,服务器生成的访问日志中包括了该预设时间段内接收到的所有访问请求对应的记录信息。因此,服务器可以根据访问日志中的记录信息,通过每个访问请求对应的访问用户的用户信息进行分析来确定上述用户信息的对应访问请求次数。

该用户信息对应的第二在线频率也可以采用离线反作弊系统在预设天数内为该用户信息添加的时间标记的数量来表示,例如,离线反作弊系统在十天内确定的作弊用户的用户信息中有七天都包括用户信息i,则这十天内离线反作弊系统可以为用户信息i添加的时间标记,例如可以为7。进而,服务器在获取该用户信息时可以同时获取其时间标记,那么在判断该用户信息对应的第二在线频率是否符合第二预设频率条件时,可以通过判断该用户信息的时间标记的数量是否大于预设数量来确定。例如,预设天数为七天,在这七天内离线反作弊系统为用户信息j添加的时间标记为5,第二预设频率条件为4,则用户信息j的时间标记的数量大于预设数量,即用户信息c对应的第二在线频率符合第二预设频率条件,服务器可以继续执行步骤s304。

s304:确定该用户信息为作弊用户信息;

在确定了用户信息对应的第二在线频率符合第二预设频率条件后,服务器可以将该用户信息确定为作弊用户信息。由于,该作弊用户信息是服务器按照设定的对应的作弊用户信息的类型在每个离线反作弊系统中存储作弊用户的用户信息中获取的,因此,服务器在确定作弊用户信息后,也就可以获取该作弊用户信息的类型。

s305:建立所确定的作弊用户信息、作弊用户信息的类型及预设的类型权重的对应关系。

在确定作弊用户信息后,服务器也就可以建立所确定的作弊用户信息、作弊用户信息的类型及预设的类型权重之间的对应关系,也就是上述对应关系。如上表所示,上述对应关系可以通过表格等多种形式表示。

需要说明的是,服务器可以在每确定一个作弊用户信息并获取了该作弊用户信的类型后,建立该作弊用户信息、作弊用户信息的类型及预设的类型权重的对应关系,当确定完所有的作弊用户信息后,将所建立的所有对应关系组合在一起,得到对应关系。也可以在确定所有作弊用户信息并获得了所有作弊用户信息的类型后,直接建立作弊用户信息、作弊用户信息的类型及预设的类型权重的对应关系。这都是合理的。

在上述用户识别方法中,由于服务器可以根据所确定的类型及其所对应的类型权重,按照预设方式,计算作弊评估值,并根据作弊评估值与预设风险阈值的大小关系,确定访问请求对应的访问用户是否为作弊用户。

因此,上述对应关系中的类型权重对于用户识别结果的精准度具有非常重要的作用,进而,可以在应用上述用户识别方法的过程中,不断调整类型权重的取值,使其与各类型用户信息在用户识别过程中起到的作用的重要程度能够具有更加合理的对应关系,从而可以提高利用类型权重对访问请求对应的访问用户进行识别的结果的精确性。

作为本发明实施例的一种实施方式,上述用户识别方法还可以包括:

步骤c1:记录预设周期内确定的作弊用户的用户信息,作为校准用户信息;

服务器在确定访问用户为作弊用户后,将该作弊用户对应的访问请求中携带的目标用户信息记录下来,这些记录下来的目标用户信息就可以作为校准用户信息。

其中,预设周期可以根据对用户识别结果的精确度需求进行设定,对用户识别结果的精确度需求越高,则预设周期的时长可以越短,例如,可以是24小时,也可以是一周,还可以是一个月,这都是合理的。

步骤c2:获取目标离线反作弊系统在预设周期内确定的作弊用户的用户信息,作为对比用户信息。

其中,目标离线反作弊系统可以为多个离线反作弊系统中的一个或多个,在此不做具体限定。

在一个预设周期结束后,这些离线反作弊系统可以确定该预设周期内接收到的访问请求对应的访问用户中哪些是作弊用户,进而可以确定这些作弊用户的用户信息,服务器也就可以从目标离线反作弊系统获取其确定的该预设周期对应的作弊用户的用户信息,作为对比用户信息。

需要说明的是,目标离线反作弊系统可以是多个离线反作弊系统中的一个,也可以是多个离线反作弊系统中的几个,目标离线反作弊系统的数量可以根据实际应用中对用户识别结果精确度的需求确定,对用户识别结果精确度的需求越高,则目标离线反作弊系统的数量越多,这样便可以利用多个目标离线反作弊系统从不同的侧重点出发确定作弊用户,使得确定的作弊用户更全面、准确性更高,继而使得获得的对比用户信息更全面、更准确。本发明实施例不做目标离线反作弊系统的数量进行具体限定。且服务器记录的校准用户信息的数量与获取的对比信息的数量可以相同,也可以不同。

步骤c3:计算校准用户信息及对比用户信息的相似度;

服务器在获取上述校准用户信息及上述对比用户信息后,可以将二者进行比对,从而计算校准用户信息及对比用户信息的相似度。

其中,上述相似度可以是校准用户信息及对比用户信息中相同的用户信息的数量与对比用户信息的数量的比值,例如,校准用户信息及对比用户信息中相同的用户信息的数量为80,对比用户信息的数量为100,则相似度为80%。

也可以是校准用户信息及对比用户信息中相同的用户信息的数量与校准用户信息的数量的比值,例如,校准用户信息及对比用户信息中相同的用户信息的数量为193,对比用户信息的数量为200,则相似度为96.5%。

还可以是校准用户信息及对比用户信息中不同的用户信息的数量与相同的用户信息的数量的比值,例如,校准用户信息及对比用户信息中不同的用户信息的数量为7,相同的用户信息的数量为121,则相似度为5.8%。

本发明实施例不对计算校准用户信息及对比用户信息的相似度的方法进行具体限定。

步骤c4:根据相似度,调整对应关系中的类型权重。

服务器可以比较相似度与预设调整阈值的大小,以及对校准用户信息及对比用户信息进行分析,调整对应关系中的类型权重。其中,预设调整阈值可以根据实际应用中对用户识别的精确度需求进行设定,当对用户识别的精确度需求度较高时,预设调整阈值可以较高。

在这种情况下,当相似度不小于预设调整阈值时,由于预设调整阈值较高,则相似度也较高,也就是说,在预设周期内,利用本发明实施例提供的用户识别方法确定的作弊用户的用户信息与目标离线反作弊系统确定的作弊用户的用户信息的相似度较高,而由于目标离线反作弊系统对用户识别的准确率已经在实际应用中得到了验证,其具有较高的用户识别准确率,因此,可以确定本发明实施例提供的用户识别方法具有较高的用户识别准确率,进而,可以确定上述对应关系中的类型权重设置的较为合理,不需要进行调整。

相对应的,当相似度小于预设调整阈值时,则可以确定本发明实施例提供的用户识别方法的用户识别准确率较低,进而可以确定上述对应关系中的类型权重设置的合理性较差,需要进行调整。其中,服务器可以根据选择的目标离线反作弊系统的侧重点、记录的校准用户信息中各类型用户信息的分布比例、获得的对比用户信息中各类型用户信息的分布比例等决定如何调整类型权重。

例如,目标离线反作弊系统侧重于业务角度,则可以适当提高用户ip对应的类型权重,降低用户id对应的类型权重;又例如,记录的校准用户信息中各类型用户信息中用户id所占的比例最多,则可以适当提高用户id对应的类型权重等。当然,服务器也可以采用其他方式调整类型权重,例如,当作弊用户信息的类型为用户ip、用户id、浏览器类型及cookie时,可以按照每次分别将用户ip及cookie对应的类型权重提升2%,用户id及浏览器类型对应的类型权重降低2%的规律对类型权重进行调整,直至类型权重满足要求。

例如,当将校准用户信息及对比用户信息中相同的用户信息的数量与对比用户信息的数量的比值作为相似度时,假设预设调整阈值为80%,当相似度不小于80%时,可以认为当前的类型权重比较合理,则不需要调整;当相似度小于80%时,且对比用户信息中用户ip所占的比例最大,则可以说明目标离线反作弊系统确定作弊用户时,用户ip起到的作用最大,对比用户信息中用户id所占的比例最小,则可以说明目标离线反作弊系统确定作弊用户时,用户id起到的作用最小,因此,服务器可以适当增大用户ip对应的类型权重,降低用户id对应的类型权重。

又例如,当校准用户信息及对比用户信息中不同的用户信息的数量及相同的用户信息的数量的比值时,假设预设调整阈值为5%,当相似度小于5%时,可以认为当前的类型权重比较合理,不需要调整,当相似度不小于5%时,用户可以根据经验对类型权重进行调整,例如,提高cookie对应的类型权重,降低浏览器类型对应的类型权重等。

本发明实施例不对服务器根据相似度,调整对应关系中的类型权重的具体方法进行限定,上述预设调整阈值可以根据技术人员的经验以及实际应用中对用户识别结果的精确度要求确定。

作为本发明实施例的一种实施方式,上述s103根据所确定的类型及其所对应的类型权重,按照预设方式,计算作弊评估值的步骤,可以包括:

利用如下公式,计算作弊评估值:

m=[a1,a2,…,an]*[b1,b2,…,bn]

其中,n≥1,m为作弊评估值,[a1,a2,…,an]为类型权重向量,[b1,b2,…,bn]为类型向量;

ai为第i维对应的作弊用户信息的类型的类型权重,所述类型权重向量与所述类型向量中第i维对应的作弊用户信息的类型相同,1≤i≤n;

所述类型向量中匹配用户信息的类型所对应的元素的数值为第一预设数值,其他元素的数值为第二预设数值。

服务器将目标用户信息与预先离线建立的对应关系进行匹配,确定匹配用户信息的类型及其对应的类型权重后,可以获得上述类型向量及类型权重向量,并利用上述公式,通过计算类型向量及类型权重向量的内积,得到作弊评估值。

例如:假设类型向量b=[1,0,1,0],类型权重向量为a=[0.1,0.2,0.3,0.4],则作弊评估值m=[1,0,1,0]*[0.1,0.2,0.3,0.4]=0.4。

需要说明的是,上述类型权重向量可以通过下面的方式确定,该方式包括:步骤d1,设定初始类型权重向量,该初始类型权重向量的维数与上述对应关系中包括的作弊用户信息的类型的数量相同,并将初始类型权重向量的维度与上述对应关系中包括的作弊用户信息的类型进行一一对应,使初始类型权重向量的每一维度对应上述对应关系中的一个作弊用户信息的类型。

步骤d2,为初始类型权重向量每一维度对应的元素赋值,其数值为:该维度所对应的作弊用户信息的类型的类型权重。则赋值后的初始类型权重向量即为类型权重向量。

例如,假设上述对应关系中包括的作弊用户信息的类型为用户ip、用户id、浏览器类型及cookie四种,且这四种作弊用户信息的类型的类型权重分布为0.6、0.1、0.1及0.2,设定初始类型权重向量的第一维对应的作弊用户信息的类型为用户ip、第二维对应的作弊用户信息的类型为用户id、第三维对应的作弊用户信息的类型为浏览器类型、第四位对应的作弊用户信息的类型为cookie,则对初始类型权重向量赋值后得到的类型权重向量为[0.6,0.1,0.1,0.2]。

上述类型向量可以通过下面的方式获得,该方式包括:

步骤e1:设定初始类型向量。与上述初始类型权重相对应,初始类型向量的维度与上述对应关系中包括的作弊用户信息的类型的数量相同,初始类型向量中每一维度同样与上述对应关系中包括的作弊用户信息的类型一一对应,且与初始类型权重向量中的对应关系相同。需要说明的是,设定的初始类型向量的各维度对应的元素的初始数值可以为任意值。

例如,假设对应关系中包括的作弊用户信息的类型的数量为4,类型权重向量的第一维对应的作弊用户信息的类型为用户ip、第二维对应的作弊用户信息的类型为用户id、第三维对应的作弊用户信息的类型为浏览器类型、第四位对应的作弊用户信息的类型为cookie,则初始类型向量的维度为4,第一维对应的作弊用户信息的类型为用户ip、第二维对应的作弊用户信息的类型为用户id、第三维对应的作弊用户信息的类型为浏览器类型、第四位对应的作弊用户信息的类型为cookie,初始类型向量可以为[0,0,0,0],也可以为[1,2,3,4],还可以为[2,4,6,8],这都是合理的。

步骤e2:确定初始类型向量中与所确定的类型对应的维度;

例如,假设初始类型向量的维度为4,第一维对应的作弊用户信息的类型为用户ip、第二维对应的作弊用户信息的类型为用户id、第三维对应的作弊用户信息的类型为浏览器类型、第四位对应的作弊用户信息的类型为cookie,确定的类型为用户ip、cookie,则可以确定初始类型向量中与所确定的类型对应的维度为第一维和第四维。

步骤e3:将所确定的维度对应的元素的数值设置为第一预设数值,将其他维度对应的元素的数值设置为第二预设数值,得到类型向量;

例如,假设第一预设数值为1,第二预设数值为0,所确定的维度为第一维、第三维及第四维,则得到的类型向量为[1,0,1,1]。

又例如,假设第一预设数值为9,第二预设数值为1,所确定的维度为第一维及第四维,则得到的类型向量为[9,1,1,9]。

作为本发明实施例的一种实施方式,上述步骤s104根据作弊评估值与预设风险阈值的大小关系,确定访问请求对应的访问用户是否为作弊用户的步骤,可以包括:

步骤f1:判断作弊评估值是否不小于预设风险阈值;若不小于,执行步骤f2,若小于,执行步骤f3。

步骤f2:确定访问请求对应的访问用户为作弊用户;

步骤f3,确定访问请求对应的访问用户为非作弊用户。

例如,预设风险阈值为0.6,计算得到的作弊评估值为0.65,则0.65>0.6,即作弊评估值大于预设风险阈值,则服务器可以确定访问请求对应的访问用户为作弊用户。

又例如,预设风险阈值为0.8,计算得到的作弊评估值为0.5,则0.5<0.8,即作弊评估值小于预设风险阈值,则服务器可以确定访问请求对应的访问用户为非作弊用户。

再例如,预设风险阈值为0.7,计算得到的作弊评估值为0.7,则0.7=0.7,即作弊评估值等于预设风险阈值,则服务器可以确定访问请求对应的访问用户为作弊用户。

作为本发明实施例的一种实施方式,上述用户识别方法还可以包括:

当确定访问请求对应的访问用户为作弊用户时,屏蔽携带用户信息的访问请求。

可选的,在访问请求对应的访问用户被确定为作弊用户后,服务器可以对该访问请求携带的目标用户信息进行标记,该标记表明该目标用户信息为作弊用户信息。当服务器再次接收到的访问请求中携带了被标记的目标用户信息时,服务器可以通过上述标记,识别该访问请求对应的访问用户为作弊用户,进而屏蔽该访访问请求。

可选的,在访问请求对应的访问用户被确定为作弊用户后,服务器也可以对该访问请求携带的目标用户信息进行记录,得到作弊用户信息统计表。服务器再次接收到的访问请求中携带了被标记的目标用户信息时,服务器可以将再次获取的目标用户信息与上述作弊用户信息统计表中的信息进行匹配,确定该目标用户信息是否被记录在上述坐标用户信息统计表中,进而,服务器可以确定该访问请求对应的访问用户是否为作弊用户,若是,则可以屏蔽该访问请求。

作为本发明实施例的一种实施方式,在访问请求对应的访问用户被确定为作弊用户后,服务器还可以将该访问用户的目标用户信息发送给与之通信连接的其他的服务器,当其他服务器接收到携带该目标用户信息的访问请求时,也可以屏蔽该访问请求。

可见,本实施例中,服务器可以屏蔽携带有作弊用户信息的访问请求,从而可以较少作弊用户对各类资源的点击量或者播放量的影响,提升统计得到的资源的点击量或者播放量的真实性,进而在根据资源的点击量或者播放量进行决策时,减少作弊用户带来的不良影响。

对应于上述本发明实施例提供的一种用户识别方法,本发明实施例还提供了一种用户识别装置,下面对其进行具体介绍。

如图4所示,为本发明实施例提供的一种用户识别装置的结构示意图,应用于服务器,该装置包括:

访问请求接受模块410,用于接收终端发送的访问请求,其中,访问请求中携带目标用户信息,目标用户信息包括多种类型的用户信息;

类型及权重确定模块420,用于将目标用户信息与预先离线建立的对应关系进行匹配,确定匹配用户信息的类型及其对应的类型权重,其中,对应关系为:关系建立模块建立的预先获取的作弊用户信息、作弊用户信息的类型及预设的类型权重的对应关系,匹配用户信息为:对应关系包括的与目标用户信息包括的各类型的用户信息相匹配的预先获取的作弊用户信息;

计算模块430,用于根据所确定的类型及其所对应的类型权重,按照预设方式,计算作弊评估值;

识别模块440,用于根据作弊评估值与预设风险阈值的大小关系,确定访问请求对应的访问用户是否为作弊用户。

以上可见,本发明实施例提供的方案中,对应关系是预先离线建立的,因此,服务器接收到访问请求后,实时对访问请求对应的访问用户是否为作弊用户进行确定的过程中,只需要匹配目标用户信息与对应关系、计算作弊评估值以及判断作弊评估值与预设风险阈值的大小关系即可,不需要利用基于深度神经网络的模型对非常多的数据进行复杂计算,因此,在用户识别过程中,服务器需要处理的数据较少,进而,用户识别过程中耗费的计算资源大大减少,耗费的时长大大缩短,用户识别的实时性大大提高。

作为本发明实施例的一种实施方式,上述关系建立模块可以包括:

第一用户信息获取子模块,用于获取多个离线反作弊系统中存储的预设类型的用户信息,其中,多个离线反作弊系统用于离线确定并存储接收到的访问请求对应的访问用户中作弊用户的各类型的用户信息;

第一条件判断子模块,用于针对所获取的用户信息中的每一个,判断该用户信息对应的第一在线频率是否符合第一预设频率条件,若符合,触发备用信息确定子模块;

备用信息确定子模块,用于将该作弊用户信息确定为备选作弊用户信息;

占有率判断子模块,用于判断每个备选作弊用户信息对应的来源占有率是否达到预设占有率,若达到,触发第一作弊信息确定子模块;

第一作弊信息确定子模块,用于确定该备选作弊用户信息为作弊用户信息;

第一关系建立子模块,用于建立所确定的作弊用户信息、作弊用户信息的类型及预设的类型权重的对应关系。

作为本发明实施例的一种实施方式,上述占有率判断子模块,可以包括:

来源数据确定单元,用于针对每个备选作弊用户信息,确定该备选作弊用户信息的来源的数量,其中,来源为多个离线反作弊系统中的一个或多个;

比值计算单元,用于计算所确定的来源的数量与多个离线反作弊系统的数量的比值;

第一占有率判断单元,用于判断计算得到的比值是否达到预设占有率。

作为本发明实施例的一种实施方式,上述占有率判断子模块,也包括:

权重值设定单元,用于设定多个离线反作弊系统中每个离线反作弊系统的权重值;

来源确定单元,用于针对每个备选作弊用户信息,确定该备选作弊用户信息的来源,其中,来源为多个离线反作弊系统中的一个或多个;

权重和计算单元,用于计算所确定的来源对应的权重值的加和值;

第二占有率判断单元,用于判断权重值的加和值是否达到预设占有率。

作为本发明实施例的一种实施方式,上述关系建立模块也可以包括:

类型设定子模块,用于设定多个离线反作弊系统中的每一个离线反作弊系统对应的作弊用户信息的类型,其中,多个离线反作弊系统用于离线确定并存储接收到的访问请求对应的访问用户中作弊用户的各类型的用户信息;

第二用户信息获取子模块,用于针对多个离线反作弊系统中的每一个离线反作弊系统,获取该离线反作弊系统中存储的设定的作弊用户信息的类型的用户信息;

第二条件判断子模块,用于针对所获取的用户信息中的每一个,判断该用户信息对应的第二在线频率是否符合第二预设频率条件,若符合,触发第二作弊信息确定子模块;

第二作弊信息确定子模块,用于确定该用户信息为作弊用户信息;

第二关系建立子模块,用于建立所确定的作弊用户信息、作弊用户信息的类型及预设的类型权重的对应关系。

作为本发明实施例的一种实施方式,上述用户识别装置还可以包括:

校准信息记录模块,用于按照预设周期,记录预设周期内确定的作弊用户的用户信息,作为校准用户信息;

对比信息获取模块,用于获取目标离线反作弊系统在预设周期内确定的接收到的访问请求对应的访问用户中的作弊用户的用户信息,作为对比用户信息,其中目标离线反作弊系统为:多个离线反作弊系统中的一个或多个;

相似度计算模块,用于计算校准用户信息及对比用户信息的相似度;

权重调整模块,用于根据相似度,调整对应关系中的类型权重。

作为本发明实施例的一种实施方式,上述计算模块430可以具体用于:

利用如下公式,计算作弊评估值:

m=[a1,a2,…,an]*[b1,b2,…,bn]

其中,n≥1,m为作弊评估值,[a1,a2,…,an]为类型权重向量,[b1,b2,…,bn]为类型向量;

ai为第i维对应的作弊用户信息的类型的类型权重,类型权重向量与类型向量中第i维对应的作弊用户信息的类型相同,1≤i≤n;

类型向量中匹配用户信息的类型所对应的元素的数值为第一预设数值,其他元素的数值为第二预设数值。

作为本发明实施例的一种实施方式,上述识别模块440可以包括:

阈值判断子模块,用于判断作弊评估值是否不小于预设风险阈值,若不小于,触发作弊用户确定子模块,所小于,触发非作弊用户确定子模块;

作弊用户确定子模块,用于确定访问请求对应的访问用户为作弊用户;

非作弊用户确定子模块,用于确定访问请求对应的访问用户为非作弊用户。

作为本发明实施例的一种实施方式,上述用户识别装置还可以包括:

请求屏蔽模块,用于当确定访问请求对应的访问用户为作弊用户时,屏蔽携带用户信息的访问请求。

对应于上述本发明实施例提供的一种用户识别方法,本发明实施例还提供了一种服务器,如图5所示,包括处理器501、通信接口502、存储器503和通信总线504,其中,处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信,

存储器503,用于存放计算机程序;

处理器501,用于执行存储器503上所存放的程序时,实现上述本发明实施例提供的一种用户识别方法的方法步骤:

具体的,上述用户识别方法,包括:

接收终端发送的访问请求,其中,访问请求中携带目标用户信息,目标用户信息包括多种类型的用户信息;

将目标用户信息与预先离线建立的对应关系进行匹配,确定匹配用户信息的类型及其对应的类型权重,其中,对应关系为:预先获取的作弊用户信息、作弊用户信息的类型及预设的类型权重的对应关系,匹配用户信息为:对应关系包括的与目标用户信息包括的各类型的用户信息相匹配的预先获取的作弊用户信息;

根据所确定的类型及其所对应的类型权重,按照预设方式,计算作弊评估值;

根据作弊评估值与预设风险阈值的大小关系,确定访问请求对应的访问用户是否为作弊用户。

需要说明的是,上述处理器501执行存储器503上存放的程序而实现的用户识别方法的其他实现方式,与前述方法实施例部分提供的一种用户识别方法实施例相同,这里不再赘述。

以上可见,本发明实施例提供的方案中,对应关系是预先离线建立的,因此,处理器在执行存储器上存放的程序时,接收到访问请求后,实时对访问请求对应的访问用户是否为作弊用户进行确定的过程中,只需要匹配目标用户信息与对应关系、计算作弊评估值以及判断作弊评估值与预设风险阈值的大小关系即可不需要利用基于深度神经网络的模型对非常多的数据进行复杂计算,因此,在用户识别过程中,服务器需要处理的数据较少,进而,用户识别过程中耗费的计算资源大大减少,耗费的时长大大缩短,用户识别的实时性大大提高。

上述服务器提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述服务器与其他设备之间的通信。

存储器可以包括随机存取存储器(randomaccessmemory,ram),也可以包括非易失性存储器(non-volatilememory,nvm),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessing,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的用户识别方法。

在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的用户识别方法。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solidstatedisk(ssd))等。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例、服务器实施例、计算机可读存储介质实施例及包含指令的计算机程序产品而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1