用户识别的方法和装置与流程

文档序号:11156612阅读:574来源:国知局
本发明涉及安全
技术领域
,尤其涉及一种能够识别用户风险性的用户识别的方法及装置。
背景技术
:随着电子商务的日益发展,线上购物的各种体验愈加接近线下购物,例如,线上卖家也会通过做活动发送礼包的方式吸引买家。另外,诸如一些网络游戏也会通过做活动发送各种礼包的方式吸引玩家。然,一些网上用户恶意刷取礼包,破坏活动规则。现在常见的拦截这些用户的方法有:第一,通过IP地址限制方法限制恶意刷包用户;第二,通过限制每个用户获取的礼包数限制恶意刷包用户;第三,通过图文验证的方法限制恶意刷包用户。上述三种方法各有不足,第一种限制方法可以使用代理IP绕过;第二种限制方法可以通过注册多个用户来绕过,第三种限制方法限制效果不佳,用户体验不友好。技术实现要素:有鉴于此,有必要提供一种用户识别的方法和装置,能够识别用户的风险性,以解决上述问题。本发明提供一种用户识别的方法。所述方法包括步骤:接收用户登陆请求,其中,所述用户登陆请求中包含用户的一项以上的特征数据;根据预设的与所述一项以上的所述特征数据中的每项特征数据对应的函数计算所述每项特征数据对应的特征值;根据预存的样本数据计算所述每项特征数据对应的阈值,所述阈值用于区分正常账号的特征值与异常账号的特征值;根据所述阈值和每项特征数据的特征值为所述每项特征数据对应的特征值分配系数;根据所述每项特征数据对应的特征值,所述每项特征数据对应的特征值所分配得到的系数以及预设的所述每项特征数据对应的权重值计算所述用户对应的第一风险值。本发明通过计算所述用户的一项以上的特征数据的特征值,再根据每项特征数据匹配的系数,以及每项特征数据对应的权重值计算所述用户的第一风险值来识别所述用户的风险性,简单易操作,准确率高。进一步地,所述方法还包括,通过以下方式获取所述一项以上的所述特征数据中的一项特征数据:初始化聚合点的聚合值,所述聚合点用于表示用户身份证明在半径为R的聚合范围内的聚集位置;获取所述用户登陆请求对应的用户身份证明UID;计算UID/R,根据所述UID/R确定所述用户对应的聚合点;将所述用户对应的聚合点对应的聚合值加1;将所述用户对应的聚合点作为所述一项以上的特征数据中的一项特征数据,且将所述聚合点的聚合值作为特征值。通过计算UID在半径为R的聚合范围内的聚合值来进一步识别用户的风险性,增加用户识别的准确率,避免误判。进一步地,所述方法还包括:获取所述用户登陆请求对应的用户身份证明UID;根据所述UID和随机数Y组成的坐标值,以及DBSCAN聚类算法计算所述用户的第二风险值。本发明进一步通过DBSCAN识别用户的风险性,进一步增加用户识别的准确率,避免误判。进一步地,所述方法还包括:判断所述第一风险值是否小于所述第二风险值,若是,则将所述第一风险值作为所述用户的最终风险值,若否,则将所述第二风险值作为所述用户的最终风险值;或者,计算所述第一风险值和所述第二风险值的平均值,将所述平均值作为所述用户的最终风险值。通过综合第一风险值和第二风险值,进一步增加用户识别的准确率,避免误判。进一步地,所述特征数据包括以下中的至少一项:用户的注册时间、上次登陆时间、本次登陆时间、注册信息、UID。通过采用多个所述特征数据进行多维判断,增加用户识别的准确率,避免误判。本发明还提供一种用户识别的装置。所述装置包括:接收模块,用于接收用户登陆请求,其中,所述用户登陆请求中包含用户的一项以上的特征数据;特征值计算模块,用于根据预设的与所述一项以上的所述特征数据中的每项特征数据对应的函数计算所述每项特征数据对应的特征值;阈值计算模块,用于根据预存的样本数据计算所述每项特征数据对应的阈值,所述阈值用于区分正常账号的特征值与异常账号的特征值;分配模块,用于根据所述阈值和每项特征数据的特征值为所述每项特征数据对应的特征值分配系数;第一风险计算模块,用于根据所述每项特征数据对应的特征值,所述每项特征数据对应的特征值所分配得到的系数以及预设的所述每项特征数据对应的权重值计算所述用户对应的第一风险值。通过计算所述用户的一项以上的特征数据的特征值,再根据每项特征数据匹配的系数及每项特征数据对应的权重值计算所述用户的第一风险值来识别所述用户的风险性,简单易操作,准确率高。进一步地,所述装置还包括:特征数据获取模块,用于初始化聚合点的聚合值,所述聚合点用于表示用户身份证明在半径为R的聚合范围内的聚集位置;获取所述用户登陆请求对应的用户身份证明UID;计算UID/R,根据所述UID/R确定所述用户对应的聚合点;将所述用户对应的聚合点对应的聚合值加1;将所述聚合点作为所述一项以上的特征数据中的一项特征数据,且将所述聚合点的聚合值作为特征值。进一步地,所述用户识别装置还包括:第二风险计算模块,用于获取所述用户登陆请求对应的用户身份证明UID;根据所述UID和随机数Y组成的坐标值,以及DBSCAN聚类算法计算所述用户的第二风险值。本发明进一步通过DBSCAN识别用户的风险性,增加用户识别的准确率,避免误判。进一步地,所述用户识别装置还包括:风险确定模块,用于判断所述第一风险值是否小于所述第二风险值,若是,则将所述第一风险值作为所述用户的最终风险值,若否,则将所述第二风险值作为所述用户的最终风险值;或者,用于计算所述第一风险值和所述第二风险值的平均值,将所述平均值作为所述用户的最终风险值。通过综合第一风险值和第二风险值,进一步增加用户识别的准确率,避免误判。进一步地,所述特征数据包括以下中的至少一项:用户的注册时间、上次登陆时间、本次登陆时间、注册信息、UID。通过采用多个所述特征数据进行多维判断,增加用户识别的准确率,避免误判。附图说明图1为本发明实施例一提供的一种用户识别方法的流程图;图2为本发明实施例二提供的获取一项特征数据的流程图;图3为本发明实施例三提供的一种用户识别方法的流程图;图4为本发明实施例四提供的一种用户识别方法的流程图;图5是本发明实施例五实现用户识别方法的电子设备的较佳实施例的结构示意图;图6是本发明实施例六提供的用户识别装置的结构图;图7是本发明实施例七提供的用户识别装置的结构图;图8是本发明实施例八提供的用户识别装置的结构图;图9是本发明实施例九提供的用户识别装置的结构图。主要元件符号说明电子设备1用户识别装置10存储设备20处理设备30通讯设备40接收模块601、801、901特征值计算模块602、802、903阈值计算模块603、803、904分配模块604、804、905第一风险计算模块605、805、902、906特征数据获取模块701第二风险计算模块806风险确定模块907礼包发放模块908如下具体实施例将结合上述附图进一步说明本发明。具体实施方式为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的
技术领域
的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体地实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。需要说明的是,电子设备可以是电脑、主机箱、台式电脑等具备强大数据处理能力和网络数据通信能力的终端。所述电子设备所处的网络包括,但不限于互联网、广域网、城域网、局域网、虚拟专用网络(VirtualPrivateNetwork,VPN)等。实施例一图1为本发明实施例一提供的用户识别方法的示意流程图。所述用户识别方法应用于电子设备上,如图1所示,所述用户识别方法包括以下步骤S101-S105。步骤S101,接收用户登陆请求,其中,所述用户登录请求由一电子设备响应用户的登陆操作而产生。具体地,所述用户登陆请求中包含用户的一项以上的特征数据。其中,所述一项以上的所述特征数据包括,但不限于注册时间、上次登陆时间、本次登陆时间、注册信息、注册信息的完善度、注册信息的相似度、用户身份证明UID(UniqueIdentification)及请求IP等。其中,所述注册信息的相似度是指所述用户的多项注册信息之间的相似度,例如,所述用户的注册邮箱和注册账号相同,则相似度高。步骤S102,根据预设的与所述一项以上的所述特征数据中的每项特征数据对应的函数计算所述每项特征数据对应的特征值。具体地,本实施例中,采用Adaboost分类器(下文简称Adaboost)从所述用户登陆请求中获取所述用户的一项以上的特征数据,并根据预设的与所述一项以上的所述特征数据中的每项特征数据对应的函数计算所述每项特征数据对应的特征值。具体地,Adaboost在正常使用之前需通过样本数据进行训练,样本数据包括一批正常账号和一批非正常账号的特征数据。Adaboost的训练过程如下:赋予每个样本数据中的一项以上的特征数据以同样的权重值,首先在样本数据上构建一个弱分类器,计算所述弱分类器的错误率,然后在所述弱分类器的基础上再次训练所述弱分类器。在再次训练中,将会调整每项特征数据的权重值,其中正确分类的样本数据的权重值降低,而错误分类的样本数据的权重值增高。Adaboost算法会不断地重复训练和调整权重的过程,直到错误率为0为止,以得到最终的分类器。步骤S103,根据预存的样本数据计算所述每项特征数据对应的阈值,所述阈值用于区分正常账号的特征值与异常账号的特征值。具体地,采用所述Adaboost根据预存的样本数据计算所述每项特征数据对应的阈值。步骤S104,根据所述阈值和每项特征数据的特征值为所述每项特征数据对应的特征值分配系数。具体地,将每项阈值与所述阈值对应的所述特征数据的特征值进行比较,以判断所述特征数据的特征值是否正常,且将正常的所述每项特征数据匹配第一系数,将异常的所述每项特征数据匹配第二系数。具体地,采用所述Adaboost将每项阈值与所述阈值对应的所述特征数据的特征值进行比较,以判断所述特征数据的特征值是否正常,且将正常的所述每项特征数据匹配第一系数,例如,1,将异常的所述每项特征数据匹配第二系数,例如,0。步骤S105,根据所述每项特征数据对应的特征值,所述每项特征数据对应的特征值所分配得到的系数以及预设的所述每项特征数据对应的权重值计算所述用户对应的第一风险值。具体地,根据所述每项特征数据对应的特征值、预设的所述每项特征数据对应的权重值,以及所述每项特征数据对应的所述第一系数或者所述第二系数计算所述用户对应的第一风险值。具体地,采用所述Adaboost根据所述每项特征数据对应的特征值、预设的所述每项特征数据对应的权重值,以及所述每项特征数据对应的所述第一系数或者所述第二系数的乘积相加得到所述用户对应的第一风险值。本实施例一通过计算所述用户的一项以上的特征数据的特征值,再根据每项特征数据匹配的系数,及每项特征数据对应的权重值计算所述用户的第一风险值来识别所述用户的风险性,简单易操作,准确率高。实施例二本发明实施例二与实施例一相似,其不同在于,实施例二通过以下方法获取所述一项以上的所述特征数据中的一项特征数据,其中,图2为本发明实施例二提供的获取一项特征数据的示意流程图,具体包括步骤S201-S204。步骤S201,初始化聚合点的聚合值,所述聚合点用于表示用户身份证明在半径为R的聚合范围内的聚集位置。具体地,将所述聚合点的聚合值均初始化为0。其中,半径R是指参与当前活动的所有用户的数量,例如1000。步骤S202,获取所述用户登陆请求对应的用户身份证明UID,例如10001,计算UID/R,例如,10001/1000=10,根据所述UID/R确定所述用户对应的聚合点,将所述用户对应的聚合点10对应的聚合值加1。步骤S203,将所述用户对应的聚合点作为所述一项以上的特征数据中的一项特征数据,且将所述聚合点的聚合值作为特征值。本实施例二通过计算UID在半径为R的聚合范围内的聚合值来进一步识别用户的风险性,由于正常账号的用户身份证明一般呈随机分布状态,而异常账号的用户身份证明一般都聚合在一起,因此,通过上述聚合值可进一步识别待登陆用户的风险性,增加用户识别的准确率,避免误判。实施例三图3为本发明实施例三中用户识别方法的示意流程图。所述用户识别方法应用于电子设备上,如图3所示,所述用户识别方法包括以下步骤S301-S310。步骤S301,接收用户登陆请求,其中,所述用户登录请求由一电子设备响应用户的登陆操作而产生。具体地,所述用户登陆请求中包含用户的一项以上的特征数据。其中,所述一项以上的所述特征数据包括,但不限于注册时间、上次登陆时间、本次登陆时间、注册信息、注册信息的完善度、注册信息的相似度、UID及请求IP等。其中,所述注册信息的相似度是指所述用户的多项注册信息之间的相似度,例如,所述用户的注册邮箱和注册账号相同,则相似度高。步骤S302,根据预设的与所述一项以上的所述特征数据中的每项特征数据对应的函数计算所述每项特征数据对应的特征值。具体地,采用所述Adaboost从所述用户登陆请求中获取所述用户的一项以上的特征数据,根据预设的与所述一项以上的所述特征数据中的每项特征数据对应的函数计算所述每项特征数据对应的特征值。步骤S303,根据预存的样本数据计算所述每项特征数据对应的阈值,所述阈值用于区分正常账号的特征值与异常账号的特征值。具体地,采用所述Adaboost并根据预存的样本数据计算所述每项特征数据对应的阈值。步骤S304,根据所述阈值和每项特征数据的特征值为所述每项特征数据对应的特征值分配系数。具体地,将每项阈值与所述阈值对应的所述特征数据的特征值进行比较,以判断所述特征数据的特征值是否正常,且将正常的所述每项特征数据匹配第一系数,将异常的所述每项特征数据匹配第二系数。具体地,采用所述Adaboost将每项阈值与所述阈值对应的所述特征数据的特征值进行比较,以判断所述特征数据的特征值是否正常,且将正常的所述每项特征数据匹配第一系数,例如,1,将异常的所述每项特征数据匹配第二系数,例如,0。步骤S305,根据所述每项特征数据对应的特征值,所述每项特征数据对应的特征值所分配得到的系数以及预设的所述每项特征数据对应的权重值计算所述用户对应的第一风险值。具体地,根据所述每项特征数据对应的特征值、预设的所述每项特征数据对应的权重值,以及所述每项特征数据对应的所述第一系数或者所述第二系数计算所述用户对应的第一风险值。步骤S306,根据所述UID和随机数Y组成的坐标值,以及DBSCAN聚类算法计算所述用户的第二风险值。具体地,DBSCAN聚类算法为具有噪声的基于密度的聚类方法(Density-BasedSpatialClusteringofApplicationswithNoise)。具体地,聚类算法DBSCAN以参与当前活动的所有用户的UID的集合为计算依据,以密度可达的方式判断所述UID在参与当前活动的所有用户的UID的集合中是否形成聚合簇,并在形成聚合簇时以参与当前活动的所有用户的特征数据的集合为计算依据计算所述用户的UID的聚合值,即为第二风险值。一般而言,因非正常用户的UID比较相似且在参与活动的所有用户的UID的集合里呈高聚分布,例如UID为100,101,102的三个用户就是聚合在一起的,而正常用户的UID在参与活动的所有用户的UID的集合里呈随机分布,例如,可能出现UID为1的用户,也可能出现UID为1000000的用户,因此,正常用户的UID呈随机分布,无法形成聚合簇,因此,通过聚类算法可以判断所述用户的UID是否在参与当前活动的所有用户的UID的集合中高聚分布,如果所述用户的UID在参与当前活动的所有用户的UID的集合里呈高聚分布,则计算所述用户的UID的聚合值,并将所述聚合值作为第二风险值。例如,将每个用户的UID记为1个数据点,如果所述用户的UID所在的聚合簇有300个数据点,而当天参与当前活动的所有用户的UID的集合总共有1000个数据点,那么所述用户的UID的聚合值为0.3,即300/1000=0.3,即第一风险值为0.3。进一步地,本发明的实施例三还包括步骤S307。步骤S307,判断所述第一风险值是否小于所述第二风险值,若是,将所述第一风险值作为所述用户的最终风险值,若否,将所述第二风险值作为所述用户的最终风险值。具体地,在确定最终风险值之前,还对所述第一风险值和所述第二风险值分别作归一化处理。进一步地,本发明的实施例三的步骤S307还可以为:步骤S307,计算所述第一风险值和所述第二风险值的平均值,将所述平均值作为所述用户的最终风险值。具体地,在确定最终风险值之前,还对所述第一风险值和所述第二风险值分别作归一化处理。在本发明实施例三中,通过Adaboost和DBSCAN分别计算第一风险值和第二风险值来确定最终的风险值,以进一步识别用户的风险性,增加用户识别的准确率,避免误判。实施例四图4为本发明实施例四中用户识别方法的示意流程图。所述用户识别方法应用于电子设备上,如图4所示,所述用户识别方法包括以下步骤S401-S408。步骤S401,接收用户登陆请求。具体地,所述用户登录请求为礼包领取请求。其中,所述礼包领取请求由一电子设备响应用户的礼包领取操作而产生。具体地,所述礼包领取请求中包含用户的一项以上的特征数据。其中,所述一项以上的所述特征数据包括,但不限于注册时间、上次登陆时间、本次登陆时间、注册信息、注册信息的完善度、注册信息的相似度、UID及请求IP等。其中,所述注册信息的相似度是指所述用户的多项注册信息之间的相似度,例如,所述用户的注册邮箱和注册账号相同,则相似度高。步骤S402,根据所述UID和随机数Y组成的坐标值,以及DBSCAN聚类算法计算所述用户的第一风险值。具体地,DBSCAN以参与当前活动的所有用户的UID的集合为计算依据,以密度可达的方式判断所述用户的UID在参与当前活动的所有用户的UID的集合中是否形成聚合簇,并在形成所述聚合簇时,以参与当前活动的所有用户的特征数据的集合为计算依据计算所述用户的UID的聚合值,即为第一风险值。步骤S403,根据预设的与所述一项以上的所述特征数据中的每项特征数据对应的函数计算所述每项特征数据对应的特征值。具体地,采用所述Adaboost从所述用户登陆请求中获取所述用户的一项以上的特征数据,根据预设的与所述一项以上的所述特征数据中的每项特征数据对应的函数计算所述每项特征数据对应的特征值。步骤S404,根据预存的样本数据计算所述每项特征数据对应的阈值,所述阈值用于区分正常账号的特征值与异常账号的特征值。具体地,采用所述Adaboost并根据预存的样本数据计算所述每项特征数据对应的阈值。步骤S405,根据所述阈值和每项特征数据的特征值为所述每项特征数据对应的特征值分配系数。具体地,将每项阈值与所述阈值对应的所述特征数据的特征值进行比较,以判断所述特征数据的特征值是否正常,且将正常的所述每项特征数据匹配第一系数,将异常的所述每项特征数据匹配第二系数。具体地,采用所述Adaboost将每项阈值与所述阈值对应的所述特征数据的特征值进行比较,以判断所述特征数据的特征值是否正常,且将正常的所述每项特征数据匹配第一系数,例如,1,将异常的所述每项特征数据匹配第二系数,例如,0。步骤S406,根据所述每项特征数据对应的特征值,所述每项特征数据对应的特征值所分配得到的系数以及预设的所述每项特征数据对应的权重值计算所述用户对应的第二风险值。具体地,根据所述每项特征数据对应的特征值、预设的所述每项特征数据对应的权重值,以及所述每项特征数据对应的所述第一系数或者所述第二系数计算所述用户对应的第二风险值。进一步地,本发明的实施例三还包括步骤S407。步骤S407,判断所述第一风险值是否小于所述第二风险值,若是,将所述第一风险值作为所述用户的最终风险值,若否,将所述第二风险值作为所述用户的最终风险值。具体地,在确定最终风险值之前,还对所述第一风险值和所述第二风险值分别作归一化处理。进一步地,本发明的实施例三的步骤S407还可以为:步骤S407,计算所述第一风险值和所述第二风险值的平均值,将所述平均值作为所述用户的最终风险值。具体地,在确定最终风险值之前,还对所述第一风险值和所述第二风险值分别作归一化处理。步骤S408,判断最终风险值是否大于0.5,如果是,则确定登陆行为为正常登陆行为,响应所述礼包领取请求,并为所述注册用户发放礼包,如果否,则确定登陆行为为恶意刷礼包行为,不响应所述礼包领取请求,并不为所述注册用户发放礼包。在本发明实施例四中,通过Adaboost和DBSCAN分别计算第一风险值和第二风险值来确定最终的风险值,进一步增加用户识别的准确率,避免误判,且对风险性大的用户不发放礼包。实施例五图5为本发明实现用户识别方法的较佳实施例的电子设备的结构示意图。用户识别装置10设置于电子设备1上。所述电子设备1还包括存储设备20、处理设备30和通讯设备40。优选地,本发明的用户识别方法通过所述电子设备1中的用户识别装置10来实现。所述电子设备1是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、可编程门阵列(Field-ProgrammableGateArray,FPGA)、数字处理器(DigitalSignalProcessor,DSP)、嵌入式设备等。所述电子设备12可以是,但不限于任何一种可与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互且具有移动通讯功能的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(PersonalDigitalAssistant,PDA)、智能式穿戴式设备等。所述用户识别装置10接收用户登陆请求,其中,所述用户登陆请求中包含用户的一项以上的特征数据;根据预设的与所述一项以上的所述特征数据中的每项特征数据对应的函数计算所述每项特征数据对应的特征值;根据预存的样本数据计算所述每项特征数据对应的阈值;将每项阈值与所述阈值对应的所述特征数据的特征值进行比较,以判断所述特征数据的特征值是否正常,且将正常的所述每项特征数据匹配第一系数,将异常的所述每项特征数据匹配第二系数;根据所述每项特征数据对应的特征值、预设的所述每项特征数据对应的权重值,以及所述每项特征数据对应的所述第一系数或者所述第二系数计算所述用户对应的第一风险值。所述存储设备20用于存储所述用户识别装置10中各个程序段的程序代码。所述存储设备20可以为智能媒体卡(smartmediacard)、安全数字卡(securedigitalcard)、快闪存储器卡(flashcard)等储存设备。所述处理设备30可以包括一个或者多个微处理器、数字处理器、微控制器、单片机等。所述通讯设备40可以包括,但不限于无线保真WiFi,蓝牙和射频等。所述通讯设备40用于在所述电子设备1和其它电子设备之间进行数据通讯。实施例六图6为本发明实施例一提供的用户识别装置的结构图。本实施例中的各模块用于执行图1对应的各步骤,具体请参阅图1以及图1对应的实施例中的相关描述,此处不赘述。如图6所示,用户识别装置10可以包括:接收模块601、特征值计算模块602、阈值计算模块603、分配模块604和第一风险计算模块605。本发明所称的模块是指一种能够被处理设备30所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储设备20中。在本实施例中,关于各模块的功能将在后续的实施例中详述。接收模块601,用于接收用户登陆请求,其中,所述用户登录请求由一电子设备响应用户的登陆操作而产生。具体地,所述用户登陆请求中包含用户的一项以上的特征数据。其中,所述一项以上的所述特征数据包括,但不限于注册时间、上次登陆时间、本次登陆时间、注册信息、注册信息的完善度、注册信息的相似度、UID及请求IP等。其中,所述注册信息的相似度是指所述用户的多项注册信息之间的相似度,例如,所述用户的注册邮箱和注册账号相同,则相似度高。特征值计算模块602,用于根据预设的与所述一项以上的所述特征数据中的每项特征数据对应的函数计算所述每项特征数据对应的特征值。具体地,本实施例中,特征值计算模块602,用于采用Adaboost从所述用户登陆请求中获取所述用户的一项以上的特征数据,并根据预设的与所述一项以上的所述特征数据中的每项特征数据对应的函数计算所述每项特征数据对应的特征值。阈值计算模块603,用于根据预存的样本数据计算所述每项特征数据对应的阈值,所述阈值用于区分正常账号的特征值与异常账号的特征值。具体地,阈值计算模块603,用于采用所述Adaboost根据预存的样本数据计算所述每项特征数据对应的阈值。分配模块604,用于根据所述阈值和每项特征数据的特征值为所述每项特征数据对应的特征值分配系数。具体地,所述分配模块604用于将每项阈值与所述阈值对应的所述特征数据的特征值进行比较,以判断所述特征数据的特征值是否正常,且将正常的所述每项特征数据匹配第一系数,将异常的所述每项特征数据匹配第二系数。具体地,分配模块604,用于采用所述Adaboost将每项阈值与所述阈值对应的所述特征数据的特征值进行比较,以判断所述特征数据的特征值是否正常,且将正常的所述每项特征数据匹配第一系数,例如,1,将异常的所述每项特征数据匹配第二系数,例如,0。第一风险计算模块605,用于根据所述每项特征数据对应的特征值,所述每项特征数据对应的特征值所分配得到的系数以及预设的所述每项特征数据对应的权重值计算所述用户对应的第一风险值。具体地,所述第一风险计算模块605用于根据所述每项特征数据对应的特征值、预设的所述每项特征数据对应的权重值,以及所述每项特征数据对应的所述第一系数或者所述第二系数计算所述用户对应的第一风险值。具体地,第一风险计算模块605,用于采用所述Adaboost根据所述每项特征数据对应的特征值、预设的所述每项特征数据对应的权重值,以及所述每项特征数据对应的所述第一系数或者所述第二系数的乘积相加得到所述用户对应的第一风险值。本实施例六通过采用adaboost计算所述用户的一项以上的特征数据的特征值,再根据每项特征数据匹配的阈值、第一系数或者第二系数计算所述用户的第一风险值来识别所述用户的风险性,简单易操作,准确率高。实施例七本发明实施例七与实施例六相似,其不同在于,实施例七通过以下方法获取所述一项以上的所述特征数据中的一项特征数据,其中,图2为本发明实施例二提供的获取一项特征数据的模块示意图,本实施例中的各模块用于执行图2对应的各步骤,具体请参阅图2以及图2对应的实施例中的相关描述,此处不赘述。如图7所示,用户识别装置10还包括特征数据获取模块701。本发明所称的模块是指一种能够被处理设备30所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储设备20中。在本实施例中,关于各模块的功能将在后续的实施例中详述。特征数据获取模块701,用于初始化聚合点的聚合值,所述聚合点用于表示用户身份证明在半径为R的聚合范围内的聚集位置。具体地,将所述聚合点的聚合值均初始化为0。其中,半径R是指参与当前活动的所有用户的数量,例如1000。特征数据获取模块701,还用于获取所述用户登陆请求对应的用户身份证明UID,例如10001,计算UID/R,例如,10001/1000=10,根据所述UID/R确定所述用户对应的聚合点,将所述用户对应的聚合点10对应的聚合值加1。特征数据获取模块701,还用于将所述用户对应的聚合点作为所述一项以上的特征数据中的一项特征数据,且将所述聚合点的聚合值作为特征值。本实施例七通过计算UID在半径为R的聚合范围内的聚合值来进一步识别用户的风险性,由于正常账号的用户身份证明一般呈随机分布状态,而异常账号的用户身份证明一般都聚合在一起,因此,通过上述聚合值可进一步识别待登陆用户的风险性,增加用户识别的准确率,避免误判。实施例八图8为本发明实施例八提供的用户识别装置的结构图。本实施例中的各模块用于执行图3对应的各步骤,具体请参阅图3以及图3对应的实施例中的相关描述,此处不赘述。如图8所示,用户识别装置10可以包括:接收模块801、特征值计算模块802、阈值计算模块803、分配模块804、第一风险计算模块805、第二风险计算模块806,进一步地,用户识别装置10还可以包括:风险确定模块807。本发明所称的模块是指一种能够被处理设备30所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储设备20中。在本实施例中,关于各模块的功能将在后续的实施例中详述。接收模块801,用于接收用户登陆请求,其中,所述用户登录请求由一电子设备响应用户的登陆操作而产生。具体地,所述用户登陆请求中包含用户的一项以上的特征数据。其中,所述一项以上的所述特征数据包括,但不限于注册时间、上次登陆时间、本次登陆时间、注册信息、注册信息的完善度、注册信息的相似度、UID及请求IP等。其中,所述注册信息的相似度是指所述用户的多项注册信息之间的相似度,例如,所述用户的注册邮箱和注册账号相同,则相似度高。特征值计算模块802,用于根据预设的与所述一项以上的所述特征数据中的每项特征数据对应的函数计算所述每项特征数据对应的特征值。具体地,特征值计算模块802,用于采用所述Adaboost从所述用户登陆请求中获取所述用户的一项以上的特征数据,根据预设的与所述一项以上的所述特征数据中的每项特征数据对应的函数计算所述每项特征数据对应的特征值。阈值计算模块803,用于据预存的样本数据计算所述每项特征数据对应的阈值,所述阈值用于区分正常账号的特征值与异常账号的特征值。具体地,阈值计算模块803,用于采用所述Adaboost并根据预存的样本数据计算所述每项特征数据对应的阈值。分配模块804,用于根据所述阈值和每项特征数据的特征值为所述每项特征数据对应的特征值分配系数。具体地,所述分配模块804用于将每项阈值与所述阈值对应的所述特征数据的特征值进行比较,以判断所述特征数据的特征值是否正常,且将正常的所述每项特征数据匹配第一系数,将异常的所述每项特征数据匹配第二系数。具体地,分配模块804,用于采用所述Adaboost将每项阈值与所述阈值对应的所述特征数据的特征值进行比较,以判断所述特征数据的特征值是否正常,且将正常的所述每项特征数据匹配第一系数,例如,1,将异常的所述每项特征数据匹配第二系数,例如,0。第一风险计算模块805,用于根据所述每项特征数据对应的特征值,所述每项特征数据对应的特征值所分配得到的系数以及预设的所述每项特征数据对应的权重值计算所述用户对应的第一风险值。具体地,所述第一风险计算模块805用于根据所述每项特征数据对应的特征值、预设的所述每项特征数据对应的权重值,以及所述每项特征数据对应的所述第一系数或者所述第二系数计算所述用户对应的第一风险值。第二风险计算模块806,用于根据所述UID和随机数Y组成的坐标值,以及DBSCAN聚类算法计算所述用户的第二风险值。风险确定模块807,用于判断所述第一风险值是否小于所述第二风险值,若是,将所述第一风险值作为所述用户的最终风险值,若否,将所述第二风险值作为所述用户的最终风险值。具体地,在确定最终风险值之前,还对所述第一风险值和所述第二风险值分别作归一化处理。或者风险确定模块807,用于计算所述第一风险值和所述第二风险值的平均值,将所述平均值作为所述用户的最终风险值。具体地,在确定最终风险值之前,还对所述第一风险值和所述第二风险值分别作归一化处理。在本发明实施例八中,通过Adaboost和DBSCAN分别计算第一风险值和第二风险值来确定最终的风险值,识别用户的风险性,进一步增加用户识别的准确率,避免误判。实施例九图9为本发明实施例九提供的用户识别装置的结构图。本实施例中的各模块用于执行图4对应的各步骤,具体请参阅图4以及图4对应的实施例中的相关描述,此处不赘述。如图9所示,用户识别装置10可以包括:接收模块901、第一风险计算模块902、特征值计算模块903、阈值计算模块904、分配模块905、第二风险计算模块906,进一步地,用户识别装置10还可以包括:风险确定模块907、礼包发放模块908。本发明所称的模块是指一种能够被处理设备30所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储设备20中。在本实施例中,关于各模块的功能将在后续的实施例中详述。接收模块901,用于接收用户登陆请求。具体地,所述用户登录请求为礼包领取请求。其中,所述礼包领取请求由一电子设备响应用户的礼包领取操作而产生。具体地,所述礼包领取请求中包含用户的一项以上的特征数据。其中,所述一项以上的所述特征数据包括,但不限于注册时间、上次登陆时间、本次登陆时间、注册信息、注册信息的完善度、注册信息的相似度、UID及请求IP等。其中,所述注册信息的相似度是指所述用户的多项注册信息之间的相似度,例如,所述用户的注册邮箱和注册账号相同,则相似度高。第一风险计算模块902,用于根据所述UID和随机数Y组成的坐标值,以及DBSCAN聚类算法计算所述用户的第一风险值。具体地,DBSCAN以参与当前活动的所有用户的UID的集合为计算依据,以密度可达的方式判断所述用户的UID在参与当前活动的所有用户的UID的集合中是否形成聚合簇,并在形成所述聚合簇时,以参与当前活动的所有用户的特征数据的集合为计算依据计算所述用户的UID的聚合值,即为第一风险值。特征值计算模块903,用于根据预设的与所述一项以上的所述特征数据中的每项特征数据对应的函数计算所述每项特征数据对应的特征值。具体地,特征值计算模块903,用于采用所述Adaboost从所述用户登陆请求中获取所述用户的一项以上的特征数据,根据预设的与所述一项以上的所述特征数据中的每项特征数据对应的函数计算所述每项特征数据对应的特征值。阈值计算模块904,用于根据预存的样本数据计算所述每项特征数据对应的阈值,所述阈值用于区分正常账号的特征值与异常账号的特征值。具体地,阈值计算模块904,用于采用所述Adaboost并根据预存的样本数据计算所述每项特征数据对应的阈值。所述阈值用于区分正常账号与异常账号。分配模块905,用于根据所述阈值和每项特征数据的特征值为所述每项特征数据对应的特征值分配系数。具体地,所述分配模块905用于将每项阈值与所述阈值对应的所述特征数据的特征值进行比较,以判断所述特征数据的特征值是否正常,且将正常的所述每项特征数据匹配第一系数,将异常的所述每项特征数据匹配第二系数。具体地,分配模块905,用于采用所述Adaboost将每项阈值与所述阈值对应的所述特征数据的特征值进行比较,以判断所述特征数据的特征值是否正常,且将正常的所述每项特征数据匹配第一系数,例如,1,将异常的所述每项特征数据匹配第二系数,例如,0。第二风险计算模块906,用于根据所述每项特征数据对应的特征值,所述每项特征数据对应的特征值所分配得到的系数以及预设的所述每项特征数据对应的权重值计算所述用户对应的第二风险值。具体地,所述第二风险计算模块906用于根据所述每项特征数据对应的特征值、预设的所述每项特征数据对应的权重值,以及所述每项特征数据对应的所述第一系数或者所述第二系数计算所述用户对应的第二风险值。风险确定模块907,用于计算所述第一风险值和所述第二风险值的平均值,将所述平均值作为所述用户的最终风险值。具体地,在确定最终风险值之前,还对所述第一风险值和所述第二风险值分别作归一化处理。礼包发放模块908用于判断最终风险值是否大于0.5,如果是,则确定登陆行为为正常登陆行为,响应所述礼包领取请求,并为所述注册用户发放礼包,如果否,则确定登陆行为为恶意刷礼包行为,不响应所述礼包领取请求,并不为所述注册用户发放礼包。在本发明实施例九中,通过Adaboost和DBSCAN分别计算第一风险值和第二风险值来确定最终的风险值,识别用户的风险性,进一步增加用户识别的准确率,避免误判,且对风险性大的用户不发放礼包。本领域普通技术人员可以理解实现上述实施例和方法中的全部或者部分流程,是可以通过计算机程序来指令相关的硬件完成,所述的程序可存储于一计算机可读取存储介质中,所述程序在执行时,可包括如上述各方法的实施例的流程。另外,在本发明各个实施例中的各功能单元可以集成在相同处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在相同单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是手持式电子设备,如智能手机、笔记本电脑、个人数字助理(PersonalDigitalAssistant,PDA)、智能式穿戴式设备等,也可以是桌面式电子设备,如台式机、智能电视等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。本说明书实施例所述的内容仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。在本申请所提供的几个实施例中,应所述理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其它的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其它单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或系统也可以由同一个单元或系统通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1