一种基于鼠标行为的用户分类方法

文档序号:6510075阅读:231来源:国知局
一种基于鼠标行为的用户分类方法
【专利摘要】本发明公开了一种基于鼠标行为的用户分类方法,包括下述步骤:S1、对电脑屏幕区域划分,对不同尺寸的屏幕、分辨率进行统一量化;S2、建立鼠标热点区域模型,然后根据鼠标在某个区域内出现的次数的多寡,来判断该区域的热点程度,同时通过比较不同类别用户每个区域热点程度的不同来进行分类;S3、建立鼠标活跃度模型,评定每个划分好的区域内用户鼠标移动的活跃程度,根据用户每个区域鼠标活跃度的异同特征,对用户进行分类。本发明完全是基于鼠标行为,没有依赖网页内容、IP、PV、UV等信息,完全通过用户行为来进行用户属性分类的方法。另外,本发明不但可以灵活地设置收集数据的区域位置大小,还支持多类别分类,可运用于网站或各种操作系统上。
【专利说明】—种基于鼠标行为的用户分类方法
【技术领域】
[0001]本发明涉及数据分析的【技术领域】,特别涉及一种基于鼠标行为的用户分类方法。【背景技术】
[0002]随着互联网技术的发展,互联网上的内容也随着越来越丰富,我们能获得越来越多的信息,网络已经成为现代人生活中不可或缺的一部分。但是,对于个人来说,我们每天能够用于上网的时间是有限的。所以,对于互联网服务的提供者,特别是移动互联网,如何吸引用户的注意力,为用户提供更好的服务,成为了互联网服务提供者的一个值得深入研究的课题。时下,用于研究用户行为信息主要有以下两种方式:
[0003]一、基于网络日志的用户喜好挖掘。
[0004]作者在题目确定之初就已经在中国知网等大型的论文数据库里面进行了长时间的文献搜索。结果发现,基本上所有针对于网络上的用户喜好的数据挖掘都是基于网络日志,即只记录了用户的访问日志,然后基于日志URL的数据进行内容级别的挖掘。
[0005]这种方法可以直接挖掘到用户在最近一段时间内关注的内容,进而能够比较精确的确定用户的喜好。但是每个网页的信息并不局限于短短的URL,所以这种方法并不能具体而准确地得知用户关注的是网页中的哪些内容。
[0006]二,服务端对于用户的一些基本的点击信息的统计
[0007]现在很多人也利用挖掘到的一些IP (独立IP数)、PV (访问量)、UV (独立访客)乃至于用户访问的深度、在网页停留的时间等数据进行用户行为的挖掘。即通过用户登陆一个网站后所做的一切有目的事情都记录下来,进而挖掘其本身内在的意义。
[0008]这种方法主要是用于服务端的统计,可以知道对于网站本身哪些方面比较吸引访问的用户,结合前一种基于网络日志的挖掘方法,可以很好地实现C/S模式上的挖掘互补。
[0009]但是,这些挖掘到的数据都是用户已经浏览的信息,对于用户是否对已经浏览过的信息来确定其依然对这方面的信息感兴趣本来就值得怀疑的。而且,这些方式并没有很好地研究用户在进入网站后的动作特征,并没有很好第体现用户的操作习惯。
[0010]利用鼠标操作计算机是人类与计算机进行沟通的一个重要行为。因此,对用户使用鼠标的行为进行研究,能为我们提供针对不同人群的习惯以及喜好提供更多的有效依据,并且可以更加迅速、实时、精准地定位正在浏览网页的用户特征。
[0011]另外,网络的虚拟世界已经成为了人类人与人之间沟通、获取信息的最重要途径之一。时下充斥着“宅男”、“宅女”等流行词语无不暗示着人们使用PC甚至手机接入互联网的已经成为了除了生活中最主要的一部分了。而且,在图形界面下,人类与计算机最直接迅速的沟通行为就是鼠标行为,使用鼠标就如同我们直接地使用双手去做事那样子。所以,研究用户的鼠标行为能够为网站提供更多有用的用户信息。

【发明内容】

[0012]本发明的目的在于克服现有技术的缺点与不足,提供一种在客户端收集数据并对用户进行分类的方法。
[0013]本发明的目的通过下述技术方案实现:
[0014]一种基于鼠标行为的用户分类方法,包括下述步骤:
[0015]S1、对电脑屏幕区域划分,对用户不同尺寸的屏幕、分辨率进行统一量化;
[0016]S2、建立鼠标热点区域模型,统计在规定时间间隔的鼠标坐标序列内,其落在每个已经划分好的区域的次数,然后根据鼠标在某个区域内出现的次数的多寡,来判断该区域的热点程度,同时通过比较不同类别用户每个区域热点程度的不同来进行分类;
[0017]S3、建立鼠标活跃度模型,用于评定每个划分好的区域内用户鼠标移动的活跃程度,鼠标的活跃程度是在一个时间段内这个区域内鼠标坐标分布的离散程度,离散程度越高,则说明这个区域的用户的鼠标动作越活跃,根据用户每个区域鼠标活跃度的异同特征,对用户进行分类。
[0018]优选的,通过使用Windows提供的AP1、Linux的shelI脚本或者浏览器的Javascript脚本来读取用户屏幕的分辨率,并根据实际应用情况来进行区域的划分。
[0019]优选的,对于鼠标热点区域模型,在其实际投入运行之前,需要收集并利用用户的数据来对不同类别的人群进行数据分析,挖掘其在电脑屏幕或者网页内热点区域的异同,统计得出基于最大似然概率的分类先验概率;热点区域的判断方法为:分类别导入某一类别的用户的一定量基于时间序列的鼠标坐标数据,判断每个鼠标坐标所在区域,然后在其所在区域的热点频度上加一,当数据导入完之后,频率高的区域即为其热点区域,通过控制导入不同类别用户的数据集数据量,使得它们大小相等,从而进行不同区域的频率统计,把其频率归一化作为其分类的先验性 概率。
[0020]优选的,把频率归一化作为鼠标行为用户分类的先验性概率的具体方法如下:
[0021]设每个导入的数据落在某个区域的事件为Ai,每个事件对应的概率为P(Ai),所以,对于每个区域来说,它的概率之和为1:
【权利要求】
1.一种基于鼠标行为的用户分类方法,其特征在于,包括下述步骤: 51、对电脑屏幕区域划分,对用户不同尺寸的屏幕、分辨率进行统一量化; 52、建立鼠标热点区域模型,统计在规定时间间隔的鼠标坐标序列内,其落在每个已经划分好的区域的次数,然后根据鼠标在某个区域内出现的次数的多寡,来判断该区域的热点程度,同时通过比较不同类别用户每个区域热点程度的不同来进行分类; 53、建立鼠标活跃度模型,用于评定每个划分好的区域内用户鼠标移动的活跃程度,鼠标的活跃程度是在一个时间段内这个区域内鼠标坐标分布的离散程度,离散程度越高,则说明这个区域的用户的鼠标动作越活跃,根据用户每个区域鼠标活跃度的异同特征,对用户进行分类。
2.根据权利要求1所述的基于鼠标行为的用户分类方法,其特征在于,通过使用Windows提供的AP1、Linux的shell脚本或者浏览器的Javascript脚本来读取用户屏幕的分辨率,并根据实际应用情况来进行区域的划分。
3.根据权利要求1所述的基于鼠标行为的用户分类方法,其特征在于,对于鼠标热点区域模型,在其实际投入运行之前,需要收集并利用用户的数据来对不同类别的人群进行数据分析,挖掘其在电脑屏幕或者网页内热点区域的异同,统计得出基于最大似然概率的分类先验概率;热点区域的判断方法为:分类别导入某一类别的用户的一定量基于时间序列的鼠标坐标数据,判断每个鼠标坐标所在区域,然后在其所在区域的热点频度上加一,当数据导入完之后,频率高的区域即为其热点区域,通过控制导入不同类别用户的数据集数据量,使得它们大小 相等,从而进行不同区域的频率统计,把其频率归一化作为其分类的先验性概率。
4.根据权利要求3所述的基于鼠标行为的用户分类方法,其特征在于,把频率归一化作为鼠标行为用户分类的先验性概率的具体方法如下: 设每个导入的数据落在 某个区域的事件为Ai,每个事件对应的概率为P (Ai),所以,对于每个区域来说,它的概率之和为1:
5.根据权利要求4所述的基于鼠标行为的用户分类方法,其特征在于,建立鼠标热点区域模型的步骤如下: 通过收集一个用户按时间序列而产生的鼠标坐标输入流,计算其输入的数据流每一项数据的分类概率来对模型分类结果进行训练,得到汇总的分类最大似然概率,类别i最大似然概率Psi的公式如下:
6.根据权利要求1所述的基于鼠标行为的用户分类方法,其特征在于:对于鼠标活跃度模型,利用统计学标准差来量化用户的鼠标移动的离散程度和活跃度;某个区域标准差越大,则表明用户在该区域的的鼠标活动越离散、活跃;使用标准差圆半径来对标准差进行数学描述,对于每一个区域来说,使用以下的计算公式:
7.根据权利要求1所述的基于鼠标行为的用户分类方法,其特征在于:每个区域是独立的,并且都对分类作出影响,所有区域的标准差圆半径R都分别作为该区域分类的特征,由于分类的类别也可以是多种的,所以可以建立得到以下多分类Logisitic回归模型: 假设所需要分辨的类别Y有e个取值[1,e],以Y=I为模型的参照组,协变量为该类各个区域的标准差圆半径Ri= (Rn,Ri2,...,Rij):
8.根据权利要求6所述的基于鼠标行为的用户分类方法,其特征在于:首先在类别i的用户数据集中抽取大小相等的数据块,每个数据块的数据为按时间序列收集到的用户鼠标坐标(X,y),数量为N,然后根据标准差圆半径R的计算方法,计算出这N个数据里面,每个区域对应的标准差圆半径Ru,通过导入大量数据作为先验性参数计算的输入:
Bi (Ri) = β ?ο+β IiRn+ β I2Ri2+-..+ β ijRij
来计算第i类的参数:
β ?=(β ?ο.β il, β 12.....β ij), 把所得的参数β i代入Logisitic模型
【文档编号】G06F3/033GK103440328SQ201310395555
【公开日】2013年12月11日 申请日期:2013年9月3日 优先权日:2013年9月3日
【发明者】邓玉辉, 邓伟鸿 申请人:暨南大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1