一种基于手机传感器的群体行为分析方法与流程

文档序号:12819374阅读:579来源:国知局
一种基于手机传感器的群体行为分析方法与流程

本发明涉及行为识别和知识挖掘技术领域,具体涉及一种基于手机传感器的群体行为方法。



背景技术:

随着手机移动网络的迅猛发展及广泛应用,手机网络用户的数量不断增多,移动网络已经成为人们实现资源共享和信息交流的最重要传播媒介。手机移动网络的繁荣使得用户数据以爆炸式的方式增长,这些海量数据蕴含着巨大的价值。对网络群体行为进行分析不仅可以为用户提供适应性强的个性化信息服务同时,也能够在更大的范围内维护网络空间安全,其具有一定的研究价值。网络群体行为是绝大多数或全部网络用户在网络活动中表现出的一种行为习惯。在网络活动中,将所有网络用户视为一个整体,这些用户的特定网络行为表现为互动性和兴趣爱好一致性。通过研究群体用户网络行为特征,使人们对群体用户网络行为规律有了较为深入的了解和把握,同时可以将用户行为中的信息进行有效和合理的分类,通过对分类化的信息进行研究,可以最终找到其中涉及安全的问题。现有技术的用户群体行为分析方法,主要是通过获取智能终端日志对网络群体行为进行分析,然而在获取智能终端日志需要较高的权限,同时在处理web日志海量数据时,现有的搜索引擎技术在对信息的检索时,仍然存着搜索精度不高、覆盖率有限等问题,无法更好地发现web日志上潜在、隐藏的知识。

智能手机等移动电子设备已成为人们日常生活中不可缺少的交流和通讯设备,而内置于智能手机中的传感器,如加速度计、陀螺仪等,以低廉的价格、较高的灵敏度和较小的体积被广泛使用。手机传感器其具有利用微型传感器可以感知多种用户活动、上下文信息、环境信息等,因此利用手机传感器数据进行用户活动信息识别较传统获取手机日志相比,手机传感器调用不受限制有效解决了获取手机日志需要较高的用户权限的缺陷,同时手机传感器还具有数据更加容易存储等优点。



技术实现要素:

根据现有技术的以上缺陷或改进需求,本发明提供一种基于手机传感器的群体行为分析方法,本发明将手机加速度传感器及触摸屏传感器信号作为行为分析的数据源,然后通过滑动平均滤波器对原始数据进行噪声处理;对预处理后的数据在时域和频域上进行特征提取,构建一种结合互信息与线性判别分析的降维方法对提取特征进行降维处理,将降维后的对应特征向量输入行为分类模型,获得用户行为识别结果。进一步选择访问时间和访问频率作为群体行为属性,最后利用近邻传播算法对用户群体行为数据进行聚类分析,完成对群体行为的分析。

本发明实施例公开了一种基于手机传感器的群体行为分析方法,其特征在于,包括以下步骤:

步骤1:通过手机内置加速度及触摸屏传感器实时采集传感器数据,加速度传感器的采样频率设为50hz,触摸传感器以0.02s定时采集,与加速度传感器保持相同的频率;

步骤2:对实时采集到的原始传感器数据进行数据预处理,获得当前时间滑动窗口si对应的数据段;同时对获得的数据段提取行为特征,包括加速度传感器和触摸屏传感器信号的时域和频域特征,得到对应的特征向量f=[f1,f2,…,fm],m为特征维数;通过构建的结合互信息与线性判别分析的降维模型对特征向量f进行特征选择,降维后得到d维特征子集x={x1,x2,…,xd};

步骤3:训练用户浏览网页、聊天、接打电话和游戏4种不同的行为分类模型ci,将降维后的特征子集x={x1,x2,…,xd}输入行为分类模型ci,输出用户行为类别bi,bi∈b,b是由预先定义的行为构成集合b∈{浏览网页,聊天,接打电话,游戏},bi即为最终的用户行为识别结果;

步骤4:根据步骤3识别滑动窗口si的行为结果bi,其中滑动窗口si与行为bi具有一一对应关系;计算时间t内n个用户的行为访问时间vt和访问频率vf作为群体行为属性,利用近邻传播算法对数据进行聚类分析。

在本发明步骤2所述的加速度信号特征分为时域和频域特征,时域特征提取三轴加速度的手势信号能量,频域特征提取快速傅里叶变换前64维系数。

(1)手势在运动过程中的剧烈程度被称为手势能量,计算从手势起点到终点的所有三轴加速度之和,如下:

其中l为滑动窗口长度,g为重力加速度。

(2)快速傅里叶变换系数是加速度信号典型的频域特征,反映了信号的频率分量幅度。对于长度为l的数据窗,x轴加速度ax傅里叶变换如下:

触摸屏信号分别提取手势滑动速度和滑动方向特征:

(3)滑动速度反映了手机用户操作不同程序时手指在屏幕上移动速度:

其中xmax,xmin,ymax,ymin分别为触摸屏信息x、y轴的最大值和最小值;

(4)定义点(xi,yi)处手势轨迹运动方向为:

进一步,所述的步骤2中所构建的结合互信息与线性判别分析的降维模型,为了能够更好衡量特征之间非线性关系,设计一种结合互信息与线性判别分析的降维方法;利用互信息构建样本的类内离散度矩阵和样本的类间离散度矩阵,以此来衡量特征向量集fm×n中各特征间相互关联的程度,有:

其中,p(fi),p(fj)和p(fi,fj)表示为特征fi和fj各自的边缘概率分布及联合概率分布函数。则样本的类内离散度矩阵定义如下:

定义样本的类间离散度矩阵:

最佳投影wopt的选择是使得投影后类间离散度矩阵的行列式与类内离散度矩阵的行列式比值最大的w,即:

其中{wi|i=1,2,...,m}是sb和sw的广义特征向量,它们分别对应于所有广义特征值中m个最大的广义特征值{λi|i=1,2,...,m},即:

sbw=λsww(11)

若sw非奇异,则sw-1sbw=λw,则w的每一列为sw-1sb的前c-1个较大特征的值对应的特征向量。

通过以上步骤,本发明实现了一种利用手机加速度及触摸屏传感器分析用户群体行为的方法。

本发明具有以下优点:

1、本发明所提供的一种基于手机传感器的群体行为分析方法,以手机加速度及触摸屏传感器信号作为行为分析的数据源,能够可以感知多种用户活动和上下文信息,有效解决了获取手机日志需要较高的用户权限的缺陷,同时手机传感器还具有数据更加容易存储等优点。

2、本发明设计一种结合互信息与线性判别分析的降维方法,可以更好衡量特征之间非线性关系,优化了特征空间,减少无效信息成分,降低了计算量。在有效提高行为识别性能同时减少了算法训练时间。

3、本发明采用近邻传播聚类算法对群体行为数据进行分析,够有效克服k-means算法对初始中心点敏感的问题,不需要预先指定类中心,近邻传播算法可自动决定聚类的类数。

附图说明

图1为本发明实施例提供一种基于手机传感器群体行为分析方法的流程图;

图2为本发明实施例提供的用户行为识别流程图;

具体实施方案

下面结合附图对本发明的实施例做进一步描述:

图1为本发明实施例提供一种基于手机传感器群体行为分析方法流程图,本发明所述的基于手机传感器的群体行为分析方法,包括以下步骤:

步骤1:利用手机内置传感器获取加速度及触摸屏传感信号,加速度传感器的采样频率设为50hz,触摸传感器以0.02s定时采集,与加速度传感器保持相同的频率。当手机触摸屏在无触摸手势下,触摸屏x、y轴存储为0。

步骤2:采集的原始数据即包含手势信息,还包含噪声信息,为此,在提取特征之前用滑动平均滤波器对原始数据进行预处理,对数据进行预处理如式(12)

其中ax’(t)为预处理后的x轴加速度,m为滑动平均滤波器的窗口宽度。

对预处理后的数据通过添加滑动窗的方式进行处理,采用等长重叠的窗对数据进行分割。其中滑动窗口的长度设定为10s,而前后窗之间的重叠率选择为50%。进一步对每个滑动窗口内的分割数据进行特征提取。提取的特征向量由加速度信号特征和触摸屏信号特征组成,加速度信号特征分为时域和频域特征,在时域上提取三轴加速度的手势信号能量,频域上提取快速傅里叶变换前64维系数;触摸屏信号分别提取手势滑动速度和滑动方向等特征。考虑到特征分布的不均衡性,提取的加速度信号以及触摸屏信号特征来自时域、频域,其取值差异较大。采用z-score方法规范化特征向量集,规范化后的特征向量集有:

其中:

规范前的特征向量集为f(i,j),m为特征矩阵中的样本个数,n是每个特征向量的维数。经过规范化处理后的特征向量集仍存在维数较高,冗余信息较大等问题,利用本发明的一种结合互信息与线性判别分析的降维方法进行特征子集选择,降维后得到d维特征子集x={x1,x2,…,xd};

步骤3:对用户浏览网页、聊天、接打电话和游戏4种不同的行为进行训练得到分类模型,如图2所示。其中训练的行为分类模型为支持向量机模型,该模型由g(j)个支持向量机组成,函数g(x)由模型的多类别分类策略决定,j为分类目标即行为类别的数目;每个支持向量机对应的分类超平面表达式为f(x),根据输入的特征向量x={x1,x2,…,xd}计算函数值f(x),获得分类结果(f(x)≥0或者f(x)≤0);对所有支持向量机的分类结果进行加权处理,取最高值作为行为分类结果输出。输出用户行为类别bi,bi∈b,b是由预先定义的行为构成集合b∈{浏览网页,聊天,接打电话,游戏},此时即可得到各个用户时间段t行为序列bu={but,t∈tu}。

步骤4:根据步骤3识别滑动窗口si的行为结果bi,其中滑动窗口si与行为bi具有一一对应关系;计算时间t内n个用户的行为访问时间vt和访问频率vf作为群体行为属性。访问时间vt表示用户在某一网络行为上的在线时间总和,访问频率vf表示用户访问某一网络行为的次数。针对n个用户,可获得数据集d,进一步将近邻传播算法应用于所获取的用户数据集d中,将数据集d通过近邻传播算法划分为k个聚类簇,根据类中数据对象特点,对用户群体行为进行分析。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1