用户行为识别设备及方法

文档序号:6655070阅读:261来源:国知局
专利名称:用户行为识别设备及方法
技术领域
本发明涉及数据分析领域,具体涉及一种基于位置信息的用户行为识别设备及方法。
背景技术
随着定位技术的快速发展和普及,无论是全球卫星定位系统,还是基于无线蜂窝网的手机定位技术,都让人们能更高效地认知周边地理环境。这些位置信息不但可用于定位、导航以及提供一些基于位置的服务,也可用于表达用户在地理空间的历史行为。例如,将一个用户孤立的位置点按照时间顺序连成路线,便可表达该用户过去的历史轨迹。多条历史轨迹的累积便可用来反映用户的生活规律和行为特征。进一步地,从大量的用户数据 集合中则可分析出一个区域内人们的生活模式和社会规律,如热点地区、经典旅行路线和交通状况等。在当前众多的无线定位技术中,GPS以其覆盖范围广、定位精度高、定位时间短和定位依赖性小等优势逐渐在人们的日常生活中变得普及起来。各种车载GPS、手持GPS和GPS智能手机的相继问世也为人们提供了更加便捷的位置获取和轨迹记录方式。通过GPS获取的轨迹数据在各种应用中能够发挥重要的作用,例如能够帮助人们理解个人行为和社会规律。从数据源来看,可分为基于个人轨迹数据的理解和基于多人轨迹数据的理解两个方向。个人轨迹数据的理解是指,用户可在不干扰生活的前提下记录自己的旅行路线、运动经历、以及日常生活和工作轨迹。结合现有的地理信息数据库和电子地图,这些轨迹数据可为个人提供以下服务帮助用户更有效的回忆过去;更便捷的与朋友分享生活经历;理解自己的生活规律;以及提供个性化服务,等等。单个用户的轨迹数据可以体现个人的生活规律,而多个用户轨迹数据的集合则可用来表达一个社区乃至一个城市里人们的生活模式,可以用于用户行为识别。在固定目的地的行为,如就餐、购物、运动等,也包含对用户在路程中的行为理解,例如用户当时采用的交通方式是开车、公交还是自行车等,以及预测用户可能选择的目的地。然而,通过轨迹数据的理解识别出用户的行为进而得到区域内的用户生活模式,目前在技术实现上还存在问题。无论何种定位的方法,都存在定位上的误差,无法将用户准确位置同数字电子地图上的兴趣点(Point of Interest, P0I)完全的吻合起来,于是只能精确到城区内某个较大的区域,如中央商务区(CBD)、中关村等,因而只能对用户的位置分布趋势进行大概分析,不能做到用户行为的准确识别。因此,无法准确理解单个用户的轨迹数据,进而无法得到个人详尽的行为方式,同样无法通过分析得到一个社区乃至一个城市里人们的生活模式。现有技术中存在一种处理用户数据的方法,其根据用户位置信息的变化来获取用户的各种数据信息,然后对这些信息根据地理分布进行分类统计,以对用户的行为和习惯进行分析。该方法主要包括以下步骤首先,获取关于用户的位置信息,其中该位置信息包含用户标识以及该用户的所在位置区域。然后,根据设定的条件准则,在位置信息历史记录中查找符合条件准则的用户标识。最后,根据查找到的所述用户标识提取用户资料,并根据所述用户资料发布用户数据。下面详细说明该方法的具体操作过程。图I示出了在时间范围和区域范围中分布的用户轨迹。如图I所示,不规则形状表示用户轨迹分布的时间和区域范围,矩形框表示需要分析的时间和区域范围,多个点表示用户的位置点,坐标横轴表示区域,坐标纵轴表示时间。在图I所示的例子中,点3和点4是符合该范围的用户位置点,而点I和点2是不符合该范围的用户位置点。将符合范围要求的用户位置点(例如点3和点4)形成集合,该集合由于包含用户的标识信息(例如手机号),如下表I所示
权利要求
1.一种用户行为识别设备,包括 位置数据接收単元,接收用户位置数据并按照时间顺序进行整理,以获得基于时间序列的用户位置数据; 数据预处理单元,对基于时间序列的用户位置数据进行预处理; 特征向量提取单元,根据预处理后的用户位置数据,提取用于识别用户的活动类型的特征向量;以及 用户行为识别单元,根据特征向量提取单元提取的特征向量来识别用户的活动类型,以获得用户的行为特征。
2.如权利要求I所述的用户行为识别设备,其中,所述基于时间序列的用户位置数据包括用户标识信息、地理位置信息和时间信息。
3.如权利要求I所述的用户行为识别设备,其中,所述数据预处理单元从基于时间序列的用户位置数据中获取用户的出行链和活动区域,并结合数字电子地图的兴趣点信息获得用户的活动备选地点。
4.如权利要求I所述的用户行为识别设备,其中,所述特征向量提取单元提取的特征向量包括针对用户出行链的基于时间的向量和基于空间的向量,以及针对用户活动的基于时间的向量和基于空间的向量。
5.如权利要求4所述的用户行为识别设备,其中,所述针对用户出行链的基于时间的向量包括出行链的开始时间与全天时间的比例、出行链的持续时间与全天时间的比例、主要活动的开始时间与全天时间的比例、主要活动的持续时间与全天时间的比例、所有活动持续时间占出行链持续时间的比例、平均活动持续时间占出行链持续时间的比例、所有分布的活动持续时间与出行链持续时间比例的标准差、主要活动持续时间占出行链所有活动持续时间的比例。
6.如权利要求4所述的用户行为识别设备,其中,所述针对用户出行链的基于空间的向量包括出行链长度与出行链长度最大距离的比例、出行链半径与出行链长度的比例、主要活动的离家距离与出行链长度的比例、活动之间相隔距离的平均值与出行链长度的比例、活动之间相隔距离的标准差。
7.如权利要求4所述的用户行为识别设备,其中,所述针对用户活动的基于时间的向量包括活动的开始时间与全天时间的比例、活动的持续时间与全天时间的比例、活动开始距出行链起点之间时间与出行链持续时间的比例、活动的持续时间与出行链持续时间的比例、活动开始距上一活动结束之间的时间与出行链持续时间的比例、活动结束距下ー活动开始之间的时间与出行链持续时间的比例、活动的持续时间与主要活动持续时间的比例、活动开始距主要活动结束之间时间与出行链持续时间的比例、主要活动开始距活动结束之间时间与出行链持续时间的比例。
8.如权利要求4所述的用户行为识别设备,其中,所述针对用户活动的基于空间的向量包括活动离家距离与出行链长度的比例、活动距上一活动之间的出行距离与出行链长度的比例、活动距下一活动之间的出行距离与出行链长度的比例、活动的回家距离与主要活动回家距离的差与出行链长度的比例、活动的离家距离与主要活动离家距离的差与出行链长度的比例。
9.如权利要求I所述的用户行为识别设备,所述用户行为识别単元包括基于支持向量机的分类器。
10.如权利要求I所述的用户行为识别设备,还包括 用户行为汇总单元,通过用户标识信息将单个用户的行为特征与用户资料数据相关联,并对特定区域内的多个用户的数据进行汇总,以获得该区域的特征信息。
11.一种用户行为识别方法,包括 接收用户位置数据并按照时间顺序进行整理,以获得基于时间序列的用户位置数据; 对基于时间序列的用户位置数据进行预处理; 根据预处理后的用户位置数据,提取用于识别用户的活动类型的特征向量;以及 根据所述特征向量来识别用户的活动类型,以获得用户的行为特征。
12.如权利要求11所述的用户行为识别方法,其中,所述基于时间序列的用户位置数据包括用户标识信息、地理位置信息和时间信息。
13.如权利要求11所述的用户行为识别方法,其中,对基于时间序列的用户位置数据进行预处理的步骤包括从基于时间序列的用户位置数据中获取用户的出行链和活动区域,并结合数字电子地图的兴趣点信息获得用户的活动备选地点。
14.如权利要求11所述的用户行为识别方法,其中,所述特征向量包括针对用户出行链的基于时间的向量和基于空间的向量,以及针对用户活动的基于时间的向量和基于空间的向量。
15.如权利要求14所述的用户行为识别方法,其中,所述针对用户出行链的基于时间的向量包括出行链的开始时间与全天时间的比例、出行链的持续时间与全天时间的比例、主要活动的开始时间与全天时间的比例、主要活动的持续时间与全天时间的比例、所有活动持续时间占出行链持续时间的比例、平均活动持续时间占出行链持续时间的比例、所有分布的活动持续时间与出行链持续时间比例的标准差、主要活动持续时间占出行链所有活动持续时间的比例。
16.如权利要求14所述的用户行为识别方法,其中,所述针对用户出行链的基于空间的向量包括出行链长度与出行链长度最大距离的比例、出行链半径与出行链长度的比例、主要活动的离家距离与出行链长度的比例、活动之间相隔距离的平均值与出行链长度的比例、活动之间相隔距离的标准差。
17.如权利要求14所述的用户行为识别方法,其中,所述针对用户活动的基于时间的向量包括活动的开始时间与全天时间的比例、活动的持续时间与全天时间的比例、活动开始距出行链起点之间时间与出行链持续时间的比例、活动的持续时间与出行链持续时间的比例、活动开始距上一活动结束之间的时间与出行链持续时间的比例、活动结束距下ー活动开始之间的时间与出行链持续时间的比例、活动的持续时间与主要活动持续时间的比例、活动开始距主要活动结束之间时间与出行链持续时间的比例、主要活动开始距活动结束之间时间与出行链持续时间的比例。
18.如权利要求14所述的用户行为识别方法,其中,所述针对用户活动的基于空间的向量包括活动离家距离与出行链长度的比例、活动距上一活动之间的出行距离与出行链长度的比例、活动距下一活动之间的出行距离与出行链长度的比例、活动的回家距离与主要活动回家距离的差与出行链长度的比例、活动的离家距离与主要活动离家距离的差与出行链长度的比例。
19.如权利要求11所述的用户行为识别方法,其中,使用基于支持向量机的分类器根据 所述特征向量来识别用户的活动类型,以获得用户的行为特征。
20.如权利要求11所述的用户行为识别方法,还包括 通过用户标识信息将单个用户的行为特征与用户资料数据相关联,并对特定区域内的多个用户的数据进行汇总,以获得该区域的特征信息。
全文摘要
本发明提供了一种用户行为识别设备,包括位置数据接收单元,接收用户位置数据并按照时间顺序进行整理,以获得基于时间序列的用户位置数据;数据预处理单元,对基于时间序列的用户位置数据进行预处理;特征向量提取单元,根据预处理后的用户位置数据,提取用于识别用户的活动类型的特征向量;以及用户行为识别单元,根据特征向量提取单元提取的特征向量来识别用户的活动类型,以获得用户的行为特征。本发明还提供了一种用户行为识别方法。本发明能够得到用户深层次的行为特征,使得每个用户的行为识别结果更加精确和丰富。
文档编号G06F17/30GK102682041SQ20111007760
公开日2012年9月19日 申请日期2011年3月18日 优先权日2011年3月18日
发明者伍涛, 厉程海, 张伟力, 饶佳 申请人:日电(中国)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1