感应网络环境下移动位置分析方法

文档序号:6487844阅读:156来源:国知局
感应网络环境下移动位置分析方法
【专利摘要】本发明涉及感应网络环境下的移动定位数据分析【技术领域】,是一种面向移动设备采集定位数据,并结合其它附加信息对定位数据进行聚合分析和知识发现的感应网络环境下移动位置分析系统和方法。包括:接收一个或多个可定位设备发送的定位数据点;将定位数据点与人口结构特征数据和用户历史轨迹数据进行数据关联;对关联后的定位数据点进行聚合分析,将具有相似特征的用户聚合为群组,得到群组结构特征数据;导出聚合结果。该方法能根据定位数据以及其它信息将具有相似特征的移动用户聚合成群组,并将群组信息以友好的方式展示到用户终端或公共显示设备上。
【专利说明】感应网络环境下移动位置分析方法
【技术领域】
[0001]本发明涉及感应网络环境下的移动定位数据分析【技术领域】,是ー种面向移动设备采集定位数据,并结合其它附加信息对定位数据进行聚合分析和知识发现的感应网络环境下移动位置分析系统和方法。
【背景技术】
[0002]目前,随着定位设备、定位技术的发展,各种定位服务也逐渐丰富起来。于此同吋,也产生了大量的由移动设备(移动电话、汽车GPS导航仪等)产生的历史或实时数据,这些数据一般都包含设备唯一标识符、时间、经纬度、速度、方向、以及其它ー些元数据信息。这些数据如实记录了人们日常活动的移动轨迹,蕴含着丰富的知识。使用适当的分析方法从这些海量冗繁的原始数据中挖掘出有意义的知识,并以便捷、友好的方式呈现这些知识,有助于人们更好地了解个体、群体的移动规律、行为模式,进而帮助人们更好地管理自身的行为。
[0003]近来基于移动数据的研究已有不少,如基于车辆轨迹数据的车流量预测、实时交通事件探測、车流潮汐现象、区域间车流移动模式等等;基于个人移动数据的城市热点探测、人群密度分布等等。但是以往的这些研究都很少有使用到人ロ结构特征数据。这些人ロ结构特征数据可以包括:地理位置、事件、年龄、性別、种族、宗教、血统、户藉、參与的组织、教育程度、收入水平、职业、行业、政治倾向、嗜好、兴趣、參与的活动、消费偏好、消费习惯、与某个群组的关联关系等等。通过将这些人口结构特征数据与定位数据进行关联分析,就可以做出ー些有意义的推断。比如,一名携帯有移动电话的用户在正常工作时段经常出现于大学校园内,那么此用户可能学生或学校教工人员;而如果此用户又经常在夜晚出现于校外某住宅区,那么此用户可能是本地学生或教工人员;而若此用户又经常于早上或傍晚出现某幼儿园或小学,那此用户很可能是教工人员。在有其它更多背景信息的情况下,可以对拥有某些共同特征的人群进行聚合分析,聚合而成的群组可以是ー些在特定时间特定地点出现的群体,也可以是在特定时间段儿内频繁出现于某地的群体。比如(并不仅限于此),ー个群组可以包括所有在周六下午逛某ー商场的客户,或者包括在某一商场促销期间逛此商场的所有客户。
[0004]因此,通过对移动设备用户的轨迹数据和人口结构特征数据进行关联分析、聚合分析,可以获知移动网络环境下个体与群体的存在形态与移动行为规律。

【发明内容】

[0005]针对现有技术中的上述问题,本发明提供一种感应网络环境下移动位置分析方法。
[0006]本发明为实现上述目的所采用的技术方案是:感应网络环境下移动位置分析方法,包括以下步骤:
[0007]接收ー个或多个可定位设备发送的定位数据点;[0008]将定位数据点与人口结构特征数据和用户历史轨迹数据进行数据关联;
[0009]对关联后的定位数据点进行聚合分析,将具有相似特征的用户聚合为群组,得到群组结构特征数据;
[0010]导出聚合结果。
[0011]所述可定位设备为能够标识失控位置点,并具有唯一标识符的设备。
[0012]所述人口结构特征数据包括地理位置、事件、年龄、性別、种族、宗教、血统、户籍、參与的组织、教育程度、收入水平、职业、行业、政治倾向、嗜好、兴趣、參与的活动、消费偏好、消费习惯和与某个群组的关联关系中的ー种或几种。
[0013]所述群组结构特征数据包括群组的位置、密度、分布和兴趣。
[0014]所述数据关联具体为:对定位数据点中的噪声数据、冗余数据、错误数据及不完整数据进行滤除清洗,将处理后的定位数据与地理信息、城市区划、时间区间信息相关联,即依据定位数据的采集时间特征、背景地理空间区域位置特征进行解析。
[0015]所述滤除清洗后的数据以用户个人档案的形式存入到历史轨迹数据库中。
[0016]所述聚合分析具体为:使用序列模式挖掘方法对个人轨迹进行聚合分类以得到初步的群组信息;结合用户背景信息使用频繁模式挖掘方法对初步的群组信息进行分析处理,得到群组。
[0017]本发明具有以下优点:
[0018]本发明能根据定位数据以及其它信息将具有相似特征的移动用户聚合成群组,并将群组信息以友好的方式展示到用户终端或公共显示设备上。而这些聚合结果能让用户更好地了解自身以及与自己相关联的群组的行为规律,帮助用户更好地发掘ー些与自身或群组有关的有价值的信息;而且,也能帮助市政、交通、医疗等社会管理和服务部门更好地理解群体行为,为各部门的决策管理提供有效的可用信息。
[0019]在使用本方法对移动设备用户的轨迹数据进行关联分析、聚合分析后,可以将具有相似行为特征的用户聚合成群组,并以直观的形式将群组位置、群组成员密度、以及其它群组属性显示到用户终端。这样就能在此基础上做更进一歩的分析,比如分析个体和群体的存在形态与移动行为规律、个体与群体的复杂耦合移动特性、不同群体之间的相互融合、转化规律等等。这些分析结果在公共服务、商业模式、健康医疗、疾病控制等领域的行为预测和风险评估等应用方面都有很积极的现实意义。
【专利附图】

【附图说明】
[0020]图1是本发明应用的系统结构图;
[0021]图2是本发明的数据处理流程图;
[0022]图3是不同群组在地图上的显示图;
[0023]图4是用户与群组之间关系的显示以及针对用户的推荐信息的显示图;
[0024]图5是用户信息管理界面;
[0025]图6是广告信息的显示。
【具体实施方式】
[0026]下面结合附图及实施例对本发明做进ー步的详细说明。[0027]本发明主要由定位数据接收器、系统服务器、数据库服务器、数据关联、聚合分析、通信网络、用户终端等几部分组成,其系统结构如图1所示。其中:
[0028]1.定位数据接收器:用以接收可定位设备通过蜂窝通信网络、WIF1、通信卫星、互联网等发回的定位数据,而后将定位数据转发到系统服务器以供处理。可定位设备可以包括蜂窝电话、GPS设备、WIFI设备、RFID设备、或者其它任何能标识时空位置点的设备。同时,可定位设备都应具有“唯一标识符”,所谓的“唯一标识符”是ー些能够在特定时间、特定地点或特定事件中唯一标识ー个特定的人、设备或对象的信息。而由定位设备产生的定位数据则包括时间、经纬度、速度、方向、以及其它ー些元数据信息。
[0029]2.数据关联:用以将定位数据点与人口结构特征信息相关联,并将定位数据点与用户历史轨迹记录相关联,从而得到与用户个体所关联用户背景资料。所谓的人口结构特征信息可以包括:地理位置、事件、年龄、性別、种族、宗教、血统、户籍、參与的组织、教育程度、收入水平、职业、行业、政治倾向、嗜好、兴趣、參与的活动、消费偏好、消费习惯、与某个群组的关联关系等等。
[0030]3.聚合分析:在基于数据关联所得到的关联关系的基础上对定位数据进行聚合分析,从而将具有相似特征的用户聚合为群组,并获得群组的位置、密度、分布、兴趣等特征信息。
[0031]数据关联和聚合分析的工作是ー个复杂的过程,关联引擎先将原始实时定位数据与个人历史轨迹相关联,即将个人轨迹资料整理归档,然后将定位数据与时间区间、地理信息、市政区划等用于初级分类的信息相关联。在完成关联步骤后,聚合分析便使用序列模式挖掘方法对个人轨迹进行聚合分类以得到初歩的群组信息,然后聚合分析再结合更多的用户背景信息使用频繁模式挖掘方法做进ー步的分析处理,从而得到相似度更高的群组分类。在得到详细群组信息之后,更可以做更深层次的分析,并相应用户请求向用户推送分析所得的信息。其工作原理如下:
[0032]首先,在系统服务器接收到用户的实时定位数据后,先对数据进行过滤、清洗等预处理,然后将定位数据以用户个人档案的形式存入到历史轨迹数据库。同时,数据关联将定位数据与地理信息、城市区划、时间区间等信息相关联,以便接下来在聚合分析的过程中所用。tヒ如,将定位点P (个人ID、经度、维度、时间戳)与这些信息关联后可以为P’(个人ID、时间戳、工作日、早上、市区A、商业区B)。
[0033]当有了一定量的历史数据后,聚合分析引擎就可以进行聚合分析。聚合分析要先对定位数据根据具体需求重采样,以减少分析过程的复杂度;然后将每个用户的带有关联信息的定位数据根据地点类型、活动区域、活动时间等特征抽象为ー个个时间序列,并对这些序列数据进行序列模式挖掘,从而将特征相似的序列聚合到一起,也即将特征不同的序列分类到不同类别。这也就是获得的初始群组信息。
[0034]与个人用户相关的还有更为丰富的其它属性信息,比如年龄、性別、职业、文化程度、收入水平等等,于是便可以根据这些信息使用频繁模式挖掘方法对初始群组继续分析,以发现成员特征更为相似、内部联系更为紧密的群组。更进一歩地,可以分析出关于群组的更多的衍生信息,比如分析给某一群组成员数量、成员类型、兴趣爱好、消费习惯、行为规律等等。有了这些更深层次的信息,不但可以满足个体用户了解自身和群组的需求,也可以为管理、服务、商业等部门的决策提供支持和帮助。一个最简单的例子就是本发明中可以根据群组的兴趣爱好、消费习惯等特征向用户提供精准广告投放。
[0035]以上这些分析所得的中间结果或最終結果都会以适当的形式存储到关联信息数据库或群组信息数据库,以备以后做更多分析或用以响应用户的查询请求而显示到用户终端。比如用户移动終端能显示用户实时位置,能显示用户的历史轨迹信息,也能显示与用户相关的群组的历史信息或实时信息。
[0036]4.序列模式挖掘方法:
[0037]对于每人每天的定位点,间隔一定时间(比如半小时或ー小吋)进行采样,并用字母(或数字)表示为序列数据格式:AABBBDDDDDDDEEEEEGGGGGG。对于得到的活动序列数据,首先对其进行序列比对,并依据序列的相似度,可以得到序列的大致分类,各个分类即为成员具有相似行为特征的群组。对于用序列比对算法挖掘出的行为群组,可以继续使用频繁模式挖掘方法,挖掘各组行为模式的用户背景属性关联模式,从而得到用户属性与其行为模式的内在关联。
[0038]城市区域可以根据已有的市政区化进行分类,比如东城区、西城去、高新区等等。然后再将这些区域按其功能类型划分:商业区、住宅区、教学区、休闲娱乐区、エ业区、广场区、仓储货运区、混合区等,在这个基础上每个城区就可以划分为商业区A、商业区B、教学区C、住宅区D等等。
[0039]有了这些具体的区域划分,就可以将每人的位置以时间顺序表示成地点序列。然后再使用PrefixSpan算法对序列进行模式挖掘,PrefixSpan算法的过程为:首先找出所有的频繁1-模式,频繁1-模式组成的集合记为以这些1-模式为前缀,在其对应的投影数据库中,找出频繁的卜闭模式,再以这些1-闭模式为前缀,在投影数据库中继续以上过程,直到不再产生频繁1-闭模式为止。具体如下:
[0040]输入:f_list,输出:所有的序列模式
[0041]I)For each a in f_list
[0042]2) PrefixSpan (a, S | a)
[0043]3)扫描S I a 一次,找出所有的1-闭模式,记为C,或者与a对接,形成形如<a,c>,或者追加到序列的末尾,如<a,c>,如果没有产生1-闭模式,则返回到I)处。
[0044]4)将I)中增长的模式添加到模式库中,记为a’。
[0045]5)执行 PrefixSpan (a,, Sla,)。
[0046]其中,符号Sla表示子序列a的投影数据库,即a的所有后缀所形成的子序列数据集。
[0047]最后的序列模式结果可能为表I中的形式:
[0048]表I序列模式结果
[0049]
【权利要求】
1.一种感应网络环境下移动位置分析方法,其特征在于,包括以下步骤: 接收ー个或多个可定位设备发送的定位数据点; 将定位数据点与人口结构特征数据和用户历史轨迹数据进行数据关联; 对关联后的定位数据点进行聚合分析,将具有相似特征的用户聚合为群组,得到群组结构特征数据; 导出聚合结果。
2.根据权利要求1所述的感应网络环境下移动位置分析方法,其特征在于,所述可定位设备为能够标识失控位置点,并具有唯一标识符的设备。
3.根据权利要求1所述的感应网络环境下移动位置分析方法,其特征在于,所述人口结构特征数据包括地理位置、事件、年龄、性別、种族、宗教、血统、户籍、參与的组织、教育程度、收入水平、职业、行业、政治倾向、嗜好、兴趣、參与的活动、消费偏好、消费习惯和与某个群组的关联关系中的ー种或几种。
4.根据权利要求1所述的感应网络环境下移动位置分析方法,其特征在于,所述群组结构特征数据包括群组的位置、密度、分布和兴趣。
5.根据权利要求1所述的感应网络环境下移动位置分析方法,其特征在于,所述数据关联具体为:对定位数据点中的噪声数据、冗余数据、错误数据及不完整数据进行滤除清洗,将处理后的定位数据与地理信息、城市区划、时间区间信息相关联,即依据定位数据的采集时间特征、背景地理空间区域位置特征进行解析。
6.根据权利要求5所述的感应网络环境下移动位置分析方法,其特征在于,所述滤除清洗后的数据以用户个人档案的形式存入到历史轨迹数据库中。
7.根据权利要求1所述的感应网络环境下移动位置分析方法,其特征在于,所述聚合分析具体为:使用序列模式挖掘方法对个人轨迹进行聚合分类以得到初歩的群组信息;结合用户背景信息使用频繁模式挖掘方法对初步的群组信息进行分析处理,得到群组。
【文档编号】G06F17/30GK103593349SQ201210289165
【公开日】2014年2月19日 申请日期:2012年8月14日 优先权日:2012年8月14日
【发明者】库涛, 朱云龙, 吴俊伟, 王亮, 吕赐兴, 陈瀚宁, 张丁一 申请人:中国科学院沈阳自动化研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1