基于移动信令数据的用户驻留地识别方法与流程

文档序号：16481697发布日期：2019-01-04 22:44阅读：1636来源：国知局

本发明涉及一种基于移动信令数据的用户驻留地识别方法，用于从海量的手机信令数据中挖掘出用户的驻留地信息，可为城市交通规划和管理服务，属于计算机技术和交通规划与管理技术领域。

背景技术：

随着经济的快速增长和城市人口的激增，城市交通面临着非常大的压力。用户经常驻留的地方即用户驻留地信息作为城市居民日常出行的基本数据之一，可为城市交通的合理规划和管理提供决策定量分析。因此，如何以信息化的手段自动获取准确可靠的用户驻留地信息显得尤为迫切。

目前，随着无线通信技术的发展和移动网络的改善，手机拥有率和使用率都已达到了相当高的比例，移动信令数据的价值越来越受到人们的关注。尤其是其高样本量、覆盖范围广、低成本、实时性以及可以对移动用户连续追踪的特点是其它数据所不能同时具备的。因此，根据信令数据的特点和字段信息，可以将其作为识别用户驻留地的优选数据源。邢皖甲和熊磊提出了一种利用手机数据中的位置信息进行相似位置聚类的方法来确定用户的常驻点，裘炜毅、陆俊贤等提出了一种基于稀疏采样的手机定位数据的人员常驻地点的识别方法。此两种方法都只考虑了用户出现次数，而没有考虑到用户的日常规律、驻留时长等因素的影响。因此，正确识别用户驻留地是一个难题。

本发明先建立基站与地理位置的映射关系，再以手机信令数据为基础，采用聚类的方法构建用户轨迹序列，减少了数据的计算量，提高了计算效率；同时采用基于用户驻留权重比的识别机制识别用户的驻留地，提高了用户驻留地识别的准确性。

技术实现要素：

本发明的目的是提供一种识别用户驻留地的方法，以提高用户驻留地识别的准确性。

为了达到上述目的，本发明提供了一种基于移动信令数据的用户驻留地识别方法，其特征在于，步骤为：

步骤1、获取目标城市的地理位置信息，再以M米*M米的网格对目标城市进行网格化并对网格进行有序编号，计算网格信息并记录，网格信息包括网格编号和网格中心点的坐标；获取基站信息，根据基站信息中的坐标信息将基站匹配到网格上，提取网格所覆盖区域的地理位置名称，构建基站和地理位置的映射表。对于基站w而言，若基站位置坐标(x,y)和某网格中心点坐标(gx,gy)满足：gx-M/2≤x≤gx+M/2且gy-M/2≤y≤gy+M/2，则基站w与此网格做匹配关系。

步骤2、获取目标城市内所有手机用户在某个时间段内的手机信令数据，在该时间段内取t天作为分析天，提取分析天内对应的所有数据并进行清洗，去除重复和不完整的数据。然后将数据按用户分类并对每个用户的数据进行时间排序，得到每个用户每天的移动轨迹。

步骤3、对一个用户每日中在连续时间段内位于同一地理位置的移动轨迹点进行聚类，从而构建用户的时空轨迹序列并记录用户在这个地理位置的进出时间。进入时间Tin取在一个地理位置中首次出现的时间，离开时间Tout取在下一个地理位置中首次出现的时间。

步骤4、计算用户在一个地理位置内的驻留时长Ts，这里定义驻留时长为用户进出一个地理位置的时间之差，即Ts＝Tout-Tin；将用户的驻留时长值Ts与所设置的驻留时长阈值θ1进行比较，若用户驻留时长值Ts大于等于驻留时长阈值θ1，则认为此地理位置是该用户的一个驻留点。

步骤5、确定用户的驻留点后，计算用户每个驻留点的驻留权值。定义每个驻留点的驻留权值N为在该驻留点内的驻留时长值Ts与所设置的驻留时长阈值θ1的比值，即N＝Ts/θ1。

统计每个用户每天的各个驻留点的驻留权值和，其中，第i个用户在第r天中的第j驻留点共出现n次的驻留权值和Si^jr＝Nj^r1+Nj^r2+…+Nj^rn，式中参数Nj^rn表示用户的第j驻留点在第r天中出现第n次的驻留权值；然后统计第i个用户在分析天t中的第j驻留点的驻留权值和Sumi^j＝Si^j1+Si^j2+…+Si^jt。

统计每个用户每天的所有驻留点的驻留权值和，其中，第i个用户在第r天中的共m个驻留点的驻留权值和Si^r＝Si^1r+Si^2r+…+Si^mr；然后统计第i个用户在分析天t中的所有驻留点的驻留权值和Sumi＝Si¹+Si²+...+Si^t。

统计每个用户在所有分析天中各个驻留点的驻留权值比，第i个用户在分析天t中的第j驻留点的驻留权重比值Zi^j＝Sumi^j/Sumi。

步骤6、识别用户的驻留地，其中，第i个用户的驻留地识别的步骤为：将第i个用户的所有驻留点的驻留权重比值Zi^j进行递减排序并编号，再根据驻留地识别函数F(j)进行用户驻留地的识别。其中，若Zi^j≥θ2，则F(j)的值取1；若Zi^j≤θ2，则F(j)的值取0且停止比较，θ2为预先设置的经验阈值。最后，F(j)值为1对应的驻留点就是该用户的驻留地。

统计每个用户的驻留地个数，其中，第i个用户的驻留地个数Ci＝F(1)+F(2)+...+F(j)；若Ci＝0，则表示无法判断用户i的驻留地；若Ci≥0，则表示用户i有Ci个驻留地。

最后得到用户的驻留地个数和驻留地的地理位置信息。

附图说明

图1为本发明的流程图；

具体实施方式

下面结合附图，对本发明的具体实施方式作进一步详细描述。

结合图1，本发明提供了一种基于移动信令数据的用户驻留地识别方法，其步骤为：

步骤1、获取目标城市的地理位置信息，再以M米*M米(M初始值可取500米)的网格对目标城市进行网格化并对网格进行有序编号，计算网格信息并记录，网格信息包括网格编号和网格中心点的坐标；获取基站信息，根据基站信息中的坐标信息将基站匹配到网格上，提取网格所覆盖区域的地理位置名称，构建基站和地理位置的映射表。对于基站w而言，若基站位置坐标(x,y)和某网格中心点坐标(gx,gy)满足：gx-M/2≤x≤gx+M/2且gy-M/2≤y≤gy+M/2，则基站w与此网格做匹配关系。

步骤4、计算用户在一个地理位置内的驻留时长Ts，这里定义驻留时长为用户进出一个地理位置的时间之差，即Ts＝Tout-Tin；将用户的驻留时长值Ts与所设置的驻留时长阈值θ1(θ1初始值可取30分钟)进行比较，若用户驻留时长值Ts大于等于驻留时长阈值θ1，则认为此地理位置是该用户的一个驻留点。

统计每个用户在所有分析天中各个驻留点的驻留权值比，第i个用户在分析天t中的第j驻留点的驻留权重比值Zi^j＝Sumi^j/Sumi。

步骤6、识别用户的驻留地，其中，第i个用户的驻留地识别的步骤为：将第i个用户的所有驻留点的驻留权重比值Zi^j进行递减排序并编号，再根据驻留地识别函数F(j)进行用户驻留地的识别。其中，若Zi^j≥θ2，则F(j)的值取1；若Zi^j≤θ2，则F(j)的值取0且停止比较，θ2为预先设置的经验阈值，初始值取0.1。最后，F(j)值为1对应的驻留点就是该用户的驻留地。

统计每个用户的驻留地个数，其中，第i个用户的驻留地个数Ci＝F(1)+F(2)+...+F(j)；若Ci＝0，则表示无法判断用户i的驻留地；若Ci≥0，则表示用户i有Ci个驻留地。最后得到用户的驻留地个数和驻留地的地理位置信息。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：彭大芹;谷勇;易燕;徐正;刘艳林;
技术所有人：重庆邮电大学;
我是此专利的发明人

上一篇：一种方便携带的园林剪枝装置的制作方法
上一篇：一种新型燃气辐射管加热烧嘴控制装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。