基于移动信令数据的用户驻留地识别方法与流程

文档序号:16481697发布日期:2019-01-04 22:44阅读:1636来源:国知局
基于移动信令数据的用户驻留地识别方法与流程

本发明涉及一种基于移动信令数据的用户驻留地识别方法,用于从海量的手机信令数据中挖掘出用户的驻留地信息,可为城市交通规划和管理服务,属于计算机技术和交通规划与管理技术领域。



背景技术:

随着经济的快速增长和城市人口的激增,城市交通面临着非常大的压力。用户经常驻留的地方即用户驻留地信息作为城市居民日常出行的基本数据之一,可为城市交通的合理规划和管理提供决策定量分析。因此,如何以信息化的手段自动获取准确可靠的用户驻留地信息显得尤为迫切。

目前,随着无线通信技术的发展和移动网络的改善,手机拥有率和使用率都已达到了相当高的比例,移动信令数据的价值越来越受到人们的关注。尤其是其高样本量、覆盖范围广、低成本、实时性以及可以对移动用户连续追踪的特点是其它数据所不能同时具备的。因此,根据信令数据的特点和字段信息,可以将其作为识别用户驻留地的优选数据源。邢皖甲和熊磊提出了一种利用手机数据中的位置信息进行相似位置聚类的方法来确定用户的常驻点,裘炜毅、陆俊贤等提出了一种基于稀疏采样的手机定位数据的人员常驻地点的识别方法。此两种方法都只考虑了用户出现次数,而没有考虑到用户的日常规律、驻留时长等因素的影响。因此,正确识别用户驻留地是一个难题。

本发明先建立基站与地理位置的映射关系,再以手机信令数据为基础,采用聚类的方法构建用户轨迹序列,减少了数据的计算量,提高了计算效率;同时采用基于用户驻留权重比的识别机制识别用户的驻留地,提高了用户驻留地识别的准确性。



技术实现要素:

本发明的目的是提供一种识别用户驻留地的方法,以提高用户驻留地识别的准确性。

为了达到上述目的,本发明提供了一种基于移动信令数据的用户驻留地识别方法,其特征在于,步骤为:

步骤1、获取目标城市的地理位置信息,再以M米*M米的网格对目标城市进行网格化并对网格进行有序编号,计算网格信息并记录,网格信息包括网格编号和网格中心点的坐标;获取基站信息,根据基站信息中的坐标信息将基站匹配到网格上,提取网格所覆盖区域的地理位置名称,构建基站和地理位置的映射表。对于基站w而言,若基站位置坐标(x,y)和某网格中心点坐标(gx,gy)满足:gx-M/2≤x≤gx+M/2且gy-M/2≤y≤gy+M/2,则基站w与此网格做匹配关系。

步骤2、获取目标城市内所有手机用户在某个时间段内的手机信令数据,在该时间段内取t天作为分析天,提取分析天内对应的所有数据并进行清洗,去除重复和不完整的数据。然后将数据按用户分类并对每个用户的数据进行时间排序,得到每个用户每天的移动轨迹。

步骤3、对一个用户每日中在连续时间段内位于同一地理位置的移动轨迹点进行聚类,从而构建用户的时空轨迹序列并记录用户在这个地理位置的进出时间。进入时间Tin取在一个地理位置中首次出现的时间,离开时间Tout取在下一个地理位置中首次出现的时间。

步骤4、计算用户在一个地理位置内的驻留时长Ts,这里定义驻留时长为用户进出一个地理位置的时间之差,即Ts=Tout-Tin;将用户的驻留时长值Ts与所设置的驻留时长阈值θ1进行比较,若用户驻留时长值Ts大于等于驻留时长阈值θ1,则认为此地理位置是该用户的一个驻留点。

步骤5、确定用户的驻留点后,计算用户每个驻留点的驻留权值。定义每个驻留点的驻留权值N为在该驻留点内的驻留时长值Ts与所设置的驻留时长阈值θ1的比值,即N=Ts/θ1。

统计每个用户每天的各个驻留点的驻留权值和,其中,第i个用户在第r天中的第j驻留点共出现n次的驻留权值和Sijr=Njr1+Njr2+…+Njrn,式中参数Njrn表示用户的第j驻留点在第r天中出现第n次的驻留权值;然后统计第i个用户在分析天t中的第j驻留点的驻留权值和Sumij=Sij1+Sij2+…+Sijt

统计每个用户每天的所有驻留点的驻留权值和,其中,第i个用户在第r天中的共m个驻留点的驻留权值和Sir=Si1r+Si2r+…+Simr;然后统计第i个用户在分析天t中的所有驻留点的驻留权值和Sumi=Si1+Si2+...+Sit

统计每个用户在所有分析天中各个驻留点的驻留权值比,第i个用户在分析天t中的第j驻留点的驻留权重比值Zij=Sumij/Sumi。

步骤6、识别用户的驻留地,其中,第i个用户的驻留地识别的步骤为:将第i个用户的所有驻留点的驻留权重比值Zij进行递减排序并编号,再根据驻留地识别函数F(j)进行用户驻留地的识别。其中,若Zij≥θ2,则F(j)的值取1;若Zij≤θ2,则F(j)的值取0且停止比较,θ2为预先设置的经验阈值。最后,F(j)值为1对应的驻留点就是该用户的驻留地。

统计每个用户的驻留地个数,其中,第i个用户的驻留地个数Ci=F(1)+F(2)+...+F(j);若Ci=0,则表示无法判断用户i的驻留地;若Ci≥0,则表示用户i有Ci个驻留地。

最后得到用户的驻留地个数和驻留地的地理位置信息。

附图说明

图1为本发明的流程图;

具体实施方式

下面结合附图,对本发明的具体实施方式作进一步详细描述。

结合图1,本发明提供了一种基于移动信令数据的用户驻留地识别方法,其步骤为:

步骤1、获取目标城市的地理位置信息,再以M米*M米(M初始值可取500米)的网格对目标城市进行网格化并对网格进行有序编号,计算网格信息并记录,网格信息包括网格编号和网格中心点的坐标;获取基站信息,根据基站信息中的坐标信息将基站匹配到网格上,提取网格所覆盖区域的地理位置名称,构建基站和地理位置的映射表。对于基站w而言,若基站位置坐标(x,y)和某网格中心点坐标(gx,gy)满足:gx-M/2≤x≤gx+M/2且gy-M/2≤y≤gy+M/2,则基站w与此网格做匹配关系。

步骤2、获取目标城市内所有手机用户在某个时间段内的手机信令数据,在该时间段内取t天作为分析天,提取分析天内对应的所有数据并进行清洗,去除重复和不完整的数据。然后将数据按用户分类并对每个用户的数据进行时间排序,得到每个用户每天的移动轨迹。

步骤3、对一个用户每日中在连续时间段内位于同一地理位置的移动轨迹点进行聚类,从而构建用户的时空轨迹序列并记录用户在这个地理位置的进出时间。进入时间Tin取在一个地理位置中首次出现的时间,离开时间Tout取在下一个地理位置中首次出现的时间。

步骤4、计算用户在一个地理位置内的驻留时长Ts,这里定义驻留时长为用户进出一个地理位置的时间之差,即Ts=Tout-Tin;将用户的驻留时长值Ts与所设置的驻留时长阈值θ1(θ1初始值可取30分钟)进行比较,若用户驻留时长值Ts大于等于驻留时长阈值θ1,则认为此地理位置是该用户的一个驻留点。

步骤5、确定用户的驻留点后,计算用户每个驻留点的驻留权值。定义每个驻留点的驻留权值N为在该驻留点内的驻留时长值Ts与所设置的驻留时长阈值θ1的比值,即N=Ts/θ1。

统计每个用户每天的各个驻留点的驻留权值和,其中,第i个用户在第r天中的第j驻留点共出现n次的驻留权值和Sijr=Njr1+Njr2+…+Njrn,式中参数Njrn表示用户的第j驻留点在第r天中出现第n次的驻留权值;然后统计第i个用户在分析天t中的第j驻留点的驻留权值和Sumij=Sij1+Sij2+…+Sijt

统计每个用户每天的所有驻留点的驻留权值和,其中,第i个用户在第r天中的共m个驻留点的驻留权值和Sir=Si1r+Si2r+…+Simr;然后统计第i个用户在分析天t中的所有驻留点的驻留权值和Sumi=Si1+Si2+...+Sit

统计每个用户在所有分析天中各个驻留点的驻留权值比,第i个用户在分析天t中的第j驻留点的驻留权重比值Zij=Sumij/Sumi。

步骤6、识别用户的驻留地,其中,第i个用户的驻留地识别的步骤为:将第i个用户的所有驻留点的驻留权重比值Zij进行递减排序并编号,再根据驻留地识别函数F(j)进行用户驻留地的识别。其中,若Zij≥θ2,则F(j)的值取1;若Zij≤θ2,则F(j)的值取0且停止比较,θ2为预先设置的经验阈值,初始值取0.1。最后,F(j)值为1对应的驻留点就是该用户的驻留地。

统计每个用户的驻留地个数,其中,第i个用户的驻留地个数Ci=F(1)+F(2)+...+F(j);若Ci=0,则表示无法判断用户i的驻留地;若Ci≥0,则表示用户i有Ci个驻留地。最后得到用户的驻留地个数和驻留地的地理位置信息。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1