一种基于手机数据的城市人群分布动态感知方法

文档序号:10691759阅读:292来源:国知局
一种基于手机数据的城市人群分布动态感知方法
【专利摘要】本发明公开了一种基于手机数据的城市人群分布动态感知方法,基于手机数据预测手机用户的家小区,采用线性回归得到表征人群密度与手机用户数关系的方程,标定回归方程中的待定参数值,得到表征区域人群密度与区域手机用户密度的相关关系,进而完成人群分布感知。本发明的技术效果在于,通过手机数据的人群分布动态感知方法,实施简单,成本低,更利于在其他数据信息相对匮乏的偏远地区展开;且手机数据时效性强,相较于传统的人群分布感知方法,基于手机数据的人群分布感知方法能够动态感知城市人群分布,这为城市管控、城市人群流动预测等相关方向的研究提供了基础。
【专利说明】
一种基于手机数据的城市人群分布动态感知方法
技术领域
[0001 ]本发明涉及一种基于手机数据的城市人群分布动态感知方法。
【背景技术】
[0002]城市人群分布动态感知,是城市重点区域管控、城市人群流动预测等相关方向的研究基础,对城市突发事件预警、城市交通管控、城市公共资源配置等方面都有着重大意义。传统的城市人群分布感知主要是人口普查方法,耗费大量的人力物力资源,调查周期长,人群分布感知的结果缺少时效性;现有的城市人群分布感知方法有依靠遥感卫星进行感知的方法、使用地理信息系统进行建模的方法等。相较于人口普查的方法,现有方法可以实现较大精度的城市人群分布感知,成本相对较低。然而,这些方法目前仍存在以下问题:
[0003]1、仍需投入较大的成本;
[0004]2、相关建模数据,尤其是偏远地区的相关数据仍然缺乏;
[0005]3、方法和模型较复杂,实施门槛高;
[0006]4、无法实现人群分布的动态感知。
[0007]综上所述,目前的人群分布感知方法仍然存在不足,多数人群分布测量方法技术较复杂,实施难度较高,数据获取较困难。世界许多地区的人群分布信息时效性差,更新较慢,甚至缺乏。无法提高实现城市人群分布感知的时间精细度,达到动态实时感知模式。

【发明内容】

[0008]本发明提出了一种基于手机数据的、融入手机市场占有率的城市人群分布动态感知方法,仅通过使用手机数据,便可动态感知城市人群分布,实施简单,成本低,时效性高,利于在其他数据信息相对匮乏的偏远地区展开。
[0009 ]为了实现上述技术目的,本发明的技术方案是,
[0010]—种基于手机数据的城市人群分布动态感知方法,包括以下步骤:
[0011]步骤一:基于手机数据预测手机用户的家小区,所述的家小区指在预设时间区间内手机用户信令记录数出现最多的小区;
[0012]步骤二:根据家小区情况提取手机信令数据记录和家小区面积,得到预设时间区间内家小区中手机用户密度;
[0013]步骤三:根据家小区的人口普查数据和手机用户数量,得到家小区的手机市场占有率;
[0014]步骤四:根据家小区中手机用户密度和家小区的手机市场占有率,采用线性回归得到表征人群密度与手机用户数关系的方程,标定回归方程中的待定参数值,得到表征区域人群密度与区域手机用户密度的相关关系;
[0015]步骤五:根据手机数据信令信息,得到预设时间区间内家小区手机用户数,根据回归方程计算出家小区预设时间区间内人群密度,进而完成预设时间区间内人群分布感知。
[0016]所述的方法,所述的步骤一中,在基于手机数据预测手机用户的家小区前,首先处理手机数据:仅选取在用于确定家小区的时间区间中至少有一条信令信息的手机用户数据。
[0017]所述的方法,所述的步骤二中,所述的手机用户密度为1/A。,其中N。指家小区c的夜间手机用户数,A。为家小区c的面积。
[0018]所述的方法,所述的步骤三中,根据1/AC= RC/UC计算家小区c的手机市场占有率I/λ。,其中R。表示家小区c的人口普查数据,U。表示所侦测到的以家小区c为家小区的手机用户数量。
[0019]所述的方法,所述的步骤四中,表征人群密度与手机用户数关系的回归方程为P。= α(Οβ,其中σ。为家小区c预设时间内手机用户密度,P。表示家小区c的预设时间人口密度,σ。通过AcXNc/A。得到,将回归方程改写为logbcOzloghhPlogl^cXNcyA。),采用线性回归模型Υ = βο+βιΧ+ε,ε?σ2来确定参数βο和参数0!的值,0Q = log(a),βι = β,数据集(Xi,yi)(i = l,2,...,n)中,Xi = log(AcXNi/Ai),yi = log(Pi),最后根据参数a和β与参数之间的关系得到参数a和β的值。
[0020]所述的方法,所述的预设时间区间为晚间时间窗,即晚上20:00至次日早晨7:00。[0021 ]本发明的技术效果在于,通过手机数据的人群分布动态感知方法,实施简单,成本低,更利于在其他数据信息相对匮乏的偏远地区展开;且手机数据时效性强,相较于传统的人群分布感知方法,基于手机数据的人群分布感知方法能够动态感知城市人群分布,这为城市管控、城市人群流动预测等相关方向的研究提供了基础。
【附图说明】
[0022]图1为本发明的流程示意图;
[0023]图2(a)为未融入手机市场占有率因素的夜间人群密度与手机用户密度的关系,(b)为融入手机市场占有率因素的夜间人群密度与手机用户密度的关系;
[0024]图3(a)为湾区人口普查结果,(b)为湾区夜间人群分布感知结果;
[0025]图4为湾区白天与夜间的人口相对差分布图。
【具体实施方式】
[0026]下面结合附图和具体实施例对本发明作进一步详细描述,但不作为对本发明的限定。
[0027]本实施例使用美国旧金山湾区2010年中连续的21天、429,595个手机用户、平均每天约有I,200,000条的手机信令数据,用以介绍本发明的【具体实施方式】。参见图1,【具体实施方式】包括以下步骤:
[0028]步骤一:基于手机数据预测手机用户的家小区。处理手机数据,清洗掉不满足条件的手机用户,预测手机用户的家小区,所述的家小区指在晚间时间窗(20:00-7:00)手机用户信令记录数出现最多的小区。因此,在湾区,被选取的手机用户在所有21天的20:00到第二天7:00时间段中需至少有一条信令信息,用于确定其家小区。我们从中选取了 360,612个手机用户的信令信息来进行人群分布感知的具体实施;
[0029]步骤二:标定参数值。采用线性回归的方法,标定回归方程中的待定参数值,得到表征区域人群密度与区域手机用户密度的相关关系;
[0030]相关研究表明,人群密度与人群活跃程度存在超线性关系。最新研究中,常使用非线性方程P。= ^^)^表征人群密度与手机用户活跃度的关系。其中,O。表示C小区夜间手机用户密度,P。表示c小区的夜间人□密度。研究表明,非线性方程Κ = α(σ。)^着很好的拟合效果。本发明融入了手机市场占有率因素,对原有方法进行了改进,图,2a展示了未考虑手机市场占有率因素时夜间人群密度与手机用户密度的关系,图2b展示了考虑手机市场占有率的情况下夜间人群密度与手机用户密度的关系,可见,考虑手机市场占有率因素在本研究中是必要的。具体步骤如下:
[0031]步骤1:根据步骤一所述的家小区定义,利用手机数据包含的时间信息与位置信息提取手机用户在家小区的通讯记录;
[0032]步骤2:通过上述手机信令数据记录和各小区面积,计算出夜间手机用户密度N。/A。,其中,N。指c小区夜间手机用户数,A。为c小区的面积;
[0033]步骤3:计算不同小区的手机市场占有率。使用公式l/λ。=!?。/!]。计算小区c的手机市场占有率,其中,R。表示c小区的人口普查数据,U。表示所侦测到的以c小区为家小区的手机用户数量。本发明提出的表征人群密度与手机用户活跃度的关系式即为Ρα = α(?ΧΝ。/AcOe,其中λ。为手机市场占有率l/λ。的倒数,表示的是以c小区为家小区的手机用户其扩样系数值。
[0034]步骤4:标定回归方程中的α值和β值。步骤3中的回归方程的回归参数是非线性的。但将步骤3中的回归方程改写为1g(Pc) = 1g(Cx)-Plog(AcXNcyAc)的形式,便可将非线性回归方程转变为线性回归方程,进而求解回归参数。采用线性回归模型Υζβο+βχΧ+ε,ε?σ2来确定参数βο和参数βι的值,0Q = log(a) J1 = P,数据集(Xi,yi)(i = l,2,...,n,n = 892)中,乂1 = 1(^(人。\化/^),71 = 1(^(00;参数枷和参数01均服从正态分布,回归模型的回归度越高,βο的均值越接近于Oj1的均值越接近I。这里我们使用最常用到的最小二乘法来解决此线性回归问题。结果显示,βο = 0.585,其置信度为95%的置信区间为(0.563,0.601),? =
0.929,其置信度为95 %的置信区间为(0.922,0.936),回归模型相关系数R2 = 0.98,均方根误差rmse = 0.1,说明变量X与变量Y有着高度相关性。根据参数a和β与参数βο和0!之间的关系,我们可以计算出,0 = 3.848,0 = 0.929;
[0035]步骤三:感知区域夜间人群分布。根据手机数据信令信息,我们可以得到任一小区夜间手机用户数N,由步骤二步骤4中表征人群密度与手机用户数关系方程,我们便可以计算出任一小区夜间人群密度,进而完成湾区夜间人群分布感知;
[0036]如图3所示。图3a展示了根据湾区人口普查数据绘制的湾区人群密度分布图,用以表征湾区夜间人群分布。用作基础数据。图3b为基于手机数据的湾区夜间人群密度分布感知结果,可以看出,基于本文提出的城市人群分布感知方法所得到的湾区夜间人群密度感知结果和人口普查结果一致性很高。
[0037]步骤四:城市人群分布动态感知。手机数据数量大,获取速度快,采集途径简单,具有即时性,高效性等优点。这些特征为动态感知城市人群分布提供了可能。当手机信令被记录时,其触发时间戳亦被记录下来,这是时序动态研究的基础。不同于传统的人口普查方式等所获取的人群分布数据,基于包含时间戳的手机数据,我们可以研究白天和夜间,周末与周中,夏季与秋季等不同时间段城市人群分布的差异,动态地了解和认识城市人群分布和流动规律。
[0038]由于所研究数据限制(时间戳未记录日期),本实施方案介绍仅探究白天与夜间湾区人群密度分布的相对差,以展示基于手机数据的城市人群分布感知方法在动态感知上的可行性。
[0039]我们将21天的手机信令数据划分为白天部分(7:00—20:00)和夜间部分(20:00—7:00),以此展开白天与夜间湾区动态人群分布研究。步骤二步骤4中的公式作为两个时段的人群密度计算式,0和0均采用上文中的线性回归最优拟合值(即,α = 3.848,β = 0.929)。
[0040]我们计算了白天与夜间湾区人群分布密度相对差。如图4所示。可以看出明显的空间分布特征差异,白天人群密度较大的小区基本沿高速路分布,和前人研究结果相一致。研究时间变化对城市人群空间分布的影响,对城市人群聚集区域管控、交通规划等具有重要意义。
【主权项】
1.一种基于手机数据的城市人群分布动态感知方法,其特征在于,包括以下步骤: 步骤一:基于手机数据预测手机用户的家小区,所述的家小区指在预设时间区间内手机用户信令记录数出现最多的小区; 步骤二:根据家小区情况提取手机信令数据记录和家小区面积,得到预设时间区间内豕小区中手机用户當度; 步骤三:根据家小区的人口普查数据和手机用户数量,得到家小区的手机市场占有率;步骤四:根据家小区中手机用户密度和家小区的手机市场占有率,采用线性回归得到表征人群密度与手机用户数关系的方程,标定回归方程中的待定参数值,得到表征区域人群密度与区域手机用户密度的相关关系; 步骤五:根据手机数据信令信息,得到预设时间区间内家小区手机用户数,根据回归方程计算出家小区预设时间区间内人群密度,进而完成预设时间区间内人群分布感知。2.根据权利要求1所述的方法,其特征在于,所述的步骤一中,在基于手机数据预测手机用户的家小区前,首先处理手机数据:仅选取在用于确定家小区的时间区间中至少有一条信令信息的手机用户数据。3.根据权利要求1所述的方法,其特征在于,所述的步骤二中,所述的手机用户密度为K/A。,其中N。指家小区c的夜间手机用户数,A。为家小区c的面积。4.根据权利要求3所述的方法,其特征在于,所述的步骤三中,根据1/%= R。/!]。计算家小区c的手机市场占有率l/λ。,其中R。表示家小区c的人口普查数据,U。表示所侦测到的以家小区c为家小区的手机用户数量。5.根据权利要求4所述的方法,其特征在于,所述的步骤四中,表征人群密度与手机用户数关系的回归方程为Pc^c^c/,其中O。为家小区c预设时间内手机用户密度,P。表示家小区C的预设时间人口密度,O。通过AcXNc/A。得到,将回归方程改写为log(p。)= log(a)+01og(入。\化/^),采用线性回归模型¥ =枷+|^+6,£?02来确定参数0()和参数01的值氺()=1呢(α),βι = β,数据集(xi,yi)(i = l,2,...,n)中,Xi = log(>cXNi/Ai),yi = 1g(Pi),最后根据参数a和β与参数βο和βι之间的关系得到参数a和β的值。6.根据权利要求1-5任一所述的方法,其特征在于,所述的预设时间区间为晚间时间窗,即晚上20:00至次日早晨7:00。
【文档编号】H04W4/02GK106060776SQ201610373565
【公开日】2016年10月26日
【申请日】2016年5月31日
【发明人】王璞, 徐仲之, 曲迎春
【申请人】中南大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1