一种基于手机信令数据的居住地双时段识别方法及应用与流程

文档序号:24406720发布日期:2021-03-26 17:29阅读:252来源:国知局
一种基于手机信令数据的居住地双时段识别方法及应用与流程

1.本发明涉及城市居住地研究领域,具体涉及一种基于手机信令数据的居住地双时段识别方法及应用。


背景技术:

2.居住地是居民连续居住而构成的固定空间范围,并将其作为生活、社交中心所在地的居所——时间上,居住时间具有长久性和规律性,长期呈现白天人少,晚上人多的特征;地点固定性,其是居民最频繁使用的空间,也是多个外出活动空间的重叠区域。因此,借鉴上述定义,本研究探讨的居住地是指居住用地的地理位置,将其作为日常生活的所在地的居所。
3.基于本研究所定义的居住地,目前采用手机数据的识别方法主要为:将每日23:00至次日5:00的完整时段作为识别居住地的时间点,若某一手机每个工作日至少有3个时间点在同一基站,就将该基站覆盖范围初步识别为该日该用户的居住地;若更进一步,10个工作日中至少有6天代表居住地的基站相同,就基本上可以将该基站识别为用户的居住地。可见,传统的识别思路主要依赖于用户夜间数据的连续性,即通过用户夜间一个周期内出现在同一基站的次数累加起来判断是否为居住地。
4.目前,上述识别方法最大的问题是:识别时间主要依赖单时段(夜间)用户的基站位置移动情况,而很可能将上夜班的实际就业地(如医院、24小时便利店等)误判为用户的居住地;而本次研发的新方法则在此基础上,做出了明显改进——双时段识别法,即同步采纳和分析手机用户的白天和夜间的大数据精准识别其居住地,以避免了传统方法的明显疏漏。


技术实现要素:

5.针对现有技术的不足,本发明提出了一种基于手机信令数据的居住地双时段识别方法及应用。
6.本发明的目的可以通过以下技术方案实现:
7.一种基于手机信令数据的居住地双时段识别方法及应用,其特征在于,包括以下步骤:
8.获得区域内的目标基站的手机信令数据和目标基站位置数据;
9.将一天时间分为两个时间段,将所述目标基站的手机信令数据根据两个所述时间段分为白天组和夜晚组,根据所述白天组和所述夜晚组获取人口移动率因子z;
10.根据所述目标基站的基站位置数据和区域内的所有社区数据,获取就业人口比例y;
11.根据z与(1

y)*k的大小进行判别:若满足z<(1

y)*k,所述目标基站的信号覆盖区域判定为居住地;式中k为修正系数。
12.进一步地,所述就业人口比例y的获得方式,包括以下步骤:
13.根据所述目标基站的手机信令数据在所述目标基站位置,按照泰森多边形法绘制所述目标基站的信号覆盖区;
14.根据区域内的社区数据在所在社区位置,绘制所有社区覆盖区,设定区域内的社区覆盖区为n个;
15.计算所述目标基站的信号覆盖区与区域内的所有社区覆盖区的重叠面积,依次记为s1,s2,...,s
n

16.根据区域内的社区数据,获取所有重叠面积所属社区的就业人口比例依次记为y1,y2,...,y
n

17.获取就业人口比例y,
18.进一步地,所述人口移动率因子z的获得方式,包括以下步骤:
19.将所述目标基站的手机信令数据根据时间分为白天组和夜晚组,白天组的时间段为早上5点到下午11点,夜晚组的时间段为晚上11点到次日早上5点;采用双时段识别法能够避免将所述目标基站中含有上夜班的实际就业地(如医院、24小时便利店等)误判为用户的居住地。
20.统计白天组中未离开所述目标基站的信号覆盖区人数n1、进入所述目标基站的信号覆盖区人数n2、离开所述目标基站的信号覆盖区人数n3;
21.统计夜晚组中未离开所述目标基站的信号覆盖区人数n
1'
、进入所述目标基站的信号覆盖区人数n
2'
、离开所述目标基站的信号覆盖区人数n
3'

22.获取人口移动率因子z,且n
1'
+n
2'

n
3'
≠0。
23.上述k为修正系数,一方面是为了减少白天时段内n1的影响,因为在白天时段部分人短时间外出返回后没被统计在内n1;另一方面,考虑目前手机用户覆盖率(<100%),所以通过手机数据统计的非就业人口比例明显小于城市实际非就业人口。
24.进一步地,获取所述目标基站的用地性质,所述目标基站的用地性质为e类或g类用地,直接判定所述目标基站不是居住地;e类用地为非建设用地,g类用地为绿地,e类或g类用地人口较少,在进行判断时,可以直接将归属地为e类或g类用地的基站直接判定为不是居住地。
25.进一步地,所有重叠面积所属社区的就业人口比例在计算前,筛除所有所述社区的退休人口数据。
26.进一步地,将所述目标基站的手机信令数据的所属日期为法定工作日的数据筛出,法定工作日中人的活动不规律,影响人口移动率因子z的获取。
27.进一步地,所述手机信令数据包括手机用户进入基站时间和手机用户离开基站时间;根据所述目标基站的手机用户进入所述目标基站时间和手机用户离开所述目标基站时间,对白天组中的n1、n1、n1和夜晚组中的n
1'
、n
2'
、n
3'
进行统计。
28.根据所述目标基站的手机用户进入所述目标基站时间和手机用户离开所述目标基站时间判断手机用户的起始位置和终点位置;
29.根据以下情况进行判断:
30.第一种情况:起始位置在目标基站,终点位置在目标基站内,且中间没有出过此基
站,那就定义为在a时间段内从未离开的人,计入n1;在b时段一直未离开过的人,计入n
1'

31.第二种情况:起始位置在目标基站,中间离开基站小于等于2小时,终点位置在基站,这是为了记录出去买菜、休闲或就医活动后返回原基站的居民,在a时段内短暂离开后返回原基站的人,计入n1;
32.第三种情况:起始位置不在目标基站内,终点位置不在目标基站内,不进行统计;
33.第四种情况:起始位置不在目标基站内,终点位置在目标基站内,就定义为在一个时间段内进入的人,计入n2,在另一时间段进入的人计入n
2'

34.第五种情况:起始位置在目标基站内,终点位置不在目标基站内,就定义为在一个时间段内离开的人,计入n3,在另一时间段离开过的人,计入n
3'

35.本发明的有益效果:
36.本发明提供一种采用运营商手机信令大数据,相对精确地辨识某个区域是否为居住地的方法。首先,以手机基站形成的泰森多边形作为识别单元,将同待识别区域发生空间关联的用户手机信令数据进行甄别和筛选;其次,将工作日划分白天和夜间两个时段,分别统计该区域在两个时段发生的人口数量变化;最后,计算待识别区域白天和夜间人口的变化比,并根据比值判定该区域是否为居住地。本发明能够便捷和准确地识别城市人口的居住地,为城市空间的利用提供有力的技术支撑。
附图说明
37.下面结合附图对本发明作进一步的说明。
38.图1为本申请的识别方法流程示意图;
39.图2为南京市鼓楼区中央门街道居住地识别的gis示意图;
40.图3为南京市鼓楼区中央门街道内基站生成泰森多边形的示意图;
41.图4为基站所属泰森多边形区域的就业人口比例计算过程的示意图。
具体实施方式
42.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
43.在本发明的描述中,需要理解的是,术语“开孔”、“上”、“下”、“厚度”、“顶”、“中”、“长度”、“内”、“四周”等指示方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的组件或元件必须具有特定的方位,以特定的方位构造和操作,因此不能理解为对本发明的限制。
44.在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
45.本发明以南京市鼓楼区中央门街道为例,图2为本发明方法应用于南京市鼓楼区
中央门街道居住地识别的gis示意图;图1的流程主要部分有手机信令数据的清洗及统计、基站生成的泰森多边形,泰森多边形和社区叠合区域的面积提取,根据图1的流程按照以下步骤进行判断:
46.步骤1:将南京市中央门街道内的所有手机基站按照泰森多边形法生成泰森多边形,每个泰森多边形代表一个基站的信号覆盖范围,中央门街道内手机基站生成的泰森多边形后共涉及到周边4个街道,继而也对应生成泰森多边形,如附图3所示;
47.步骤2:获取南京市2015年手机信令数据所有基站两个时段的人口变化值,具体步骤如下:
48.步骤2.1:将手机信令数据进行时间排序,并分成两段早上5点到下午11点(a时间段),晚上11点到次日早上5点(b时间段);
49.步骤2.2:提取中央门街道的一个手机基站数据,统计在a时间段该基站中未离开所属泰森多边形区域的人数n1、进入所属泰森多边形区域的人数n2、离开所属泰森多边形区域的人数n3;统计b时间段在该基站未中离开所属泰森多边形区域的人数n
1'
、进入所属泰森多边形区域的人数n
2'
、离开所属泰森多边形区域的人数n
3'

50.步骤3:统计该基站所属泰森多边形区域的就业人口比例;
51.步骤3.1:获取南京市中央门街道及周边各街道的就业人口比例(不包括退休人员),统计各个街道的就业比例,并在地理信息系统里面进行就业比例与街道边界进行空间关联;y1,y2,

,y
n
52.步骤3.2:运用地理信息系统将社区数据与所有基站建立空间关联,获取单个基站所属泰森多边形区域与社区区域的重叠区域,统计泰森多边形与社区重叠的个数,并提取各个重叠区域面积s1,s2,

,s
n
,然后统计各个重叠区域所属社区的就业人口比例y1,y2,

,y
n
,并作为重叠区域的就业比例,如图4所示,最后计算该基站所属泰森多边形的就业人口比例y,公式如下:
[0053][0054]
步骤4:计算人口移动因子z,公式为:且n
1'
+n
2'

n
3'
≠0;
[0055]
步骤5:系数k作为修正系数,一方面是为了减少a时段内n1的影响,因为在a时段部分人短时间外出返回后没被统计在内n1;另一方面,考虑目前手机用户覆盖率(<100%),所以通过手机数据统计的非就业人口比例明显小于城市实际非就业人口。
[0056]
综合考虑后0.7<k<1,再结合样本城市土地利用现状,对k值进行不断试错,并与样本城市的实际现状进行比对和校核,最终确定k值,比如南京市根据表1,对理论计算得出的用地类型是否和实际情况是否一致,从而确定南京市k=0.8。
[0057]
表1南京k值试错表
[0058][0059]
步骤6:根据上述获取的参数,对z与(1

y)*k的大小进行判别:
[0060]
满足当z<(1

y)*0.8时,该基站所属泰森多边形区域为居住地;
[0061]
当满足z≥(1

y)*0.8时,该泰森多边形区域被排除居住地之外。
[0062]
步骤7:遍历中央门街道的所有基站,对每个基站所属泰森多边形进行如上述步骤操作,直至所有基站都判断完毕。
[0063]
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1