基于手机信令的人口居住地迁徙识别方法与流程

文档序号:19060773发布日期:2019-11-06 01:45阅读:1037来源:国知局
基于手机信令的人口居住地迁徙识别方法与流程

本发明涉及一种基于手机信令的人口居住地迁徙识别方法。



背景技术:

人口迁移一般指的是人口在两个地区之间的空间移动,这种移动通常涉及人口居住地由迁出地到迁入地的永久性或长期性的改变。人口迁徙研究是城市规划十分重要的基础性工作,无论是改革前的城市总体规划还是改革后的国土空间总体规划,城市用地、公共设施等指标都是根据人口活动规律制定的。人口迁徙的规模在一定程度上反映了一个城市的地位,迁徙的方向反映城市的辐射范围与城市发展的腹地,区域间的社会文化背景等。

目前掌握城市人口迁徙规律主要通过问卷调查和普查数据两种方式展开。这两种方式都是通过人工手段设置调查问卷,根据一定的抽样比例随机的选择目标群体开展调查。根据汇总结果进行扩样计算,最终得到城市人口迁徙规律。



技术实现要素:

本发明的目的是提供一种基于手机信令的人口居住地迁徙识别方法,以解决现有目前问卷调查等人工手段需要耗费巨大的人力和财力成本,很难实现大样本、大范围的调查的问题。

为解决上述技术问题,本发明提供一种基于手机信令的人口居住地迁徙识别方法,包括以下步骤:

s1:根据手机信令数据获取用户停留点信息,并将所述停留点信息按照用户唯一标识进行分组作为用户活动空间识别的数据源;

s2:对所述数据源做领域分析,构建包括用户停留点pj以及所有停留点pj的邻域集合{pi}的停留点关系模型;

s3:利用时空聚类算法根据所述停留点关系模型计算用户活动进行聚类分组;

s4:根据聚类分组结果建立用户活动的活动规律指标,根据所述活动规律指标对用户的居住地hi(x,y)进行标记;

s5:将所有用户每月的居住地hi(x,y)存储到居住地集合{h},利用时空聚类算法将所述用户的居住地集合{h}按照时序进行聚类分组;

s6:根据所述聚类分组结果建立时序空间数据聚类模型,并根据所述时序空间数据聚类模型识别居住地发生迁徙的人群。

进一步地,所述用户停留点pj包括用户编号、停留点编号、停留点位置、停留点起止时间。

进一步地,步骤s3具体包括以下步骤:

s31:遍历留点关系模型中的停留点pj和邻域集合{pi},使邻域集合{pi}按照其包含的停留点pj个数的降序进行排列,并将邻域集按照排列顺序依次标记为活动点aj,同时将活动点aj位置标记为停留点pj位置,并记录停留点pj的邻域集合{pi};

s32:清除停留点关系模型中的包含停留点个数最多的邻域集合{pi}中的所有停留点pj;

s33:重复步骤s31和s32,直至遍历完当前用户的所有核心对象,得到{aj}组合即为活动点分组。

进一步地,根据聚类分组结果建立用户活动的活动规律指标所采用的方法具体包括:

遍历每位用户当月的所有的活动点aj,计算每个活动点分组{aj}中邻域集合{pi}与全月每天的白天时段、夜间时段和全日时段的交集时长作为活动点aj在当日的白天停留时长、夜间停留时长和全日停留时长;若停留时长大于等于预设阈值,则对应的时段累加天数计数加1。

进一步地,根据所述活动规律指标对用户的活动规律进行标记所采用的具体方法包括:

若用户的某一活动点较该用户当月其它所有活动点全日停留时长最大且夜间停留时长最大,同时全日停留时长大于等于当月实际天数的60%,则标记该活动点为居住地hi(x,y)。

进一步地,所述步骤s5具体包括:

s51:将所有用户每月的居住地hi(x,y)存储到居住地集合{h},依次遍历所有用户的居住地集合{h},同一用户按照时间先后顺序遍历,依次加入待合并组;

s52:当出现新插入位置hj时,使新插入位置hj与待合并居住地集合{h}中的所有空间位置做相似性计算,相似度计算公式具体为:

sim(h,hj)=1/(1+d(h,hj));

s53:判断sim(h,hj)是否小于0.5;若是,则停止合并,并将待合并居住地集合{h}标识为一组具有高相似度的居住地集合{hi},并清空待合并组;若否,则将新插入位置hj加入居住地集合{hi};

s54:重复步骤s52和s53,直至识别完成所有新插入位置hj。

进一步地,所述步骤s6具体包括:

根据分析需求动态确定迁徙研究目标时长tl,根据迁徙研究目标时长tl筛选出这个时期中每个用户的居住地集合{hi},若居住地集合{hi}的次数大于1则标记该用户发生迁移。

本发明的有益效果为:本申请通过利用手机信令数据作为基础对用户的居住地的迁徙进行识别,具有用户基数大、覆盖人群广、数据动态连续等特点;并且,通过连续跟踪监测用户多月居住地位置,将用户每月的居住空间位置转换成一组具有时序特征的空间位置,然后通过建立时序空间数据聚类模型,自动识别居住地发生迁徙的人群,记录迁徙发生的时间、迁入/迁出位置等信息,实现动态掌握人口居住地迁徙规律。该识别方法让人口居住地的迁徙不受统计时间的约束,时效性强,可连续观测,便于研究变化趋势,可以研究一年内居住地发生迁徙的人口,也可以研究三年内发生变化的人口;另外,打破行政边界研究可以指定任意空间单元,最小可以监测任意一个手机基站附近人口居住地的变化,提高人口迁徙识别的效率和准确度。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,在这些附图中使用相同的参考标号来表示相同或相似的部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1为本发明一个实施例的流程图。

具体实施方式

一种基于手机信令的人口居住地迁徙识别方法,该方法具体包括以下步骤:

s1:根据手机信令数据获取用户停留点信息,并将所述停留点信息按照用户唯一标识进行分组作为用户活动空间识别的数据源;其中,所述用户停留点pj包括用户编号、停留点编号、停留点位置、停留点起止时间。

s2:对所述数据源做领域分析,构建包括用户停留点pj以及所有停留点pj的邻域集合{pi}的停留点关系模型;

s3:利用时空聚类算法根据所述停留点关系模型计算用户活动进行聚类分组;

s4:根据聚类分组结果建立用户活动的活动规律指标,根据所述活动规律指标对用户的居住地hi(x,y)进行标记;

s5:将所有用户每月的居住地hi(x,y)存储到居住地集合{h},利用时空聚类算法将所述用户的居住地集合{h}按照时序进行聚类分组;

s6:根据所述聚类分组结果建立时序空间数据聚类模型,并根据所述时序空间数据聚类模型识别居住地发生迁徙的人群。

根据本申请的一个实施例,上述步骤s3具体包括以下步骤:

s31:遍历留点关系模型中的停留点pj和邻域集合{pi},使邻域集合{pi}按照其包含的停留点pj个数的降序进行排列,并将邻域集按照排列顺序依次标记为活动点aj,同时将活动点aj位置标记为停留点pj位置,并记录停留点pj的邻域集合{pi};

s32:清除停留点关系模型中的包含停留点个数最多的邻域集合{pi}中的所有停留点pj;

s33:重复步骤s31和s32,直至遍历完当前用户的所有核心对象,得到{aj}组合即为活动点分组。

根据本申请的一个实施例,根据聚类分组结果建立用户活动的活动规律指标所采用的方法具体包括:

遍历每位用户当月的所有的活动点aj,计算每个活动点分组{aj}中邻域集合{pi}与全月每天的白天时段、夜间时段和全日时段的交集时长作为活动点aj在当日的白天停留时长(09:00-17:00)、夜间停留时长(20:00–06:00)和全日停留时长;若停留时长大于等于预设预置阈值则对应的时段累加天数计数加1。

根据本申请的一个实施例,根据所述活动规律指标对用户的活动规律进行标记所采用的具体方法包括:

若用户的某一活动点较该用户当月其它所有活动点全日停留时长最大且夜间停留时长最大,同时全日停留时长大于等于当月实际天数的60%,则标记该活动点为居住地hi(x,y)。

根据本申请的一个实施例,所述步骤s5具体包括:

s51:将所有用户每月的居住地hi(x,y)存储到居住地集合{h},依次遍历所有用户的居住地集合{h},同一用户按照时间先后顺序遍历,依次加入待合并组;

s52:当出现新插入位置hj时,使新插入位置hj与待合并居住地集合{h}中的所有空间位置做相似性计算,相似度计算公式具体为:

sim(h,hj)=1/(1+d(h,hj));

s53:判断sim(h,hj)是否小于0.5;若是,则停止合并,并将待合并居住地集合{h}标识为一组具有高相似度的居住地集合{hi},并清空待合并组;若否,则将新插入位置hj加入居住地集合{hi};

s54:重复步骤s52和s53,直至识别完成所有新插入位置hj。

根据本申请的一个实施例,所述步骤s6具体包括:

根据分析需求动态确定迁徙研究目标时长tl,根据迁徙研究目标时长tl筛选出这个时期中每个用户的居住地集合{hi},若居住地集合{hi}的次数大于1则标记该用户发生迁移。其中,早期的居住地集合位置为迁出位置,后期的居住地集合位置为迁入位置,发生集合变化的时间为迁徙具体的发生时间。

本申请通过利用手机信令数据作为基础对用户的居住地的迁徙进行识别,具有用户基数大、覆盖人群广、数据动态连续等特点;并且,通过连续跟踪监测用户多月居住地位置,将用户每月的居住空间位置转换成一组具有时序特征的空间位置,然后通过建立时序空间数据聚类模型,自动识别居住地发生迁徙的人群,记录迁徙发生的时间、迁入/迁出位置等信息,实现动态掌握人口居住地迁徙规律。该识别方法让人口居住地的迁徙不受统计时间的约束,时效性强,可连续观测,便于研究变化趋势,可以研究一年内居住地发生迁徙的人口,也可以研究三年内发生变化的人口;另外,打破行政边界研究可以指定任意空间单元,最小可以监测任意一个手机基站附近人口居住地的变化,提高人口迁徙识别的效率和准确度。

最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1