一种用户聚集热点区域识别方法及装置的制造方法

文档序号:9915088阅读:464来源:国知局
一种用户聚集热点区域识别方法及装置的制造方法
【技术领域】
[0001] 本发明涉及城市规划管理技术领域,尤其涉及一种用户聚集热点区域识别方法及 装置。
【背景技术】
[0002] 随着城市经济和社会的不断发展,城市公交规划和城建规划面临着很大的难题, 尤其在北京、上海、广州、深圳等人口逾1000万的"超大城市";而且人口流动复杂频繁,因 此,城市规划的相关部门需要根据用户的实际聚集区域及时、科学的规划相关的基础设施。
[0003] 目前,城市基础设施建设一般是基于城市居民的停留聚集特征来对应发展,而现 有技术中通常采用无线移动定位技术,例如GPS(Global Positioning System,全球定位系 统)来识别城市居民的停留聚集特征。GPS定位技术是通过综合多颗卫星的数据测量用户到 卫星的距离,再利用距离差得出用户的位置。发明人在实施本发明的过程中发现现有的技 术方案存在以下缺点:1、获取测量数据的成本高;2、开通GPS定位的用户数量相对较少,很 难全面反映整个城市的居民聚集热点区域;3、在密集城区,由于周围遮挡物、干扰源越多, 测量的精度会越低;4、无法接收到室内用户的GPS卫星信号。

【发明内容】

[0004] 针对现有技术存在的问题,本发明的目的在于提供一种用户聚集热点区域识别方 法及装置,能够实现实时、高精准地识别用户聚集热点区域,且分析数据获取方便,成本低 廉,满足了使用要求。
[0005] 本发明实施例提供一种用户聚集热点区域识别方法,包括如下步骤:
[0006] 基于获取到的待识别区域内的每一个用户在特定时间段内的手机信令数据,统计 每一所述用户所经过的基站及该用户在每一所述基站的移动特征;其中,所述移动特征包 括首次出现的时间、出现的次数、频率和累计间隔时间;
[0007] 计算每一所述用户对所述待识别区域内的每一个基站的兴趣度,及经过同一个基 站的任意两个用户的移动特征向量之间的空间距离;其中,所述兴趣度为对出现的次数、频 率及累计间隔时间分配不同权重后进行加权平均所得到的值;所述移动特征向量为由所述 移动特征所包含的各变量组成的有序数组;
[0008] 针对经过所述待识别区域内的每一个基站的每一个用户,统计出与该用户的移动 特征向量之间的空间距离最近的前K个用户,并提取所述K个用户的兴趣度最高的前N个基 站,将所述N个基站均作为候选热点基站;其中,K为正整数,N为正整数;
[0009] 将用户数达到一预设的阈值的每一所述候选热点基站作为一个热点基站,每一所 述热点基站所覆盖的一个区域为一个用户聚集热点区域;其中,所述预设的阈值大于K。
[0010] 作为上述方案的改进,当经过所述待识别区域内的某一个基站的用户的数量小于 K时,则确定该基站为非热点基站。
[0011] 作为上述方案的改进,所述手机信令数据包括用户手机ID;
[0012] 每一所述用户对应一个用户手机ID。
[0013] 作为上述方案的改进,假设所述出现的次数为a,频率为b,累计间隔时间为c,则所 述兴趣度z = a X qi+b X q2+c X q3;其中,qi+q2+q3 = 1,qi、q2、q3分别为a、b、c的权重。
[0014] 本发明实施例还提供一种用户聚集热点区域识别装置,包括:
[0015] 统计单元,用于基于获取到的待识别区域内的每一个用户在特定时间段内的手机 信令数据,统计每一所述用户所经过的基站及该用户在每一所述基站的移动特征;所述移 动特征包括首次出现的时间、出现的次数、频率和累计间隔时间;
[0016] 计算单元,用于计算每一所述用户对所述待识别区域内的每一个基站的兴趣度, 及经过同一个基站的任意两个用户的移动特征向量之间的空间距离;其中,所述兴趣度为 对出现的次数、频率及累计间隔时间分配不同权重后进行加权平均所得到的值;所述移动 特征向量为由所述移动特征所包含的各变量组成的有序数组;
[0017] 候选热点基站获取单元,用于针对经过所述待识别区域内的每一个基站的每一个 用户,统计出与该用户的移动特征向量之间的空间距离最近的前K个用户,并提取所述K个 用户的兴趣度最高的前N个基站,将所述N个基站均作为候选热点基站;其中,K为正整数,N 为正整数;
[0018] 用户聚集热点区域识别单元,用于将用户数达到一预设的阈值的每一所述候选热 点基站作为一个热点基站,每一所述热点基站所覆盖的一个区域为一个用户聚集热点区 域;其中,所述预设的阈值大于K。
[0019] 作为上述方案的改进,当经过所述待识别区域内的某一个基站的用户的数量小于 K时,则确定该基站为非热点基站。
[0020] 作为上述方案的改进,所述手机信令数据包括用户手机ID;
[0021] 每一所述用户对应一个用户手机ID。
[0022] 作为上述方案的改进,假设所述出现的次数为a,频率为b,累计间隔时间为c,则所 述兴趣度z = a X qi+b X q2+c X q3;其中,qi+q2+q3 = 1,qi、q2、q3分别为a、b、c的权重。
[0023] 本发明实施例提供的用户聚集热点区域识别方法及装置,具有如下有益效果:基 于通信运营商提供的手机信令数据,统计出待识别区域内的每一个用户在特定时间段内经 过的基站及该用户在每一所述基站的移动特征;然后,采用协同聚类的方法对经过所述待 识别区域内的每一个基站的每一个用户的最具有相似移动特征的前K个用户进行聚类;接 着,采用协同过滤的方法提取出所述K个用户的兴趣度最高的前N个基站,并将所述N个基站 均作为候选热点基站;最后,将用户数达到一预设的阈值的每一所述候选热点基站作为一 个热点基站,每一所述热点基站所覆盖的一个区域为一个用户聚集热点区域。本发明实施 例利用的源数据为通信运营商提供的手机信令数据,获取方式简单、获取成本低且信息样 本大;能够实时、高精准地识别出用户聚集热点区域,为城市公交规划和城建规划提供高质 量的数据分析结果。
【附图说明】
[0024] 图1是本发明提供的用户聚集热点区域识别方法的一个实施例的流程示意图。
[0025] 图2是本发明提供的用户聚集热点区域识别装置的一个实施例的流程示意图。
【具体实施方式】
[0026] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
[0027] 请参阅图1,是本发明提供的用户聚集热点区域识别方法的一个实施例的流程示 意图。
[0028] 本发明提供一种用户聚集热点区域识别方法,包括步骤S11~S14,具体如下:
[0029] S11,基于获取到的待识别区域内的每一个用户在特定时间段内的手机信令数据, 统计每一所述用户所经过的基站及该用户在每一所述基站的移动特征。
[0030] 其中,所述移动特征包括首次出现的时间、出现的次数、频率和累计间隔时间。
[0031] 所述手机信令数据是由通信运营商(比如移动通信运营商)提供、符合国家法律关 于个人隐私的源数据,具有获取方式简单、获取成本低、样本周期灵活、数量大等特点。它是 指在手机通信过程中,当发生通话、短信接发、正常位置更新等通信事件时,由手机通信运 营商记录的各类信令数据。
[0032] 优选的,所述手机信令数据包括用户手机ID;本发明认为每一所述用户对应一部 手机及一个用户手机ID。
[0033] 每一所述用户在移动的过程中,该用户的手机总是会定期或不定期地、主动或被 动地和其中一个基站保持联系。当每一所述用户的手机当前服务基站的信号强度减弱,邻 近基站的信号强度超过所述当前服务基站,则该用户的手机信号会切换到所述邻近基站, 以便获得更好的信号。在切换的过程中,通信运营商会保留相关切换记录。
[0034] 优选的,每一所述用户在每一所述基站的移动特征包括首次出现的时间、出现的 次数、频率和累计间隔时间;其中,所述首次出现的时间是指在所述特定时间段内,该用户 的手机信号首次切换到每一所述基站后第一条信令事件的发生时间;所述出现的次数是指 在所述特定时间段内,该用户的手机信号切换到每一所述基站的次数;所述频率是指在所 述特定时间段内,在该用户所经过的全部所述基站的累计次数中,经过每一所述基站的次 数所占的比例;所述累计间隔时间是指在所述特定时间段内,在该用户经过每一所述基站 的次数中,对相邻两次之间的间隔时间进行累计相加所得到的时间;其中,所述相邻两次之 间的间隔时间是指当前次在每一所述基站的最后一条信令事件的发生时间与下一次切换 到该基站的第一条信令事件的发生时间之间的间隔时间;所述特定时间段可以为一天、一 个小时、半个小时或任意的一个时间范围值,这些可根据实际的需要进行设置,本发明不做 具体的限制。
[0035] S12,计算每一所述用户对所述待识别区域内的每一个基站的兴趣度,及经过同一 个基站的任意两个用户的移动特征向量之间的空间距离。
[0036] 其中,所述兴趣度为对出现的次数、频率及累计间隔时间分配不同权重后进行加 权平均所得到的值;所述移动特征向量为由所述移动特征所包含的各变量组成的有序数 组。
[0037] 优选的,假设每一所述用户在所述待识别区域内的每一个基站出现的次数为a;在 该用户所经过的全部所述基站的累计次数中,经过所述待识别区域内的每一个基站的次数 所占的比例为b,以及在该用户经过所述待识别区域内的每一个基站的次数中,对相邻两次 之间的间隔时间进行累计相加所得到的时间为C,则该用户对所述待识别区域内的每一个 基站的兴趣度Z = a X qi+b X q2+c X q3;其中,qi+q2+q3 = 1,qi、q2、q3分别为a、b、c的权重。
[0038] 优选的,所述移动特征向量为由所述移动特征所包含的各变量组成的有序数组, 也就是说,所述移动特征向量为由所述首次出现时间、出现的次数、频率和累计间隔时间这 四个变量组成的有序数组。
[0039] 又假设每一所述用户的手机信号首次切换到所述待识别区域内的每一个基站后 第一条信令事件的发生时间为t,则经过同一个基站的任意两个用户的移动特征向量之间
[0040]
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1