一种用户聚集热点区域识别方法及装置的制造方法_2

文档序号:9915088阅读:来源:国知局
需要说明的是,所述首次出现时间、出现的次数、频率和累计间隔时间这四个变量 可以任意排序形成所述移动特征向量,只要全部所述用户在所述待识别区域内的全部基站 的移动特征向量的各变量的排列顺序保证一致即可。
[0041] S13,针对经过所述待识别区域内的每一个基站的每一个用户,统计出与该用户的 移动特征向量之间的空间距离最近的前K个用户,并提取所述K个用户的兴趣度最高的前N 个基站,将所述N个基站均作为候选热点基站。
[0042] 其中,K为正整数,N为正整数。
[0043] 优选的,经过所述待识别区域内的每一个基站的任意两个用户的移动特征向量之 间的空间距离越近,则这两个用户的移动特征越相似。因此,采用协同聚类的方法对经过所 述待识别区域内的每一个基站的每一个用户的最具有相似移动特征的前K个用户进行聚 类;然后,采用协同过滤的方法提取出所述K个用户的兴趣度最高的前N个基站,并将所述N 个基站均作为候选热点基站;其中,K、N均为正整数,其取值是根据所述待识别区域的地理 分布位置、所述特定时间段的取值范围等因素进行相应设置,本发明不做具体限制。
[0044] 优选的,当经过所述待识别区域内的某一个基站的用户的数量小于K时,则确定该 基站为非热点基站,从而剔除了那些只有少量或单个用户经过的基站,减少了计算数据。
[0045] S14,将用户数达到一预设的阈值的每一所述候选热点基站作为一个热点基站,每 一所述热点基站所覆盖的一个区域为一个用户聚集热点区域。
[0046] 其中,所述预设的阈值大于K。
[0047]需要说明的是,所述预设的阈值同样是根据所述待识别区域的地理分布位置、所 述特定时间段的取值范围等因素进行相应设置,本发明不做具体限制。
[0048]在具体实施当中,优选的,上述用户聚集热点区域识别方法可由用户聚集热点区 域识别装置来执行。基于通信运营商提供的手机信令数据,统计出待识别区域内的每一个 用户在特定时间段内经过的基站及该用户在每一所述基站的移动特征;然后,采用协同聚 类的方法对经过所述待识别区域内的每一个基站的每一个用户的最具有相似移动特征的 前K个用户进行聚类;接着,采用协同过滤的方法提取出所述K个用户的兴趣度最高的前N个 基站,并将所述N个基站均作为候选热点基站;最后,将用户数达到一预设的阈值的每一所 述候选热点基站作为一个热点基站,每一所述热点基站所覆盖的一个区域为一个用户聚集 热点区域。本发明实施例利用的源数据为通信运营商提供的手机信令数据,获取方式简单、 获取成本低且信息样本大;能够实时、高精准地识别出用户聚集热点区域,为城市公交规划 和城建规划提供高质量的数据分析结果。
[0049] 相应地,本发明还提供一种用户聚集热点区域识别装置,可执行上述实施例提供 的用户聚集热点区域识别方法的所有流程。
[0050] 请参阅图2,是本发明提供的用户聚集热点区域识别装置的一个实施例的结构示 意图。
[0051] 本发明提供一种用户聚集热点区域识别装置20,包括统计单元21、计算单元22、候 选热点基站获取单元23以及用户聚集热点区域识别单元24,具体如下:
[0052] 所述统计单元21,用于基于获取到的待识别区域内的每一个用户在特定时间段内 的手机信令数据,统计每一所述用户所经过的基站及该用户在每一所述基站的移动特征。
[0053] 所述移动特征包括首次出现的时间、出现的次数、频率和累计间隔时间。
[0054] 所述计算单元22,用于计算每一所述用户对所述待识别区域内的每一个基站的兴 趣度,及经过同一个基站的任意两个用户的移动特征向量之间的空间距离。
[0055] 其中,所述兴趣度为对出现的次数、频率及累计间隔时间分配不同权重后进行加 权平均所得到的值;所述移动特征向量为由所述移动特征所包含的各变量组成的有序数 组。
[0056] 所述候选热点基站获取单元23,用于针对经过所述待识别区域内的每一个基站的 每一个用户,统计出与该用户的移动特征向量之间的空间距离最近的前K个用户,并提取所 述K个用户的兴趣度最高的前N个基站,将所述N个基站均作为候选热点基站。
[0057] 其中,K为正整数,N为正整数。
[0058]所述用户聚集热点区域识别单元24,用于将用户数达到一预设的阈值的每一所述 候选热点基站作为一个热点基站,每一所述热点基站所覆盖的一个区域为一个用户聚集热 点区域。
[0059]其中,所述预设的阈值大于K。
[0060]可以理解的是,本发明实施例中的用户聚集热点区域识别装置20的各功能单元的 功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例 的相关描述,此处不再赘述。
[0061] 本发明实施例提供的用户聚集热点区域识别方法及装置,具有如下有益效果:基 于通信运营商提供的手机信令数据,统计出待识别区域内的每一个用户在特定时间段内经 过的基站及该用户在每一所述基站的移动特征;然后,采用协同聚类的方法对经过所述待 识别区域内的每一个基站的每一个用户的最具有相似移动特征的前K个用户进行聚类;接 着,采用协同过滤的方法提取出所述K个用户的兴趣度最高的前N个基站,并将所述N个基站 均作为候选热点基站;最后,将用户数达到一预设的阈值的每一所述候选热点基站作为一 个热点基站,每一所述热点基站所覆盖的一个区域为一个用户聚集热点区域。本发明实施 例利用的源数据为通信运营商提供的手机信令数据,获取方式简单、获取成本低且信息样 本大;能够实时、高精准地识别出用户聚集热点区域,为城市公交规划和城建规划提供高质 量的数据分析结果。
[0062] 以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员 来说,在不脱离本发明原理的前提下,还可以做出若干改进和变形,这些改进和变形也视为 本发明的保护范围。
【主权项】
1. 一种用户聚集热点区域识别方法,其特征在于,包括如下步骤: 基于获取到的待识别区域内的每一个用户在特定时间段内的手机信令数据,统计每一 所述用户所经过的基站及该用户在每一所述基站的移动特征;其中,所述移动特征包括首 次出现的时间、出现的次数、频率和累计间隔时间; 计算每一所述用户对所述待识别区域内的每一个基站的兴趣度,及经过同一个基站的 任意两个用户的移动特征向量之间的空间距离;其中,所述兴趣度为对出现的次数、频率及 累计间隔时间分配不同权重后进行加权平均所得到的值;所述移动特征向量为由所述移动 特征所包含的各变量组成的有序数组; 针对经过所述待识别区域内的每一个基站的每一个用户,统计出与该用户的移动特征 向量之间的空间距离最近的前K个用户,并提取所述K个用户的兴趣度最高的前N个基站,将 所述N个基站均作为候选热点基站;其中,K为正整数,N为正整数; 将用户数达到一预设的阈值的每一所述候选热点基站作为一个热点基站,每一所述热 点基站所覆盖的一个区域为一个用户聚集热点区域;其中,所述预设的阈值大于K。2. 如权利要求1所述的用户聚集热点区域识别方法,其特征在于,当经过所述待识别区 域内的某一个基站的用户的数量小于K时,则确定该基站为非热点基站。3. 如权利要求1所述的用户聚集热点区域识别方法,其特征在于,所述手机信令数据包 括用户手机ID; 每一所述用户对应一个用户手机ID。4. 如权利要求1所述的用户聚集热点区域识别方法,其特征在于,假设所述出现的次数 为a,频率为b,累计间隔时间为c,则所述兴趣度z = a X qi+b X q2+c X q3;其中,qi+q2+q3 = 1, 91、92、93分别为3、13、(3的权重。 5 . -种用户聚集热点区域识别装置,其特征在于,包括: 统计单元,用于基于获取到的待识别区域内的每一个用户在特定时间段内的手机信令 数据,统计每一所述用户所经过的基站及该用户在每一所述基站的移动特征;所述移动特 征包括首次出现的时间、出现的次数、频率和累计间隔时间; 计算单元,用于计算每一所述用户对所述待识别区域内的每一个基站的兴趣度,及经 过同一个基站的任意两个用户的移动特征向量之间的空间距离;其中,所述兴趣度为对出 现的次数、频率及累计间隔时间分配不同权重后进行加权平均所得到的值;所述移动特征 向量为由所述移动特征所包含的各变量组成的有序数组; 候选热点基站获取单元,用于针对经过所述待识别区域内的每一个基站的每一个用 户,统计出与该用户的移动特征向量之间的空间距离最近的前K个用户,并提取所述K个用 户的兴趣度最高的前N个基站,将所述N个基站均作为候选热点基站;其中,K为正整数,N为 正整数; 用户聚集热点区域识别单元,用于将用户数达到一预设的阈值的每一所述候选热点基 站作为一个热点基站,每一所述热点基站所覆盖的一个区域为一个用户聚集热点区域;其 中,所述预设的阈值大于K。6. 如权利要求5所述的用户聚集热点区域识别装置,其特征在于,当经过所述待识别区 域内的某一个基站的用户的数量小于K时,则确定该基站为非热点基站。7. 如权利要求5所述的用户聚集热点区域识别装置,其特征在于,所述手机信令数据包 括用户手机ID; 每一所述用户对应一个用户手机ID。8.如权利要求5所述的用户聚集热点区域识别装置,其特征在于,假设所述出现的次数 为a,频率为b,累计间隔时间为c,则所述兴趣度z = a X qi+b X q2+c X q3;其中,qi+q2+q3 = 1, 91、92、93分别为3、13、(3的权重。
【专利摘要】本发明公开了一种用户聚集热点区域识别方法,包括如下步骤:基于获取到的手机信令数据,统计待识别区域内的每一个用户在特定时间段内所经过的基站及该用户在每一个基站的移动特征;针对经过待识别区域内的每一个基站的每一个用户,统计出与该用户的移动特征向量之间的空间距离最近的前K个用户,并提取K个用户的兴趣度最高的前N个基站,将N个基站均作为候选热点基站;通过阈值判断识别出热点基站,每一个热点基站所覆盖的一个区域为一个用户聚集热点区域。本发明还提供一种用户聚集热点区域识别装置。采用本发明实施例,能够实现实时、高精准地识别用户聚集热点区域,且分析数据获取方便,成本低廉。
【IPC分类】H04W4/02
【公开号】CN105682023
【申请号】CN201511034022
【发明人】杜翠凤, 余艺
【申请人】广州杰赛科技股份有限公司
【公开日】2016年6月15日
【申请日】2015年12月31日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1