区域人口数量的预测方法、装置、计算机设备及存储介质与流程

文档序号:24198591发布日期:2021-03-09 18:35阅读:102来源:国知局
区域人口数量的预测方法、装置、计算机设备及存储介质与流程

1.本申请涉及通信技术领域,尤其涉及一种区域人口数量的预测方法、装置、计算机设备及存储介质。


背景技术:

2.随着城镇化进程的加快,人口活动的空间范围增大,人口流动的数量与速度均在迅速扩张,人口的迅速集聚、无序蔓延同时带来了交通拥堵、城市安全等一系列问题,为城市管理增加了难度。掌握区域活跃人口数据,动态监测人流分布能够实现问题区域的提前预警,同时为城市设施供给提供量化依据,有效的辅助城市精细化管理。
3.目前,对人口数量进行预测是根据移动终端的数量与人口系数的乘积确定。但是,由于部分人口没有移动终端数据(老人或孩子没有移动终端),因此根据移动终端的数量与人口系数的乘积预测的人口数量的准确率较低。


技术实现要素:

4.本申请实施例提供一种区域人口数量的预测方法、装置、计算机设备及存储介质,用于提高区域人口数量预测的准确率。
5.本发明实施例提供一种区域人口数量的预测方法,所述方法应用于服务器,所述方法包括:
6.当接收到人口数量预测指令时,获取与当前时间对应的当前时间单元,所述人口数量预测指令中包含预测区域;
7.从数据库中获取所述当前时间单元之前的一个时间单元对应的终端数据,所述数据库中存储有不同时间单元分别对应的终端数据;
8.根据所述之前的一个时间单元对应的终端数据确定终端历史网格位于所述预测区域内的终端数量;
9.根据所述终端数量和所述预测区域的基准终端数量、所述预测区域的常住人口数量计算所述预测区域的人口数量预测值。
10.本发明实施例提供一种区域人口数量的预测装置,所述装置应用于服务器,所述装置包括:
11.获取模块,用于当接收到人口数量预测指令时,获取与当前时间对应的当前时间单元,所述人口数量预测指令中包含预测区域;
12.所述获取模块,还用于从数据库中获取所述当前时间单元之前的一个时间单元对应的终端数据,所述数据库中存储有不同时间单元分别对应的终端数据;
13.确定模块,用于根据所述之前的一个时间单元对应的终端数据确定终端历史网格位于所述预测区域内的终端数量;
14.计算模块,用于根据所述终端数量和所述预测区域的基准终端数量、所述预测区域的常住人口数量计算所述预测区域的人口数量预测值。
15.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述区域人口数量的预测方法。
16.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述区域人口数量的预测方法。
17.本发明提供一种区域人口数量的预测方法、装置、计算机设备及存储介质,当接收到人口数量预测指令时,获取与当前时间对应的当前时间单元,然后从数据库中获取当前时间单元之前的一个时间单元对应的终端数据,并根据之前的一个时间单元对应的终端数据确定终端历史网格位于预测区域内的终端数量;最后根据终端数量和预测区域的基准终端数量、预测区域的常住人口数量计算预测区域的人口数量预测值。与目前根据移动终端的数量与人口系数的乘积对人口数量进行预测相比,本发明通过多个维度的数据对区域人口的数量进行预测,即在获取到预测区域内的终端数量之后,根据终端数量和预测区域的基准终端数量、预测区域的常住人口数量计算预测区域的人口数量预测值,本发明综合考虑了预测区域内的终端数量、基准终端数量、常住人口数量三个因素对区域人口数量进行预测,从而通过本发明提高了人口数量预测的准确率。
附图说明
18.图1为本申请一个实施例提供的区域人口数量的预测方法流程图;
19.图2为本申请一个实施例提供的常数系数b确定的流程图;
20.图3为本申请一个实施例提供的服务器处理终端数据流程图;
21.图4为本申请一个实施例提供的区域人口数量的预测装置的结构框图;
22.图5为本申请一个实施例提供的计算机设备的一示意图。
具体实施方式
23.为了更好的理解上述技术方案,下面通过附图以及具体实施例对本申请实施例的技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请实施例技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。
24.根据本发明,提供了一种区域人口数量的预测系统,包括服务器、移动终端、数据库和存储有计算机程序的存储介质,服务器与移动终端、数据库通信连接。本领域技术人员知晓,服务器、移动终端和数据库并非特指一台硬件设备和/或软件设备,还可以是服务器集群、存储集群等。换言之,能够进行数据处理的任何计算设备或多个计算设备的组合均可以认为是服务器,能够进行数据存储的任何存储设备或多个存储设备的组合均可以认为是数据库。服务器和数据库可以是独立的设备,也可以共享一个或多个独立设备。
25.优选的,服务器与多个移动终端通信连接,接收并处理移动终端上传的数据,并将处理后的数据存储到数据库中。一个示例中,数据库中移动终端的数量级为亿级到十亿级,移动终端每日上传数据的数量级为百亿级。
26.请参阅图1,所示为本发明第一实施例当中的区域人口数量的预测方法,所述方法应用于服务器,所述方法具体包括步骤s01-步骤s04,其详细内容如下所述:
27.s01,当接收到人口数量预测指令时,获取与当前时间对应的当前时间单元。
28.其中,所述人口数量预测指令中包含预测区域;预测区域可以指行政区域,例如北京市;也可以只用户定义的区域,例如用户在电子地图上圈选的区域;对于行政区域,系统中存储有行政区域与网格集合的映射关系,例如北京市对应的网格集合;对于用户定义的区域,系统通过坐标变换程序,可以将区域转换为对应的多个网格集合。
29.在本实施例中,当前时间在当前时间单元的范围内,每个时间单元的时长为固定的,该时间单位具体可以分钟为单位进行划分,也可以小时为单位进行划分,还可以为日为单位进行划分,本发明实施例不做具体限定。
30.例如,时间单元的时长为5分钟,则时间单元n=24*60/5=288。时间窗为24小时。
31.第1个时间单元为[0:00-0:04]
[0032]
第2个时间单元为[0:05-0:09]
[0033]
......
[0034]
第288个时间单元为[23:55-23:59]
[0035]
若当前时间为0:02,则可以确定对应的当前时间单元为第1个时间单元。
[0036]
s02,从数据库中获取当前时间单元之前的一个时间单元对应的终端数据。
[0037]
例如,若根据当前时间确定的当前时间单元为第5个时间单元,则获取的前一个时间单元为第4个时间单元。
[0038]
其中,所述数据库中存储有不同时间单元分别对应的终端数据,该终端数据具体包括终端id、终端位置p、和/或上传时间t。终端id为可用来区分不同移动终端的唯一编码。示例性地,终端id可以为移动终端的imei、imsi、mac地址、sim卡号之任一或其组合,或者经过加密处理(例如md5加密处理)的移动终端的imei、imsi、mac地址、sim卡号之任一或其组合,本发明实施例不做具体限定。
[0039]
终端位置p可以通过以下任一或任意组合的方式获取:(1)通过移动终端的gps获取;(2)通过移动终端连接或扫描到的wifi获取;(3)通过移动终端连接的基站获取。终端位置p的格式可以为终端的经纬度坐标,也可以为经纬度坐标进行变换后的地理网格,例如geohash网格。
[0040]
s03,根据之前的一个时间单元对应的终端数据确定终端历史网格位于预测区域内的终端数量。
[0041]
其中,终端历史网格相当于终端数据中的终端位置p。具体的,确定数据库中上传时间t属于之前的一个时间单元对应的终端数据,然后从获取的终端数据中查询出属于预测区域的数据数量,之后将查询到的数据数量确定为终端数量。
[0042]
例如,预测区域为a区域,之前的一个时间单元为第5个时间单元,则首先获取第5个时间单元对应的终端数据,若在第5个时间单元的终端数据为100万条,则还需要从这100万条终端数据中筛选出属于a区域的终端数据,若筛选得到10万条数据记录,则说明a区域内的终端数量为10万。
[0043]
s04,根据终端数量和预测区域的基准终端数量、预测区域的常住人口数量计算预测区域的人口数量预测值。
[0044]
其中,预测区域的基准终端数量为预置时间段内各时间单元中属于预测区域终端数量的平均值,预测区域的常住人口数量可由用户输入获取,或者从第三方服务器(统计局
网站)中获取。具体的,所述预测区域的人口数量预测值与所述终端数量、所述预测区域的常住人口数量正相关,与所述预测区域的基准终端数量反相关。
[0045]
本发明提供一种区域人口数量的预测方法,当接收到人口数量预测指令时,获取与当前时间对应的当前时间单元,然后从数据库中获取当前时间单元之前的一个时间单元对应的终端数据,并根据之前的一个时间单元对应的终端数据确定终端历史网格位于预测区域内的终端数量;最后根据终端数量和预测区域的基准终端数量、预测区域的常住人口数量计算预测区域的人口数量预测值。与目前根据移动终端的数量与人口系数的乘积对人口数量进行预测相比,本发明通过多个维度的数据对区域人口的数量进行预测,即在获取到预测区域内的终端数量之后,根据终端数量和预测区域的基准终端数量、预测区域的常住人口数量计算预测区域的人口数量预测值,本发明综合考虑了预测区域内的终端数量、基准终端数量、常住人口数量三个因素对区域人口数量进行预测,从而通过本发明提高了人口数量预测的准确率。
[0046]
在本发明提供的一个实施例中,根据所述终端数量和所述预测区域的基准终端数量、所述预测区域的常住人口数量计算所述预测区域的人口数量预测值,包括:
[0047]
通过公式计算所述预测区域的人口数量预测值;
[0048]
其中,所述y为所述预测区域的人口数量预测值,所述p为所述预测区域的常住人口数量,所述n0为所述预测区域的基准终端数量,所述n1为所述终端数量,所述b为常数系数。
[0049]
具体的,预测区域的基准终端数量
[0050]
其中,n0为所述预测区域的基准终端数量,m为预置时间段内预置数量的时间单元,m
i
为从所述数据库中获取的第i个时间单元的终端数量。m可以是固定的时间段内的时间单元,如m=7,为春节7天;或者m=3,为清明或是五一的3天,本发明实施例不做具体限定。
[0051]
在本发明提供的一个实施例中,所述m根据所述数据库中预置年份内与所述之前的一个时间单元属于同一日的时间单元确定。例如,当前时间单元为2020年8月10日,时间单元以日为计量,预置年份可以为5,即获取2019年8月10日、2018年8月10日、2017年8月10日、2016年8月10日、2015年8月10日内的预测区域的终端数量,然后对获取的终端数量求平均值,得到预测区域的基准终端数量。
[0052]
在本发明提供的一个实施例中,所述m为发生在所述当前时间单元之前的预置数量的时间单元。例如,当前时间单元为8月10,时间单元以天为计量,则预置时间段为8月1日至8月9日,即获取8月1日至8月9日内的预测区域的终端数量,然后对8月1日至8月9日内的预测区域的终端数量求平均值,得到预测区域的基准终端数量。
[0053]
如图2所示,在本发明提供的一个实施例中,b通过下述方式确定:
[0054]
s041,从数据库的历史数据中获取多个在预测区域产生的人口数量预测值pi,及与人口数量预测值p
i
分别对应的终端数量n
i

[0055]
例如,预测区域为b区,则从数据库中获取历史数据,该历史数据为一个月或是一周内的人口数量预测值pi,以及与人口数量预测值p
i
分别对应的终端数量n
i
。如获取历史数
据中5月1日-5月7日对b区人口数量预测值pi,以及根据5月1日-5月7日移动终端上传的数据确定b区对应的终端数量n
i

[0056]
s042,确定与人口数量预测值p
i
分别对应的预测区域的基准终端数量n0。
[0057]
在本发明实施例中,人口数量预测值p
i
分别对应的预测区域的基准终端数量n0可以采用步骤s04中的方式确定,本实施例在此不再赘述。
[0058]
s043,通过拟合函数拟合获取所述b。
[0059]
具体的,将预测区域的人口数量预测值p
i
、终端数量n
i
和基准终端数量n带入拟合函数通过计算获取b。
[0060]
如图3所示,在本发明提供的一个实施例中,在从数据库中获取当前时间单元之前的一个时间单元对应的终端数据之前,所述方法还包括:
[0061]
s10,接收移动终端上传的终端数据。
[0062]
具体的,终端数据具体包括终端id、终端位置p、和/或上传时间t。移动终端上传数据的方式包括:轮询和/或中断方式。
[0063]
其中,轮询方式为移动终端每隔固定时间向服务器上传数据;中断方式为移动终端状态发生变化时向服务器上传数据,例如移动终端从连接或断开到某个wifi-id时,或者移动终端从基站甲的覆盖范围变换到基站乙的覆盖范围时,或者终端启动或关闭app时等。
[0064]
本实施例不对终端数据的上传途径予以限定,例如,终端数据的上传途径可以为移动终端中安装的app所上传的终端信息,或移动终端经由通信连接的基站所上传的终端数据,或移动终端中集成在app中的sdk所上传的终端数据等。示例性的,移动终端在使用出行app的过程中,出行app识别出移动终端的实时位置并上传。
[0065]
s20,对移动终端上传的终端数据进行处理。
[0066]
优选的,服务器对上传数据的处理包括:
[0067]
s21,终端id的合并,即把经常同时出现在临近位置的终端id合并为一个终端id,排除一人双机/多机/测试机/工程机/手机农场等情况。
[0068]
s22,根据预设的网格和时间段,对上传数据进行有损压缩。
[0069]
当上传的终端位置p为经纬度坐标时,可以根据终端位置p进行坐标变换确定唯一的网格,当然本发明实施例也不排斥终端在上传前就在终端本地完成了坐标转换。时间段为可以配置的时间段,优选为1小时,即00:00:00-00:00:59为第一个时间段,01:00:00-01:00:59为第二时间段,以此类推;当然可以5分钟、15分钟、0.5个小时、2个小时、24个小时(即天)等,本发明实施例对此不作具体限定。
[0070]
本发明实施例中,“网格”指矩形排布的地理空间区域;网格优选为一个geohash网格或者相邻的多个geohash网格,geohash网格例如7位或8位的geohash网格,其唯一标识为7位或8位的字符串。示例性的一种实施方式中,网格为一个7位的geohash网格,示例性的另一种实施方式中,网格为两个相邻的构成(近似)正方形的8位geohash网格。“网格集合”指一个或多个不存在重叠地理空间区域的网格,如两个网格集合之间存在相同的网格,可以认为两个网格集合存在交集。
[0071]
有损压缩方式为,将经过s21处理后的同一终端id在同一时间段内出现在同一网
格内的多个数据压缩为一个数据,将同一时间段内连接到同一wifi-id的多个数据压缩为一个数据。例如,终端id1上传的数据(以cvs格式为例说明)中包括:
[0072]
1、id1,xxxx年xx月xx日07:00:03,p1;
[0073]
2、id1,xxxx年xx月xx日07:10:23,p2;
[0074]
3、id1,xxxx年xx月xx日07:33:26,p3。
[0075]
如p1、p2、p3位于同一个地理网格g1内时,将数据1-3压缩为:
[0076]
1、id1,xxxx年xx月xx日07时,g1。
[0077]
通过步骤s20后处理的上传数据,可以被存储到数据库中。即数据库中存储有移动终端的终端id(例如id1)、终端位置p对应的终端历史网格(例如g1)和历史网格的上传时间t(例如xxxx年xx月xx日07时)。
[0078]
s30,将有损压缩后的数据形成终端数据,并存储到数据库中。
[0079]
该终端数据包括:终端id、终端的历史网格、历史网格的上传时间(段)t。数据库可以采用现在的数据库存储,例如包括支持列族的hbase等数据库;移动终端位置数据可以存储在一张表中,也可以存储在相互关联的多张数据表中,本发明不对具体的存储方式进行限定。显然,服务器可以在进行有损压缩之前,将原始数据备份到数据库或其他数据库。
[0080]
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
[0081]
在一实施例中,提供一种区域人口数量的预测装置,该区域人口数量的预测装置与上述实施例中区域人口数量的预测方法一一对应。如图4所示,所述区域人口数量的预测装置各功能模块详细说明如下:
[0082]
获取模块10,用于当接收到人口数量预测指令时,获取与当前时间对应的当前时间单元,所述人口数量预测指令中包含预测区域;
[0083]
所述获取模块10,还用于从数据库中获取所述当前时间单元之前的一个时间单元对应的终端数据,所述数据库中存储有不同时间单元分别对应的终端数据;
[0084]
确定模块20,用于根据所述之前的一个时间单元对应的终端数据确定终端历史网格位于所述预测区域内的终端数量;
[0085]
计算模块30,用于根据所述终端数量和所述预测区域的基准终端数量、所述预测区域的常住人口数量计算所述预测区域的人口数量预测值。
[0086]
关于区域人口数量的预测装置的具体限定可以参见上文中对于区域人口数量的预测方法的限定,在此不再赘述。上述设备中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0087]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算
机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种区域人口数量的预测方法。
[0088]
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
[0089]
当接收到人口数量预测指令时,获取与当前时间对应的当前时间单元,所述人口数量预测指令中包含预测区域;
[0090]
从数据库中获取所述当前时间单元之前的一个时间单元对应的终端数据,所述数据库中存储有不同时间单元分别对应的终端数据;
[0091]
根据所述之前的一个时间单元对应的终端数据确定终端历史网格位于所述预测区域内的终端数量;
[0092]
根据所述终端数量和所述预测区域的基准终端数量、所述预测区域的常住人口数量计算所述预测区域的人口数量预测值。
[0093]
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
[0094]
当接收到人口数量预测指令时,获取与当前时间对应的当前时间单元,所述人口数量预测指令中包含预测区域;
[0095]
从数据库中获取所述当前时间单元之前的一个时间单元对应的终端数据,所述数据库中存储有不同时间单元分别对应的终端数据;
[0096]
根据所述之前的一个时间单元对应的终端数据确定终端历史网格位于所述预测区域内的终端数量;
[0097]
根据所述终端数量和所述预测区域的基准终端数量、所述预测区域的常住人口数量计算所述预测区域的人口数量预测值。
[0098]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0099]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
[0100]
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者
替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1