推送信息的方法和装置与流程

文档序号:12694713阅读:196来源:国知局
推送信息的方法和装置与流程

本申请涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及一种推送信息的方法和装置。



背景技术:

信息推送是一项以数据挖掘、自然语言处理以及互联网等多门技术为基础的综合性技术。信息推送通过自动传送信息给用户,来减少用户用于搜集信息的时间。它根据用户的关注点来搜索、过滤信息,并将其推送给用户,帮助用户高效率地发掘有价值的信息。在推送信息时,可以基于一些在社会和经济领域具有重要意义的指标来推送信息,例如基于预定地区的人口数量来推送信息。

目前,基于预定地区的人口数量来推送信息的方法,通常需要人工进行人口走访和抽样统计,之后根据走访结果和抽样统计概率获得预定地区的人口数量,最后再基于该预定地区的人口数量来推送信息。

然而,目前这种推送信息的方法,由于人工进行人口走访和抽样统计的运营成本高、覆盖范围小、统计周期长且准确性较差,导致推送信息的方法的运营成本高、覆盖范围小、效率低下且精准度较低。



技术实现要素:

本申请的目的在于提出一种改进的推送信息的方法和装置,来解决以上背景技术部分提到的技术问题。

第一方面,本申请提供了一种推送信息的方法,所述方法包括:基于终端设备的定位库中预定时间段内终端设备的定位日志,确定终端设备的常驻点库;从所述终端设备的定位库中,获取位于各预定行政区域内的常驻设备数量;从所述终端设备的常驻点库中,获取位于预定地点的常驻设备数量;基于所述预定行政区域内的常驻设备数量和/或所述预定地点的常驻设备数量,向终端推送信息。

在一些实施例中,所述基于终端设备的定位库中预定时间段内终端设备的定位日志,确定终端设备的常驻点库包括:基于终端设备的定位库中预定时间段内终端设备的定位日志,聚类各个终端设备的轨迹,得到各个终端设备的密度簇;从所述各个终端设备的密度簇内,提取所述各个终端设备的时间分布特征和WIFI特征;基于所述各个终端设备的时间分布特征和WIFI特征,确定所述各个终端设备的常驻地点;基于所述各个终端设备的常驻地点,得到所述各个终端设备的常驻点库。

在一些实施例中,所述从所述终端设备的定位库中,获取位于各预定行政区域内的常驻设备数量包括:若所述预定区域为预定级别的行政区域,从所述终端设备的定位库中,确定各终端设备在各所述预定级别的行政区域内的定位天数;将从所述各终端设备在各所述预定级别的行政区域内的定位天数中提取的具有最多定位天数的行政区域分别作为各终端设备的常驻行政区域;基于所述各终端设备的常驻行政区域,确定位于所述预定区域内的常驻设备数量。

在一些实施例中,所述从所述终端设备的定位库中,获取位于各预定行政区域内的常驻设备数量包括:若所述预定区域为省级行政区域,从终端设备的定位库中,获取所述各终端设备在各省的定位天数;将从所述各终端设备在各省的定位天数中提取的具有最多定位天数的省份作为各终端设备的常驻省份;基于所述各终端设备的常驻省份,获取位于各所述省级行政区域内的常驻设备数量。

在一些实施例中,所述从所述终端设备的定位库中,获取位于各预定行政区域内的常驻设备数量还包括:若所述预定区域为市级行政区域,获取所述各终端设备在所述各终端设备的常驻省份内各城市的定位天数;将从所述各终端设备在所述各终端设备的常驻省份内各城市的定位天数中提取的具有最多定位天数的城市作为各终端设备的常驻城市;基于所述各终端设备的常驻城市,获取位于各所述市级行政区域内的常驻设备数量。

在一些实施例中,所述从所述终端设备的定位库中,获取位于各预定行政区域内的常驻设备数量还包括:若所述预定区域为区县级行政区域,获取各终端设备在所述各终端设备的常驻城市内各区县的定位天数;将从所述各终端设备在所述各终端设备的常驻城市内各区县的定位天数中提取的具有最多定位天数的区县作为各终端设备的常驻区县;基于所述各终端设备的常驻区县,获取位于各所述区县级行政区域内的常驻设备数量。

在一些实施例中,所述基于所述预定行政区域内的常驻设备数量和/或所述预定地点的常驻设备数量,向终端推送信息包括:将所述预定区域内的常驻设备数量除以预定区域内的常驻设备覆盖率,得到预定区域内的定位设备数量;将所述预定区域内的定位设备数量除以预定区域内获取所述定位日志的应用在安卓设备中的覆盖率,得到预定区域内的安卓设备数量;将所述预定区域内的安卓设备数量除以预定区域内的安卓设备占智能设备的比例,得到预定区域内的智能设备数量;将所述预定区域内的智能设备数量除以预定区域内的智能设备覆盖率,得到预定区域内的人口数量;基于所述预定区域内的人口数量,向终端推送信息。

第二方面,本申请提供了一种推送信息的装置,所述装置包括:常驻点库确定单元,用于基于终端设备的定位库中预定时间段内终端设备的定位日志,确定终端设备的常驻点库;第一数量确定单元,用于从所述终端设备的定位库中,获取位于各预定行政区域内的常驻设备数量;第二数量确定单元,用于从所述终端设备的常驻点库中,获取位于预定地点的常驻设备数量;信息推送单元,用于基于所述预定行政区域内的常驻设备数量和/或所述预定地点的常驻设备数量,向终端推送信息。

在一些实施例中,所述常驻点库确定单元包括:轨迹聚类子单元,用于基于终端设备的定位库中预定时间段内终端设备的定位日志,聚类各个终端设备的轨迹,得到各个终端设备的密度簇;特征提取子单元,用于从所述各个终端设备的密度簇内,提取所述各个终端设备的时间分布特征和WIFI特征;地点确定子单元,用于基于所述各个终端设备的时间分布特征和WIFI特征,确定所述各个终端设备的常驻地点;点库确定子单元,用于基于所述各个终端设备的常驻地点,得到所述各个终端设备的常驻点库。

在一些实施例中,所述第一数量确定单元包括:天数确定子单元,用于若所述预定区域为预定级别的行政区域,从所述终端设备的定位库中,确定各终端设备在各所述预定级别的行政区域内的定位天数;区域确定子单元,用于将从所述各终端设备在各所述预定级别的行政区域内的定位天数中提取的具有最多定位天数的行政区域分别作为各终端设备的常驻行政区域;数量确定子单元,用于基于所述各终端设备的常驻行政区域,确定位于所述预定区域内的常驻设备数量。

在一些实施例中,所述第一数量确定单元包括:所述天数确定子单元进一步用于:若所述预定区域为省级行政区域,从终端设备的定位库中,获取所述各终端设备在各省的定位天数;所述区域确定子单元进一步用于:将从所述各终端设备在各省的定位天数中提取的具有最多定位天数的省份作为各终端设备的常驻省份;所述数量确定子单元进一步用于:基于所述各终端设备的常驻省份,获取位于各所述省级行政区域内的常驻设备数量。

在一些实施例中,所述从所述终端设备的定位库中,获取位于各预定行政区域内的常驻设备数量还包括:所述天数确定子单元进一步用于:若所述预定区域为市级行政区域,获取所述各终端设备在所述各终端设备的常驻省份内各城市的定位天数;所述区域确定子单元进一步用于:将从所述各终端设备在所述各终端设备的常驻省份内各城市的定位天数中提取的具有最多定位天数的城市作为各终端设备的常驻城市;所述数量确定子单元进一步用于:基于所述各终端设备的常驻城市,获取位于各所述市级行政区域内的常驻设备数量。

在一些实施例中,所述从所述终端设备的定位库中,获取位于各预定行政区域内的常驻设备数量还包括:所述天数确定子单元进一步用于:若所述预定区域为区县级行政区域,获取各终端设备在所述各终端设备的常驻城市内各区县的定位天数;所述区域确定子单元进一步用于:将从所述各终端设备在所述各终端设备的常驻城市内各区县的定位天数中提取的具有最多定位天数的区县作为各终端设备的常驻区县;所述数量确定子单元进一步用于:基于所述各终端设备的常驻区县,获取位于各所述区县级行政区域内的常驻设备数量。

在一些实施例中,所述信息推送单元包括:定位设备确定子单元,用于将所述预定区域内的常驻设备数量除以预定区域内的常驻设备覆盖率,得到预定区域内的定位设备数量;安卓设备确定子单元,用于将所述预定区域内的定位设备数量除以预定区域内获取所述定位日志的应用在安卓设备中的覆盖率,得到预定区域内的安卓设备数量;智能设备确定子单元,用于将所述预定区域内的安卓设备数量除以预定区域内的安卓设备占智能设备的比例,得到预定区域内的智能设备数量;人口数量确定子单元,用于将所述预定区域内的智能设备数量除以预定区域内的智能设备覆盖率,得到预定区域内的人口数量;推送信息子单元,用于基于所述预定区域内的人口数量,向终端推送信息。

本申请上述实施例提供的推送信息的方法和装置,首先基于终端设备的定位库中预定时间段内终端设备的定位日志,确定终端设备的常驻点库;之后从终端设备的定位库中,获取位于各预定行政区域内的常驻设备数量;从终端设备的常驻点库中获取位于预定地点的常驻设备数量;最后基于预定行政区域内的常驻设备数量和/或预定地点的常驻设备数量,向终端推送信息,从而降低了推送信息的运营成本、扩大了推送信息的覆盖范围、提高了推送信息的效率较高且推送信息的精准度较高。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1是本申请可以应用于其中的示例性系统架构图;

图2是根据本申请的推送信息的方法的一个实施例的示意性流程图;

图3是根据本申请的确定终端设备的常驻点库的方法的一个实施例的示意性流程图;

图4a示出了单台设备两个月内的定位轨迹的示意图。

图4b示出了聚类单台设备两个月内的定位轨迹得到的聚类簇的示意图。

图5是根据本申请的获取位于各预定行政区域内的常驻设备数量的方法的示意性流程图。

图6是根据本申请的推送信息的方法的一个实施例的示例性应用场景的流程图;

图7是根据本申请的推送信息的装置的一个实施例的示例性结构图。

图8是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了可以应用本申请的推送信息的方法或推送信息的装置的实施例的示例性系统架构100。

如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105、106。网络104用以在终端设备101、102、103和服务器105、106之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户110可以使用终端设备101、102、103通过网络104与服务器105、106交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如搜索引擎类应用、购物类应用、即时通信工具、邮箱客户端、社交平台软件、视频播放类应用等。

终端设备101、102、103可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务器105、106可以是提供各种服务的服务器,例如对终端设备101、102、103提供支持的后台服务器。后台服务器可以对终端的数据进行存储或计算等处理,并将存储或计算结果推送给终端设备。

需要说明的是,本申请中实施例所提供的推送信息的方法一般由服务器105、106执行,相应地,推送信息的装置一般设置于服务器105、106中。

应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

继续参考图2,图2示出了根据本申请的推送信息的方法的一个实施例的流程200。该推送信息的方法,包括以下步骤:

步骤201,基于终端设备的定位库中预定时间段内终端设备的定位日志,确定终端设备的常驻点库。

在本实施例中,终端设备的定位库是指包括终端设备的定位日志的数据库。预定时间段是指用户希望统计的时间段,例如,若用户希望统计距当前时间两个月内的定位日志,那么预定时间段就指距当前时间两个月这一时间段。这里的定位日志,可以通过具有定位权限的应用获取,通常包括设备的位置信息。

在获取预定时间段内终端设备的定位日志之后,可以基于对定位日志的分析处理,确定终端设备的常驻点库。例如,可以通过对定位日志的聚类确定终端设备的常驻点库。

步骤202,从终端设备的定位库中,获取位于各预定行政区域内的常驻设备数量。

在本实施例中,预定行政区域是指用户希望统计的国家为便于行政管理而分级划分的区域。行政区域,可以为省(包括自治区、直辖市、特别行政区等)、市以及区县等。

在获取预定时间段内终端设备的定位日志之后,可以通过对定位日志的统计得到预定行政区域内的常驻设备数量。例如,若预先设定当终端设备在某预定行政区域的停留时间超过预定时长时,确定某预定行政区域为终端设备的常驻区域。那么,可以根据该预先设定对定位日志进行统计,得到某预定行政区域的常驻设备数量。

步骤203,从终端设备的常驻点库中获取位于预定地点的常驻设备数量。

在本实施例中,基于步骤201中得到的终端设备的常驻点库,可以从终端设备的常驻点库中,统计位于预定地点的常驻设备数量。这里的预定地点,通常指地图上可以标注的地点,例如某个地区、某个建筑等。

步骤204,基于预定行政区域内的常驻设备数量和/或预定地点的常驻设备数量,向终端推送信息。

在本实施例中,可以基于步骤202中得到的预定行政区域内的常驻设备数量,向终端推送信息;备选地或附加地,可以基于步骤203中的得到的预定地点的常驻设备数量,向终端推送信息。在这里,可以直接采用常驻设备数量作为推送信息,也可以对常驻设备数量进行计算处理后得到推送信息,例如,可以根据预定行政区域或预定地点的常驻设备数量计算预定行政区域或预定地点的人口数量,之后可以将人口数量作为推送信息或根据人口数量进行计算处理后得到推送信息。

进一步地,在根据人口推送信息时,可以基于获取定位日志的应用在采用不同移动操作系统的设备中(例如采用安卓系统的设备中、采用iOS系统的设备中或采用其它移动操作系统的设备中)的覆盖率,来获取人口数量。

示例性地,可以基于常驻设备数量,来计算预定区域内的人口数量,之后根据人口数量向终端推送信息。其中,常驻设备数量由采用安卓系统的设备的定位日志得到的。具体地,可以首先将预定区域内的常驻设备数量除以预定区域内的常驻设备覆盖率,得到预定区域内的定位设备数量;之后将预定区域内的定位设备数量除以预定区域内获取定位日志的应用在安卓设备中的覆盖率,得到预定区域内的安卓设备数量;之后将预定区域内的安卓设备数量除以预定区域内的安卓设备占智能设备的比例,得到预定区域内的智能设备数量;之后将预定区域内的智能设备数量除以预定区域内的智能设备覆盖率,得到预定区域内的人口数量;最后基于预定区域内的人口数量,向终端推送信息。

在本实现方式中,获取定位日志时由于某些原因可能只获取到部分常驻的定位设备的定位日志,从而根据获取的定位日志得到的智能设备数量也仅为部分常驻的定位设备的数量,因此可以根据预定区域内的常驻设备数量和预定区域内的常驻设备数量相对于预定区域内常驻的定位设备的比例(也即预定区域内的常驻设备覆盖率),获取定位设备数量;进一步地,可以根据预定区域内的常驻设备数量和常驻设备数量占安卓设备的比例(也即定位日志的应用在安卓设备中的覆盖率),来获取安卓设备数量;之后,可以进一步根据预定区域内的安卓设备数量和预定区域内的安卓设备占智能设备的比例,来获取预定区域内的智能设备数量;之后,再基于预定区域内的智能设备数量和预定区域内智能设备占所有移动终端设备的比例(也即智能设备覆盖率),来获取持有移动终端设备的人口数量;最后基于预定区域内的人口数量,向终端推送信息。

本申请上述实施例提供的推送信息的方法,可以首先基于终端设备的定位库中预定时间段内终端设备的定位日志,确定终端设备的常驻点库;从所述终端设备的定位库中,获取位于各预定行政区域内的常驻设备数量;从所述终端设备的常驻点库中,获取位于预定地点的常驻设备数量;最后基于所述预定行政区域内的常驻设备数量和/或所述预定地点的常驻设备数量,向终端推送信息,从而降低了推送信息的运营成本、扩大了推送信息的覆盖范围、提高了推送信息的效率较高且推送信息的精准度较高。

进一步参考图3,图3示出了基于终端设备的定位库中预定时间段内终端设备的定位日志确定终端设备的常驻点库的方法的一个实施例的流程300。该基于终端设备的定位库中预定时间段内终端设备的定位日志,确定终端设备的常驻点库的方法,包括以下步骤:

在步骤301中,基于终端设备的定位库中预定时间段内终端设备的定位日志,聚类各个终端设备的轨迹,得到各个终端设备的密度簇。

在本实施例中,在聚类各个终端设备的轨迹以得到各个终端设备的密度簇时,可以采用现有技术或未来发展的技术中的可以聚类密度簇的方法来实现,本申请对此不做限定。例如,可以采用密度聚类算法DBScan、基于密度的聚类算法DENCLUE、排序点生成簇结构算法OPTICS等。

在步骤302中,从各个终端设备的密度簇内,提取各个终端设备的时间分布特征和WIFI特征。

在本实施例中,考虑到终端设备的常驻地点在不同时间出现的特点不同,例如家庭所在的密度簇在晚上22点钟之后至早上7点钟之前的时间段内分布比重较高,公司所在的簇在10点钟至17点钟的时间段内分布比重较高,因此可以提取的各个终端设备的时间分布特征和WIFI特征,以便后续对提取的特征采用分类算法进行分类,得到设备的常驻点(家或公司)。在这里,应当理解,上述举例中的时间段划分仅为示例性的,也可以修改为其它时间段,例如家庭所在密度簇也可以在晚上9点钟之后至早上8点钟之前的时间段内分布比重较高,而公司所在的簇在早上8点钟之后至下午6点钟之前的时间段内分布比重较高等。

在步骤303中,基于各个终端设备的时间分布特征和WIFI特征,确定各个终端设备的常驻地点。

在本实施例中,在得到各个终端设备的时间分布特征和WIFI特征之后,可以采用分类算法根据时间分布特征所指示的时间段以及WIFI特征所指示的地点信息,确定各个终端设备的常驻地点。

示例性的,如图4a所示,图4a示出了单台设备两个月内的定位轨迹示意图。本申请基于终端设备的定位库中预定时间段内终端设备的定位日志,确定终端设备的常驻点库的方法,可以基于图4a中由两个月内的定位日志得到的定位轨迹410,对单台设备的轨迹(p1,p2……,pi)使用密度聚类算法DBScan,找出所有的密度簇(cluster1,cluster2,……clustern),在每个簇内提取时间分布、WIFI特征,例如家所在的簇其早上或晚上时间分布比重高,公司所在的簇10-17点时间段内分布比重高,然后对所有特征使用随机森林randomforest进行分类,挖掘出设备的常驻点家或公司,从而得到如图4b所示的聚类单台设备两个月内的定位轨迹得到的聚类簇。从图4b可知,根据聚类簇420的特征,可以得到该设备的用户的家在花梗胡同1号院。

返回图3,在步骤304中,基于各个终端设备的常驻地点,得到各个终端设备的常驻点库。

在本实施例中,在得到各个终端设备的常驻地点之后,将各个终端设备的常驻地点添加至数据库中,可以得到各个终端设备的常驻点库。

本申请上述实施例提供的基于终端设备的定位库中预定时间段内终端设备的定位日志确定终端设备的常驻点库的方法,实现了快速准确的确定终端设备的常驻点库。

进一步参考图5,图5示出了从终端设备的定位库中获取位于各预定行政区域内的常驻设备数量的方法的一个实施例的流程500。该从终端设备的定位库中获取位于各预定行政区域内的常驻设备数量的方法,包括以下步骤:

在步骤501中,若预定区域为预定级别的行政区域,从终端设备的定位库中,确定各终端设备在各预定级别的行政区域内的定位天数。

在本实施例中,可以从终端设备的定位库中,判定定位库中的数据所指示的位置分别属于哪个预定级别的行政区域,之后根据判定结果统计各预定级别的行政区域内的定位天数。

在步骤502中,将从各终端设备在各预定级别的行政区域内的定位天数中提取的具有最多定位天数的行政区域分别作为各终端设备的常驻行政区域。

在本实施例中,在统计各终端设备在各预定级别的行政区域内的定位天数之后,可以从每个终端设备的统计的结果中选取具有最多定位天数的行政区域,并将选取的具有最多定位天数的行政区域作为该终端设备的常驻行政区域。

在步骤503中,基于各终端设备的常驻行政区域,确定位于预定区域内的常驻设备数量。

在本实施例中,在得到各终端设备的常驻行政区域之后,可以将各终端设备的常驻行政区域按照各行政区域进行统计,从而得到位于预定区域内的常驻设备数量。

在本实施例的一些可选实现方式中,从终端设备的定位库中获取位于各预定行政区域内的常驻设备数量可以包括:若预定区域为省级行政区域,可以从终端设备的定位库中,获取各终端设备在各省的定位天数;之后,将从各终端设备在各省的定位天数中提取的具有最多定位天数的省份作为各终端设备的常驻省份;最后,基于各终端设备的常驻省份,获取位于各省级行政区域内的常驻设备数量。

通过本实现方式的从终端设备的定位库中获取位于各预定行政区域内的常驻设备数量的方法,可以获取位于各省级行政区域内的常驻设备数量,获取数据的效率和精度较高,且获取数据的准确性较高。

在本实施例的一些可选实现方式中,从终端设备的定位库中获取位于各预定行政区域内的常驻设备数量还可以包括:若预定区域为市级行政区域,可以获取各终端设备在各终端设备的常驻省份内各城市的定位天数;之后,将从各终端设备在各终端设备的常驻省份内各城市的定位天数中提取的具有最多定位天数的城市作为各终端设备的常驻城市;最后,基于各终端设备的常驻城市,获取位于各市级行政区域内的常驻设备数量。

通过本实现方式的从终端设备的定位库中获取位于各预定行政区域内的常驻设备数量的方法,可以获取位于各市级行政区域内的常驻设备数量,获取数据的效率和精度较高,且获取数据的准确性较高。

在本实施例的一些可选实现方式中,从终端设备的定位库中获取位于各预定行政区域内的常驻设备数量还可以包括:若预定区域为区县级行政区域,可以获取各终端设备在各终端设备的常驻城市内各区县的定位天数;之后,将从各终端设备在各终端设备的常驻城市内各区县的定位天数中提取的具有最多定位天数的区县作为各终端设备的常驻区县;最后,基于各终端设备的常驻区县,获取位于各区县级行政区域内的常驻设备数量。

通过本实现方式的从终端设备的定位库中获取位于各预定行政区域内的常驻设备数量的方法,可以获取位于各区县级行政区域内的常驻设备数量,获取数据的效率和精度较高,且获取数据的准确性较高。

本申请上述实施例提供的从终端设备的定位库中,获取位于各预定行政区域内的常驻设备数量的方法,获取数据的效率和精度较高,且获取数据的准确性较高。

进一步参考图6,图6示出了根据本申请的推送信息的方法的一个实施例的示例性应用场景的流程图。

如图6所示,推送信息的方法600包括以下步骤:

在步骤601中,获取定位日志,之后执行步骤602和步骤603;

在步骤602中,基于定位日志,定位终端设备的常驻点库,之后执行步骤604和步骤605;

在步骤603中,基于定位日志,定位省、市、区定位设备数量,之后执行步骤604;

在步骤604中,基于省、市、区定位设备数量,确定省、市、区内常驻点库,之后执行步骤606;

在步骤605中,从定位设备的常驻点库,获取位于各区域内的常驻点库,之后执行步骤606;

在步骤606中,基于各区域内的常驻点库或省、市、区内常驻点库,确定各区域内常驻设备数量,之后执行步骤607;

在步骤607中,根据各区域内常驻设备数量,确定各区域内定位设备数量,之后执行步骤609;

在步骤608中,确定获取定位日志的应用在安卓设备中的覆盖率,之后执行步骤609;

在步骤609中,基于区域内定位设备数量和获取定位日志的应用在安卓设备中的覆盖率,确定各区域内的安卓设备数量,之后执行步骤614;

在步骤610中,获取预定应用日志;

在步骤611中,基于预定应用日志,统计预定应用在各省、市、区内安卓设备的应用数量,之后执行步骤613;

在步骤612中,基于预定应用日志,统计预定应用在各省、市、区内iOS设备的应用数量,之后执行步骤614;

在步骤613中,根据定应用在各省、市、区内安卓设备的应用数量和预定应用在省、市、区内iOS设备的应用数量,计算在各省、市、区内的安卓占比,之后执行步骤614;

在步骤614中,基于区域内的安卓设备数量和在各省、市、区内的安卓占比,计算各区域内的智能设备数量,之后执行步骤619;

在步骤615中,获取各省人均可支配收入,之后执行步骤618;

在步骤616中,获取各省城镇化程度,之后执行步骤618;

在步骤617中,获取各省16-64岁人口比例,之后执行步骤618;

在步骤618中,对各省人均可支配收入、各省城镇化程度和各省16-64岁人口比例进行线性回归,确定各省智能设备覆盖率,之后执行步骤619;

在步骤619中,根据区域内智能设备数量和各省智能设备覆盖率,确定区域内人口数,之后执行步骤620;

在步骤620中,根据区域内人口数,向终端推送信息。

在本应用场景中,示例性的,可以基于两个月内的定位日志,对每台设备的轨迹(p1,p2……,pi)使用DBScan密度聚类算法找出所有的密度簇(cluster1,cluster2,……clustern),在每个簇内提取时间分布、WIFI特征,例如家所在的簇其早上或晚上时间分布比重高,公司所在的簇10-17点时间段内分布比重高,然后对所有特征使用随机森林random forest进行分类,挖掘出设备的常驻点家或公司。

在得到设备的常驻点之后,可以基于设备两个月内的定位日志,按照如下人工规则计算终端设备的常驻省、市、区,而后便能统计出各个省、市、区的定位设备数量。

在统计各个省、市、区的定位设备数量时,可以根据预设规则判断定位设备常驻的省份,在常驻省份内判断常驻城市,在常驻城市内判断常驻区县等。示例性的,预设规则可以为:假定定位设备在各省的定位天数为{Pi|i=1,2,……n,i代表不同省},Pa=max(Pi),a即为定位设备常驻省份。假定定位设备在常驻省份a内各城市的定位天数为{Ci|i=1,2,……n,i代表不同市},Cb=max(Ci),b即为定位设备常驻城市。考虑到在大城市里,用户居住和工作会在不同区县里,因此每天会在多个区县内发生定位。为了挖掘设备常驻的区县,可以只统计设备在晚7点到早7点这段时间内的定位分布,因为这段时间内人基本上是在家。假定定位设备在常驻城市b内晚7点到早7点在各区县的定位天数为{Di|i=1,2,……n,i代表不同区县},Dc=max(Di),c即为定位设备常驻区县。

之后,可以根据安装于安卓操作系统和iOS操作系统的预定应用,确定预定应用在各城市的安卓、iOS比例,并将确定的比例作为各城市智能设备的安卓、iOS的比例。例如,通过使用5个月内预定应用的安卓端、iOS端的行为日志,按省、市、区粒度统计出去重后的安卓用户总数A,iOS用户总数B,则安卓比=A/(A+B)(也即上述的安卓设备占智能设备的比例)。在这里,由于预定应用未能覆盖全部智能设备用户,同时存在Android、iOS用户使用频率不一致,不同用户的活动范围大小不一等因素,因此通过拉长分析的时间周期以获得较为稳定的安卓比。

考虑到各个地域的经济、老龄化程度不一,智能设备在人口中的覆盖率不等,在经济发达、城镇化程度越高、年轻人越多的地区,智能设备的覆盖率越高。因此,可以采用统计局公布的人均可支配收入、城镇化程度以及16-60岁人口的比例等因素,来线性回归出不同省份的智能设备覆盖率。例如:设定y=β01×x12×x23×x3,βi(i=0,1,2,3)指线性系数,xi(i=1,2,3分别代表人均可支配收入、城镇化程度、16-60岁人口比例),y代表智能设备覆盖率。

之后,可以根据区域内的智能设备数量和各省智能机的覆盖率,计算区域A内的人口数量:首先,从1中所挖掘出的定位设备常驻点库中,统计出区域A内的常驻点数量=X。接着,根据步骤510、步骤520中的定位设备常驻点库以及省、市、区定位设备数量,计算各个省、市、区的常驻设备覆盖率,假设区域A所在区县的常驻设备覆盖率为λ1,则区域A内定位设备数量=X/λ1;然后,若预设应用在安卓设备的覆盖率为λ2,则区域A内安卓设备数=X/(λ1×λ2)。之后,可以计算出各省、市、区的安卓智能设备占比,假设区域A所在的区县的安卓占比为λ3,则区域A内智能设备数量=X/(λ1×λ2×λ3)。

最后,可以根据上述各省的智能设备覆盖率y,得到区域A所在省的智能设备覆盖率为λ4,则区域A内人口数量=X/(λ1×λ2×λ3×λ4)。

本申请上述应用场景提供的推送信息的方法,在城市人口活跃度持续增强,且呈现多元迁徙、随机集中的特征下,可以利用大数据的终端设备的定位日志,全面、实时的映射人口居住、工作活动及其规模。从而可以挖掘海量人群的真实行为,包括休闲区域分布、通勤分析、交通起止点调查分析和实时客流,不仅可以用地理、位置大数据和城市大数据处理引擎化数据为城市管理服务,而且可提供极致体验的空间可视化技术和科学精准的监控预测服务,方便向决策者提供城市建设、区域发展、基础设施建设、综合交通组织方面的依据,从而实现真正意义上的数字化透明城市,发挥人口大数据在城市研究、城市规划、城市管理、决策咨询方面的价值。

进一步参考图7,作为对上述方法的实现,本申请提供了一种推送信息的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,由此,上文针对方法描述的操作和特征同样适用于装置700及其中包含的单元,在此不再赘述。该装置具体可以应用于各种电子设备中。

如图7所示,本实施例的推送信息的装置700包括:常驻点库确定单元710,用于基于终端设备的定位库中预定时间段内终端设备的定位日志,确定终端设备的常驻点库;第一数量确定单元720,用于从终端设备的定位库中,获取位于各预定行政区域内的常驻设备数量;第二数量确定单元730,用于从终端设备的常驻点库中,获取位于预定地点的常驻设备数量;信息推送单元740,用于基于预定行政区域内的常驻设备数量和/或预定地点的常驻设备数量,向终端推送信息。

在本实施例的一些可选实现方式中(图中未示出),常驻点库确定单元包括:轨迹聚类子单元,用于基于终端设备的定位库中预定时间段内终端设备的定位日志,聚类各个终端设备的轨迹,得到各个终端设备的密度簇;特征提取子单元,用于从各个终端设备的密度簇内,提取各个终端设备的时间分布特征和WIFI特征;地点确定子单元,用于基于各个终端设备的时间分布特征和WIFI特征,确定各个终端设备的常驻地点;点库确定子单元,用于基于各个终端设备的常驻地点,得到各个终端设备的常驻点库。

本实现方式中的装置实施例与图3所示的方法实施例相对应,由此,上文针对方法描述的操作和特征同样适用于本实现方式中的装置及其中包含的单元,在此不再赘述。该装置具体可以应用于各种电子设备中。

在本实施例的一些可选实现方式中,第一数量确定单元包括:天数确定子单元,用于若预定区域为预定级别的行政区域,从终端设备的定位库中,确定各终端设备在各预定级别的行政区域内的定位天数;区域确定子单元,用于将从各终端设备在各预定级别的行政区域内的定位天数中提取的具有最多定位天数的行政区域分别作为各终端设备的常驻行政区域;数量确定子单元,用于基于各终端设备的常驻行政区域,确定位于预定区域内的常驻设备数量。

本实现方式中的装置实施例与图5所示的方法实施例相对应,由此,上文针对方法描述的操作和特征同样适用于本实现方式中的装置及其中包含的单元,在此不再赘述。该装置具体可以应用于各种电子设备中。

在本实施例的一些可选实现方式中,第一数量确定单元包括:天数确定子单元进一步用于:若预定区域为省级行政区域,从终端设备的定位库中,获取各终端设备在各省的定位天数;区域确定子单元进一步用于:将从各终端设备在各省的定位天数中提取的具有最多定位天数的省份作为各终端设备的常驻省份;数量确定子单元进一步用于:基于各终端设备的常驻省份,获取位于各省级行政区域内的常驻设备数量。

在本实施例的一些可选实现方式中,第一数量确定单元还包括:天数确定子单元进一步用于:若预定区域为市级行政区域,获取各终端设备在各终端设备的常驻省份内各城市的定位天数;区域确定子单元进一步用于:将从各终端设备在各终端设备的常驻省份内各城市的定位天数中提取的具有最多定位天数的城市作为各终端设备的常驻城市;数量确定子单元进一步用于:基于各终端设备的常驻城市,获取位于各市级行政区域内的常驻设备数量。

在本实施例的一些可选实现方式中,第一数量确定单元还包括:天数确定子单元进一步用于:若预定区域为区县级行政区域,获取各终端设备在各终端设备的常驻城市内各区县的定位天数;区域确定子单元进一步用于:将从各终端设备在各终端设备的常驻城市内各区县的定位天数中提取的具有最多定位天数的区县作为各终端设备的常驻区县;数量确定子单元进一步用于:基于各终端设备的常驻区县,获取位于各区县级行政区域内的常驻设备数量。

在本实施例的一些可选实现方式中,信息推送单元包括:定位设备确定子单元,用于将预定区域内的常驻设备数量除以预定区域内的常驻设备覆盖率,得到预定区域内的定位设备数量;安卓设备确定子单元,用于将预定区域内的定位设备数量除以预定区域内获取定位日志的应用在安卓设备中的覆盖率,得到预定区域内的安卓设备数量;智能设备确定子单元,用于将预定区域内的安卓设备数量除以预定区域内的安卓设备占智能设备的比例,得到预定区域内的智能设备数量;人口数量确定子单元,用于将预定区域内的智能设备数量除以预定区域内的智能设备覆盖率,得到预定区域内的人口数量;推送信息子单元,用于基于预定区域内的人口数量,向终端推送信息。

下面参考图8,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统800的结构示意图。

如图8所示,计算机系统800包括中央处理单元(CPU)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有系统800操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。

以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口808。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。

特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时,执行本申请的方法中限定的上述功能。

附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个单元、程序段、或代码的一部分,所述单元、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括常驻点库确定单元、第一数量确定单元、第二数量确定单元和信息推送单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,常驻点库确定单元还可以被描述为“基于终端设备的定位库中预定时间段内终端设备的定位日志,确定终端设备的常驻点库的单元”。

作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:基于终端设备的定位库中预定时间段内终端设备的定位日志,确定终端设备的常驻点库;从终端设备的定位库中,获取位于各预定行政区域内的常驻设备数量;从终端设备的常驻点库中,获取位于预定地点的常驻设备数量;基于预定行政区域内的常驻设备数量和/或预定地点的常驻设备数量,向终端推送信息。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1