一种目标用户位置数据的处理方法及装置的制作方法

文档序号:7554651阅读:329来源:国知局
专利名称:一种目标用户位置数据的处理方法及装置的制作方法
技术领域
本发明涉及计算机应用技术领域,尤其涉及一种目标用户位置数据的处理方法及
装置
背景技术
目前的信息推送技术可以通过自动传送信息给目标用户,来减少目标用户在网络上搜索的时间。具体可以根据目标用户的兴趣来搜索、过滤信息,并将其定期推给目标用户,帮助目标 用户高效率地发掘有价值的信息。目前应用较多的是根据目标用户的位置数据来向目标用户推送其所在位置附近的各类购物、旅游、住宿以及商店信息等。推送服务器获取到的目标用户的位置数据大多是通过基站定位、wifi热点定位以及GPS (Global Positioning System,全球定位系统)定位等定位技术获取。通过这些现有方式获取的位置数据主要为包括目标用户当前的位置坐标的数据。仅根据这些原始的位置数据,服务器无法根据用户的行为执行相应的基于用户位置的服务。

发明内容
本发明实施例所要解决的技术问题在于,提供一种目标用户位置数据的处理方法及装置,可快速、准确地对目标用户位置数据进行分析处理得到用于描述目标用户行为的信息,以便于实现根据用户行为进行相应的基于用户位置的服务。为了解决上述技术问题,本发明实施例提供了一种目标用户位置数据的处理方法,包括:获取目标用户在预设时间范围阈值内的各位置数据,得到位置数据集合,其中,所述位置数据集合中每一个位置数据的数据格式中至少包括位置坐标、发生时间值;根据每一个位置数据中包括的位置坐标,确定所述目标用户的聚集区;根据确定的聚集区以及每一个位置数据包括的发生时间值,确定所述目标用户在每一个位置数据对应位置处的用户行为描述信息,所述用户行为描述信息包括该目标用户在不同时间场景下在确定的对应聚集区的出现频率。相应地,本发明实施例还提供了一种目标用户位置数据的处理装置,包括:获取模块,用于获取目标用户在预设时间范围阈值内的各位置数据,得到位置数据集合,其中,所述位置数据集合中每一个位置数据的数据格式中至少包括位置坐标、发生时间值;确定模块,用于根据每一个位置数据中包括的位置坐标,确定所述目标用户的聚集区;处理模块,用于根据确定的聚集区以及每一个位置数据包括的发生时间值,确定所述目标用户在每一个位置数据对应位置处的用户行为描述信息,所述用户行为描述信息包括该目标用户在不同时间场景下在确定的对应聚集区的出现频率。本发明实施例能够在用户原始的位置数据的基础上确定用户的聚集区,根据用户聚集区快速、准确地得到关于该用户的行为描述信息,方便后续根据用户的行为较好地实现针对该用户的信息推送应用等基于用户位置的服务。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本发明实施例的一种目标用户位置数据的处理方法的流程示意图;图2是本发明实施例的另一种目标用户位置数据的处理方法的流程示意图;图3是本发明实施例的获取目标用户的位置数据的其中一种方法的流程示意图;图4是本发明实施例的确定 目标用户的聚集区的其中一种具体方法的流程示意图;图5是确定目标用户的聚集区的其中一种示例图;图6是本发明实施例的确定目标用户的用户行为描述信息的其中一种具体方法的流程示意图;图7是本发明实施例的一种目标用户位置数据的处理装置的结构示意图;图8是本发明实施例的另一种目标用户位置数据的处理装置的结构示意图;图9是图8中的获取模块的其中一种具体结构示意图;图10是图8中的确定模块的其中一种具体结构示意图;图11是图8中的处理模块的其中一种具体结构示意图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。请参见图1,是本发明实施例的一种目标用户位置数据的处理方法的流程示意图,本发明实施例的所述方法可应用于各类型的基于LBS(Location Based Service,基于位置的服务)的信息推送服务器或者应用在用于对员工工作进行管理的服务器中,具体的,本发明实施例的所述方法包括:SlOl:获取目标用户在预设时间范围阈值内的各位置数据,得到位置数据集合,其中,所述位置数据集合中每一个位置数据的数据格式中至少包括位置坐标、发生时间值;可以通过采用GPS、基站定位等技术实时地对目标用户的移动终端等设备进行定位,目标用户的位置数据可对应存储在其所使用的各类应用服务器中,例如即时通讯服务器、社交应用服务器等。在预设时间范围阈值到达时,从各类服务器中获取预设时间范围阈值内,即预设的统计周期内目标用户的历史位置数据,例如获取目标用户当月的各个时间点的位置数据,具体可以以每天的整点时间进行统计,获取每天的整点时间时,该目标用户的位置数据。
每一个位置数据的格式至少包括位置坐标和发生时间值,具体的,位置数据的格式可以为:uin-lat-lng-time-type,其中uin:号码(目标用户的标识、如即时通信账号等),Iat:经讳度(位置坐标),Ing:精度,time:发生时刻,type:业务类型。在获取到目标用户的位置数据后,可以进行初步的数据清理操作得到所述位置数据集合,清理操作包括对获取到的各位置信息进行去重操作,例如根据发生时间值清理掉一些在相同或者相近时间点处于同一位置的位置数据,和/或不完整信息的去除操作,例如将位置坐标不全或者发生时刻丢失的位置数据去除。S102:根据所述位置数据集合中每一个位置数据中包括的位置坐标,确定所述目标用户的聚集区;在所述S102中,根据每一个位置数据中的位置坐标来确定聚集区,聚集区的确定原则为:每一个聚集区中任何两个位置坐标之间的距离在一定距离范围内(例如I千米的距离内),并且聚集区内的位置坐标点的数量大于一定阈值(例如20个)。在所述S102中确定出的聚集区可能包括多个,其中可能包括该目标用户工作、学习、生活对于的聚集区。S103:根据确定的聚集区以及每一个位置数据包括的发生时间值,确定所述目标用户在每一个位置数据对应位置处的用户行为描述信息,所述用户行为描述信息包括该目标用户在不同时间场景下在确定的对应聚集区的出现频率。根据该目标用户的办公区域所在的区域,将该目标用户的聚集区中落入在为办公区域预置区域内的聚集区作为工 作聚集区,在为学习区域预置的区域内的聚集区作为学习聚集区,等等。然后根据位置数据中包括的发送时间值,计算该目标用户在工作日期间和非工作日期间等时间场景下,出现在所述工作聚集区、学习聚集区以及生活聚集区的频率,得到该目标用户的用户行为描述信息。另外,时间场景还可以为8点到12点的上午时间场景、12点到14点的中午时间场景以及14点子18点的下午时间场景,以及晚上时间场景等。例如,假设确定的工作聚集区中的位置数据有200个数据,而根据每一个位置数据的发生时间值,确定出在工作日期间在工作聚集区中的发生时间值为早上8点的位置数据有20个,那么,由于在本次统计周期内(例如本月)工作日一共有22天,那么,该目标用户在早上8点钟在工作聚集区中的出现频率为20/22*100%=91%。那么对于发生时间值在早上8点钟、且位于所述工作聚集区中的每一个位置数据的用户行为描述信息为91%。进一步的,如果统计得到在本次统计周期内非工作日有8天,而在非工作日期间在工作聚集区中的发生时间值为早上8点的位置数据有2个,那么,该目标用户在早上8点钟在工作聚集区中的非工作日出现频率为2/8*100%=25%。本发明实施例能够在用户原始的位置数据的基础上确定用户的聚集区,根据用户聚集区快速、准确地得到关于该用户的行为描述信息,方便后续根据用户的行为较好地实现针对该用户的信息推送应用等基于用户位置的服务。再请参见图2,是本发明实施例的另一种目标用户位置数据的处理方法的流程示意图,本发明实施例的所述方法包括:S201:获取目标用户在预设时间范围阈值内的各位置数据,得到位置数据集合,其中,所述位置数据集合中每一个位置数据的数据格式中至少包括位置坐标、发生时间值;S202:根据所述位置数据集合中每一个位置数据中包括的位置坐标,确定所述目标用户的聚集区;
S203:根据确定的聚集区以及每一个位置数据包括的发生时间值,确定所述目标用户在每一个位置数据对应位置处的用户行为描述信息,所述用户行为描述信息包括该目标用户在不同时间场景下在确定的对应聚集区的出现频率。S204:根据确定所述目标用户在每一个位置数据对应位置处的用户行为描述信息,得到所述目标用户的位置状态数据;所述位置状态数据的数据格式中至少包括位置坐标、发生时间值以及用户行为描述信息。上述的S201至S204的实现方式与上一实施例中的SlOl至S103的实现方式相同,在此不赘述。在所述S204中,输出的每一个位置数据的位置状态数据的数据格式具体可以为:uin、lat、lng、wt0_c、…、wt23_c、nwt0_c、...、nwt23_c (uin:目标用户,Iat:讳度,lng:精度,wtn_c:工作日时间模式中η时段的频率也即置信度,nwtn_c:非工作日时间模式中η时段的也即置信度)。根据该格式的位置数据,可以方便后续直接统计确定目标用户的工作情况。
具体的,请参见图3,是本发明实施例的获取目标用户的位置数据的其中一种方法的流程示意图,本发明实施例的所述方法对应于SlOl或S201,所述方法包括:S301:获取目标用户在预设时间范围阈值内的各位置信息;S302:对获取到的各位置信息进行清理操作得到所述目标用户在预设时间范围阈值内的位置数据集合,所述清理操作包括对获取到的各位置信息进行去重操作和/或不完整信息的去除操作。可以从手机即时通讯、手机地图、手机社交网等业务服务器中抽取该目标用户的历史位置数据,并且针对每个位置数据的特点,设置转换逻辑,并且最终转换成本系统的数据格式:uin-lat-lng-time-type (uin:号码,Iat:经纟韦度,Ing:精度,time:发生时刻,type:业务类型)。完成位置数据的抽取和转换后,由于是在不同的服务器中获取的目标用户的位置数据,所以,需要根据发生的时间间隔去除重复的位置数据,例如,将两者相隔I分钟且位置坐标相同的位置数据去除一个,仅保留一个位置数据。由于数据在服务器中存储以及传输的过程中可能导致数据丢失,因此需要去除残缺的脏数据,例如将位置坐标缺失或者发生时间值缺失的位置数据去掉。得到最终的所述目标用户的位置数据。再请参见图4,是本发明实施例的确定目标用户的聚集区的其中一种具体方法的流程示意图,本发明实施例的所述方法对应于上述S102或者S202,所述方法包括:S401:根据所述位置数据集合中每一个位置数据的位置坐标,并根据预设的坐标点距离阈值,确定多个初始聚集区;S402:将所述多个初始聚集区中位置坐标的数量大于预设的数量阈值的初始聚集区作为所述目标用户的聚集区。具体的,可以将所述目标用户的历史位置数据(如统计周期一个月内的位置数据)进行层次聚类,计算出聚集的区域,排除散点,计算的规则为:聚集区域之间的无重合,聚集区域内的密度>20 (即历史位置点数>20),且各点距离中心不超过lkm。根据该规则,可以从可能的多个聚集区中,得到密度相对较大的聚集区。例如,可以参见图5,是确定的聚集区的其中一种示例图,图5中,X轴坐标代表经度,Y轴坐标代表纬度。在图5中确定了两个聚集区,可能包括目标用户的位于预置的办公区域内的工作聚集区以及位于预置的生活区域内的生活聚集区。再请参见图6,是本发明实施例的确定目标用户的用户行为描述信息的其中一种具体方法的流程示意图,本发明实施例的所述方法可应用于上述的S103或者S203,所述方法包括:S501:将所述目标用户的聚集区中的位于预置的工作区域内聚集区标记为工作聚集区;同样可以得到用户的生活聚集区、学习聚集区等等。S502:计算工作日期间位于所述工作聚集区中的每一个位置数据的出现频率,并计算非工作日期间位于所述工作聚集区中的每一个位置数据的出现频率;即根据工作聚集区中每一个位置数据的发生时间值,确定在预设的工作日期间(根据当月日历确定)和非工作日期间的出现在工作聚集区中的频率。S503:计算工作日期间位于所述工作聚集区之外的每一个位置数据的出现频率,并计算非工作日期间位于所述工作聚集区之外的每一个位置数据的出现频率。即根据工作聚集区以外的每一个位置数据中的发生时间值,确定在预设的工作日期间(根据当月日历确定)和非工作日期间的出现在工作聚集区外的频率。在本发明实施例中,可以简单地将目标用户的聚集区区分为工作聚集区以及非工作聚集区,以此来对目标用户的位置数据进行关于工作情况的标记以完成目标用户工作情况的统计,在其他 实施例中,还可以进一步地细化为工作聚集区、生活聚集区、学习聚集区等,以对目标用户的位置数据进行关于工作、生活、学习等情况的标记以完成目标用户工作、生活、学习等情况的统计,实现过程与所述S501至S503类似,通过根据用户生活的区域和学习的区域得到相应的生活聚集区以及学习聚集区,然后对相应聚集区中的位置数据进行标记和统计。具体的,下图展示了一个用户在2012年11月份在办公区域的时间模式,工作日期间是指传统的周一至周五,而非工作日则为周末以及法定节假日等时期,用于进行统计的装置或者服务器可以根据系统时间以及内置的日历表来区分工作日期间和非工作日期间,并确定当月总的工作日和总的非工作日。非工作日期间表明用户基本在早上8点就到公司了,12点后外出(可能是就餐),50%的可能在13点回到办公室,14点继续工作,67%的可能是18点下班,33%的是可能要加班;从非工作日模式可以看到,用户在11月份有过2次加班,I次是从15点-18点,另外一次是从15-17点;表I:
权利要求
1.一种目标用户位置数据的处理方法,其特征在于,包括: 获取目标用户在预设时间范围阈值内的各位置数据,得到位置数据集合,其中,所述位置数据集合中每一个位置数据的数据格式中至少包括位置坐标、发生时间值; 根据所述位置数据集合中每一个位置数据中包括的位置坐标,确定所述目标用户的聚集区; 根据确定的聚集区以及每一个位置数据包括的发生时间值,确定所述目标用户在每一个位置数据对应位置处的用户行为描述信息,所述用户行为描述信息包括该目标用户在不同时间场景下在确定的对应聚集区的出现频率。
2.如权利要求1所述的方法,其特征在于,所述获取目标用户在预设时间范围阈值内的各位置数据,得到位置数据集合,包括: 获取目标用户在预设时间范围阈值内的各位置信息; 对获取到的各位置信息进行清理操作,得到所述目标用户在预设时间范围阈值内的位置数据集合,所述清理操作包括对获取到的各位置信息进行去重操作和/或不完整信息的去除操作。
3.如权利要求2所述的方法,其特征在于,所述根据所述位置数据集合中每一个位置数据中包括的位置坐标,确定所述目标用户的聚集区,包括: 根据所述位置数 据集合中每一个位置数据的位置坐标,并根据预设的坐标点距离阈值,确定多个初始聚集区; 将所述多个初始聚集区中位置坐标的数量大于预设的数量阈值的初始聚集区作为所述目标用户的聚集区。
4.如权利要求3所述的方法,其特征在于,所述根据确定的聚集区以及每一个位置数据包括的发生时间值,确定所述目标用户在每一个位置数据对应位置处的用户行为描述信息,包括: 将所述目标用户的聚集区中位于预置的工作区域内的聚集区标记为工作聚集区; 计算工作日期间位于所述工作聚集区中的每一个位置数据的出现频率,并计算非工作日期间位于所述工作聚集区中的每一个位置数据的出现频率; 计算工作日期间位于所述工作聚集区之外的每一个位置数据的出现频率,并计算非工作日期间位于所述工作聚集区之外的每一个位置数据的出现频率。
5.如权利要求1-4任意一项所述的方法,其特征在于,还包括: 根据确定的所述目标用户在每一个位置数据对应位置处的用户行为描述信息,得到所述目标用户的位置状态数据;所述位置状态数据的数据格式中至少包括位置坐标、发生时间值以及用户行为描述信息。
6.一种目标用户位置数据的处理装置,其特征在于,包括: 获取模块,用于获取目标用户在预设时间范围阈值内的各位置数据,得到位置数据集合,其中,所述位置数据集合中每一个位置数据的数据格式中至少包括位置坐标、发生时间值; 确定模块,用于根据所述位置数据集合中每一个位置数据中包括的位置坐标,确定所述目标用户的聚集区; 处理模块,用于根据确定的聚集区以及每一个位置数据包括的发生时间值,确定所述目标用户在每一个位置数据对应位置处的用户行为描述信息,所述用户行为描述信息包括该目标用户在不同时间场景下在确定的对应聚集区的出现频率。
7.如权利要求6所述的装置,其特征在于,所述获取模块包括: 获取单元,用于获取目标用户在预设时间范围阈值内的各位置信息; 清理单元,用于对获取到的各位置信息进行清理操作,得到所述目标用户在预设时间范围阈值内的位置数据集合,所述清理操作包括对获取到的各位置信息进行去重操作和/或不完整信息的去除操作。
8.如权利要求7所述的装置,其特征在于,所述确定模块包括: 第一确定子单元,用于根据所述位置数据集合中每一个位置数据的位置坐标,并根据预设的坐标点距离阈值,确定多个初始聚集区; 第二确定子单元,用于将所述多个初始聚集区中位置坐标的数量大于预设的数量阈值的初始聚集区作为所述目标用户的聚集区。
9.如权利要求7所述的装置,其特征在于,所述处理模块包括: 标记单元,用于将所述目标用户的聚集区中位于预置的工作区域内的聚集区标记为工作聚集区; 第一计算单元,用于计算工作日期间位于所述工作聚集区中的每一个位置数据的出现频率,并计算非工作日期间位于所述工作聚集区中的每一个位置数据的出现频率; 第二计算单元,用于计算工作日期间位于所述工作聚集区之外的每一个位置数据的出现频率,并计算非工作日期间位于所述工作聚集区之外的每一个位置数据的出现频率。
10.如权利要求6-9任一项所述的装置,其特征在于,还包括: 状态数据获取模块,用于根据确定所述目标用户在每一个位置数据对应位置处的用户行为描述信息,得到所述目标用户的位置状态数据;所述位置状态数据的数据格式中至少包括位置坐标、发生时间值以及用户行为描述信息。
全文摘要
本发明实施例公开了一种目标用户位置数据的处理方法及装置,其中,所述方法包括获取目标用户在预设时间范围阈值内的各位置数据,得到位置数据集合,其中,位置数据集合每一个位置数据的数据格式中至少包括位置坐标、发生时间值;根据每一个位置数据中包括的位置坐标,确定所述目标用户的聚集区;根据确定的聚集区以及每一个位置数据包括的发生时间值,确定所述目标用户在每一个位置数据对应位置处的用户行为描述信息,所述用户行为描述信息包括该目标用户在工作日期间和非工作日期间在对应聚集区的出现频率。采用本发明,可对目标用户位置数据进行分析处理得到用于描述目标用户行为的信息,以便实现根据用户行为进行相应的基于用户位置的服务。
文档编号H04W4/02GK103227821SQ20131011597
公开日2013年7月31日 申请日期2013年4月3日 优先权日2013年4月3日
发明者李玉煌, 贺鹏, 胡勇, 陈川, 聂晶 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1