一种用户查询方法及装置、电子设备及计算机存储介质与流程

文档序号:30491650发布日期:2022-06-22 02:04阅读:74来源:国知局
一种用户查询方法及装置、电子设备及计算机存储介质与流程

1.本发明涉及通信技术领域,尤其涉及一种用户查询方法及装置、电子设备及计算机存储介质。


背景技术:

2.随着轨道交通的快速发展,人们长距离出行变得越来越便捷且频繁,查询同行乘客以实现人物关联分析存在越来越多的需求场景,例如,强感染性病毒爆发期间查找与感染用户或疑似感染用户乘坐同一交通工具的乘客,以对其进行通知或执行相关防控措施;例如,运营商根据多次同行记录建立用户亲密关系人,以帮助完善客户画像等。
3.然而,现有同行乘客查询方法需要获取用户gps数据,导致查询难于实施,也影响了查询结果的准确性。


技术实现要素:

4.有鉴于此,本发明实施例期望提供一种用户查询方法及装置、电子设备及计算机存储介质。
5.第一方面,本发明实施例提供了一种用户查询方法,包括:
6.确定第一用户的第一移动轨迹信息;
7.根据所述第一移动轨迹信息,确定出与所述第一用户的第一移动轨迹满足相似性条件的待分析用户;
8.分别对所述第一移动轨迹信息及所述待分析用户的第二移动轨迹信息的位置信息进行区块划分,得到所述第一用户的第一区块时间序列和所述待分析用户的第二区块时间序列,其中,所述第一区块时间序列包括:第一移动轨迹经过的区块的时间序列;所述第二区块时间序列包括:所述待分析用户的第二移动轨迹经过的区块的时间序列;
9.根据所述第一区块时间序列和所述第二区块时间序列,确定所述第一用户和所述待分析用户在同一时间周期内位置信息满足位置相似条件的次数;
10.根据满足位置相似条件的次数,从所述待分析用户中查询出与所述第一用户具有相同行程的用户。
11.较佳地,所述根据所述第一区块时间序列和所述第二区块时间序列,确定所述第一用户和所述待分析用户在同一时间周期内位置信息满足位置相似条件的次数,包括:
12.根据所述第一区块时间序列和第二区块时间序列,确定所述第一用户和所述待分析用户在同一个所述时间周期内出现在同一个区块内的第一次数;
13.和/或,
14.根据所述第一区块时间序列和第二区块时间序列,确定所述第一用户和所述待分析用户在同一个所述时间周期内出现在不同区块内且距离小于距离阈值的第二次数。
15.较佳地,所述根据满足位置相似条件的次数,从所述待分析用户中查询出与所述第一用户具有相同行程的用户,包括:
16.根据所述第一次数和所述第一次数对应的第一权重,确定第一行程相似度值;
17.根据所述第二次数和所述第二次数对应的第二权重,确定所述第二行程相似度值;其中,所述第二权重小于所述第一权重;
18.根据所述第一行程相似度值和所述第二行程相似度值,确定所述待分析用户是否为与所述第一用户具有相同行程的用户。
19.较佳地,所述根据所述第一移动轨迹信息,确定出与所述第一用户的第一移动轨迹满足相似性条件的待分析用户,包括:
20.根据所述第一移动轨迹信息,确定出与所述第一用户同一个时间段出现在所述第一移动轨迹中起点位置所在基站覆盖范围内的第一用户集合;
21.根据所述第一移动轨迹信息,确定出与所述第一用户同一个时间段出现在所述第一移动轨迹中终点位置所在基站覆盖范围内的第二用户集合;
22.求取所述第一用户集合和所述第二用户集合的交集,得到所述待分析用户。
23.较佳地,所述第一用户的第一区块时间序列包括:
24.按照时间先后顺序排列的多个位置时间元素,一个所述位置时间元素包括:第一用户接入的基站所在位置归属的区块信息及接入对应所述基站的时间信息;
25.所述第二区块时间序列包括:
26.按照时间先后顺序排列的多个位置时间元素,一个所述位置时间元素包括:所述待分析用户接入的基站所在位置归属的区块信息及接入对应所述基站的时间信息。
27.较佳地,在所述根据所述第一区块时间序列和所述第二区块时间序列,确定所述第一用户和所述待分析用户在同一时间周期内位置信息满足位置相似条件的次数之前,所述方法还包括:
28.将所述第一区块时间序列和/或,所述第二区块时间序列的基站所在位置归属的区块信息相同的至少两个相邻的所述位置时间元素,合并为一个位置时间元素。
29.较佳地,所述将所述第一区块时间序列和/或,所述第二区块时间序列的基站所在位置归属的区块信息相同的至少两个相邻的所述位置时间元素,合并为一个位置时间元素,包括:
30.获取所述至少两个相邻的所述位置时间元素中的第一个所述位置时间元素的第一时间信息和最后一个所述位置时间元素的第二时间信息;
31.以所述第一时间信息和所述第二时间信息的平均值作为合并后的位置时间元素的时间信息,以所述至少两个相邻的所述位置时间元素的基站所在位置归属的区块信息作为合并后的位置时间元素的区块信息。
32.较佳地,在所述根据所述第一区块时间序列和所述第二区块时间序列,确定所述第一用户和所述待分析用户在同一时间周期内位置信息满足位置相似条件的次数之前,所述方法还包括:
33.根据所述位置时间元素中的区块信息得到编码序列;
34.所述第一用户和所述待分析用户在同一时间周期内位置信息满足位置相似条件的次数,包括:
35.满足位置相似条件的第一次数;其中,所述满足位置相似条件的第一次数为:在所述第一区块时间序列和所述第二区块时间序列中,编码序列相同且所述时间信息指示的时
间差在预设时长范围内的所述位置时间元素的对数。
36.较佳地,所述根据所述位置时间元素中的区块信息得到编码序列,包括:
37.将所述区块信息编码成所述编码序列的第一部分;
38.将所述基站所在位置的位置信息编码成所述编码序列的第二部分;
39.所述第一用户和所述待分析用户在同一时间周期内位置信息满足位置相似条件的次数,包括:
40.满足所述位置相似条件的第二次数,其中,所述满足位置相似条件的第二次数为:在所述第一区块时间序列和所述第二区块时间序列中,所述编码序列的第一部分不同、所述编码序列的第二部分对应的距离小于距离阈值,且所述时间信息指示时间差在预设时长范围内的所述位置时间元素的对数。
41.第二方面,本发明实施例提供了一种用户查询装置,包括:
42.第一确定模块,用于确定第一用户的第一移动轨迹信息;
43.第二确定模块,用于根据所述第一移动轨迹信息,确定出与所述第一用户的第一移动轨迹满足相似性条件的待分析用户;
44.区块化模块,用于分别对所述第一移动轨迹信息及所述待分析用户的第二移动轨迹信息的位置信息进行区块划分,得到所述第一用户的第一区块时间序列和所述待分析用户的第二区块时间序列,其中,所述第一区块时间序列包括:第一移动轨迹经过的区块的时间序列;所述第二区块时间序列包括:所述待分析用户的第二移动轨迹经过的区块的时间序列;
45.第三确定模块,用于根据所述第一区块时间序列和所述第二区块时间序列,确定所述第一用户和所述待分析用户在同一时间周期内位置信息满足位置相似条件的次数;
46.第四确定模块,用于根据满足位置相似条件的次数,从所述待分析用户中查询出与所述第一用户具有相同行程的用户。
47.第三方面,本发明实施例提供了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的信息处理程序,所述处理器执行所述信息处理程序时能够实现上述任一项提供的方法。
48.第四方面,本发明实施例提供了一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令;所述计算机可执行指令被执行后,能够实现上述任一项提供的方法。
49.本发明实施例的用户查询方法中,首先,基于基站位置信令确定的第一用户的第一移动轨迹信息,并确定满足相似性条件的待分析用户;然后,对第一用户和待分析用户的移动轨迹信息的位置信息进行区块划分,确定用户的区块时间序列;最后,基于用户的区块时间序列,通过判断第一用户和待分析用户满足位置相似条件的次数,确定待分析用户是否与第一用户具有相同行程。本发明实施例的用户查询方法,一方面,根据基站位置信令确定的用户的区块时间序列,无需获取用户gps数据,即可实现对用户的同行用户的查询;另一方面,通过对用户的移动轨迹信息的位置信息进行区块划分,基于区块确定第一用户的同行程用户,相对于基于精确的单个位置确定第一用户的同行程用户,可以将距离第一用户一定范围内的待分析用户也确定为同行程用户,降低了由于位置信号漂移导致的同行程用户漏查的概率,提高了查询结果完整性。
附图说明
50.图1为本发明实施例提供的第一种用户查询方法的流程示意图;
51.图2为本发明实施例提供的第二种用户查询方法的流程示意图;
52.图3为本发明实施例提供的第三种用户查询方法的流程示意图;
53.图4为本发明实施例提供的第四种用户查询方法的流程示意图;
54.图5为本发明实施例提供的第五种用户查询方法的流程示意图;
55.图6为本发明实施例提供的第六种用户查询方法的流程示意图;
56.图7为本发明实施例提供的第七种用户查询方法的流程示意图;
57.图8为本发明实施例提供的一种用户查询装置的结构示意图;
58.图9为本发明实施例提供的一种用户查询方法的具体示例。
具体实施方式
59.以下结合说明书附图及具体实施例对本发明的技术方案做进一步的详细阐述。
60.如图1所示,本发明实施例的一种用户查询方法,包括:
61.步骤s101:确定第一用户的第一移动轨迹信息;
62.步骤s102:根据所述第一移动轨迹信息,确定出与所述第一用户的第一移动轨迹满足相似性条件的待分析用户;
63.步骤s103:分别对所述第一移动轨迹信息及所述待分析用户的第二移动轨迹信息的位置信息进行区块划分,得到所述第一用户的第一区块时间序列和所述待分析用户的第二区块时间序列;
64.步骤s105:根据所述第一区块时间序列和所述第二区块时间序列,确定所述第一用户和所述待分析用户在同一时间周期内位置信息满足位置相似条件的次数;
65.步骤s106:根据满足位置相似条件的次数,从所述待分析用户中查询出与所述第一用户具有相同行程的用户。
66.在所述步骤s101中,基于基站位置信令,如位置更新信令,根据第一用户的用户标识,确定出第一用户接入过的所有基站的信息,该信息可以包括第一用户接入至基站的时间信息、离开基站的时间信息、基站的标识和/或基站的位置信息等,最后,将确定的所有基站的信息按时间先后顺序,形成以第一用户移动过程中所接入的基站为维度的第一移动轨迹信息。这里需要指出的是,本技术中所涉及的接入,均包括:空闲态ue的驻留、连接态ue的接入或者连接态ue的基站间切换。
67.例如,第一用户在移动过程中依次经过了标识为bts1、bts2

、btsn多个基站的覆盖范围,根据位置更新信令,可以确定第一用户在bts1、bts2

、btsn下的接入情况。如,第一用户分别在bts1、bts2

、btsn下接入的时间信息(包括接入至基站后的任意一个或多个时间,如起始时间、中间时间和/或终止时间等),最后,根据第一用户在各基站下的接入时间先后顺序,对bts1、bts2

、btsn进行排序,并结合每个基站的位置信息、时间信息,形成第一用户的第一移动轨迹信息。具体如下表1所示的一种第一移动轨迹信息:
68.表1第一移动轨迹信息
69.基站标识bts1bts2

btsn时间信息t1t2…
tn位置信息loc1loc2…
locn70.可以理解地,待分析用户的第二移动轨迹信息也可以采用上述确定第一用户的第一移动轨迹信息的方法进行确定。
71.在所述步骤s102中,根据步骤s101确定的第一移动轨迹信息,确定出与所述第一用户的第一移动轨迹满足相似性条件的待分析用户。这里,通过确定与第一用户的第一移动轨迹满足相似性条件的用户为待分析用户,确保待分析用户较大概率为与第一用户具有相同行程的用户。
72.与第一用户的第一移动轨迹满足相似性条件可以包括但不限于以下至少之一:
73.待分析用户和第一用户在同一个时间段内接入同一基站的次数达到一定阈值;
74.待分析用户和第一用户在同一个时间段内接入同一基站的时长总和达到一定阈值;
75.待分析用户和第一用户在同一个时间段内接入的指定的一个或多个基站等。
76.在所述步骤s103中,分别对所述第一移动轨迹信息及所述待分析用户的第二移动轨迹信息的位置信息进行区块划分,得到所述第一用户的第一区块时间序列和所述待分析用户的第二区块时间序列。其中,所述第一区块时间序列包括:第一移动轨迹经过的区块的时间序列,该时间序列是根据第一用户的第一移动轨迹经过的区块的时间确定的;所述第二区块时间序列包括:所述待分析用户的第二移动轨迹经过的区块的时间序列,该时间序列是根据待分析用户的第二移动轨迹经过的区块的时间确定的。
77.本实施例中,通过将第一移动轨迹和第二移动轨迹分别划分形成多个区块,实现对第一移动轨迹信息及第二移动轨迹信息的位置信息进行区块划分,形成包括第一移动轨迹的所有区块的信息的第一区块时间序列,以及,包括第二移动轨迹的所有区块的信息的第二区块时间序列。这里,多个区块可设置为形状相同的区块,每个区块通过不同的区块标识进行标识。
78.通过区块划分,将第一移动轨迹和第二移动轨迹基于位置分别对应至多个区块,得到以区块为粒度的第一用户的第一区块时间序列和待分析用户的第二区块时间序列,以便于确定第一移动轨迹和第二移动轨迹的移动轨迹相似性。同时,通过对区块的粒度大小的控制,还可以实现对移动轨迹的不同相似性程度要求的控制,如,将区块的粒度设计得较大,则在较大的区块粒度下确定两个轨迹的相似度,如第一用户的第一移动轨迹和待分析用户的第二移动轨迹存在同属于一个较大粒度的区块的位置,即判断两者相似,则相似度程度要求较低。
79.在所述步骤s105中,根据所述第一区块时间序列和所述第二区块时间序列,确定所述第一用户和所述待分析用户在同一时间周期内位置信息满足位置相似条件的次数。
80.本实施例中,根据第一用户的第一区块时间序列和待分析用户的第二区块时间序列,比对在同一时间周期内,第一区块时间序列和第二区块时间序列对应的位置信息是否满足位置信息相似条件,并确定满足位置相似条件的次数。
81.这里,满足位置信息相似条件,可以基于同一时间周期内第一区块时间序列和第二区块时间序列对应的位置信息的距离,和/或,同一时间周期内第一区块时间序列和第二区块时间序列对应的位置信息的所属的区块等进行判断。例如,同一时间周期内第一区块时间序列和第二区块时间序列对应的位置信息的距离小于预设距离阈值,和/或,同一时间
周期内第一区块时间序列和第二区块时间序列对应的位置信息的所属的区块的相同的数量占总的数量的比值超过预设比例。
82.在所述步骤s106中,根据满足位置相似条件的次数,确定所述待分析用户是否为与所述第一用户具有相同行程的用户,从而,从待分析用户中查询出与所述第一用户具有相同行程的用户。
83.这里,根据满足位置相似条件的次数,如,满足位置相似条件的次数是否大于预设次数阈值,确定所述待分析用户是否为与所述第一用户具有相同行程的用户。
84.本发明实施例的用户查询方法中,首先,基于基站位置信令确定的第一用户的第一移动轨迹信息,并确定满足相似性条件的待分析用户;然后,对第一用户和待分析用户的移动轨迹信息的位置信息进行区块划分,确定用户的区块时间序列;最后,基于用户的区块时间序列,通过判断第一用户和待分析用户满足位置相似条件的次数,确定待分析用户是否与第一用户具有相同行程。从而,通过本发明实施例的用户查询方法,无需获取用户gps数据,即可实现对用户的同行用户的查询。
85.一些实施例中,所述步骤s105,包括:
86.步骤s1051:根据所述第一区块时间序列和第二区块时间序列,确定出在同一个所述时间周期内出现在同一个区块化后的区块内的第一次数;
87.和/或,
88.步骤s1052:根据所述第一区块时间序列和第二区块时间序列,确定出在同一个所述时间周期内出现在不同区块内且距离小于距离阈值的第二次数。
89.本实施例中,一方面,根据所述第一区块时间序列和第二区块时间序列,确定同一个时间周期内第一用户和待分析用户接入的基站归属于区块化后同一个区块的第一次数;另一方面,根据所述第一区块时间序列和第二区块时间序列,确定同一个时间周期内第一用户和待分析用户接入的基站虽然不归属于区块化后的同一个区块,但两者接入的基站的距离小于距离阈值的第二次数。从而,基于区块的划分,将第一用户和待分析用户接入的基站归属于同一个区块的第一次数,作为第一用户和待分析用户满足位置相似条件的一个判断因素;同时,还将第一用户和待分析用户接入的基站归属于不同区块场景下,两者接入的基站之间的距离小于距离阈值的第二次数,作为第一用户和待分析用户满足位置相似条件的另一个判断因素。
90.本实施例中,根据实际应用的需要,区块可设置为矩形区块、正方形区块、六边形区块、不规则形状区块等。区块的长度和宽度可根据基站间距离进行确定,使得一个区块可包括至少2个基站的覆盖范围,优选设置一个区块包括3-5个基站的覆盖范围。
91.一些实施例中,如图2所示,所述步骤s106,包括:
92.步骤s1061:根据所述第一次数和所述第一次数对应的第一权重,确定第一行程相似度值;
93.步骤s1062:根据所述第二次数和所述第二次数对应的第二权重,确定所述第二行程相似度值;其中,所述第二权重小于所述第一权重;
94.步骤s1063:根据所述第一行程相似度值和所述第二行程相似度值,确定所述待分析用户是否为与所述第一用户具有相同行程的用户。
95.本实施例中,进一步引入第一权重和第二权重,以区别第一次数和第二次数两个
因素对于第一用户和待分析用户满足位置相似条件的判断结果的影响程度;且本实施例中使第二权重小于第一权重,例如,将第二权重设置为0.5,第一权重设置为1,从而,使第一次数对于第一用户和待分析用户满足位置相似条件的判断结果的影响程度,大于第二次数对于第一用户和待分析用户满足位置相似条件的判断结果的影响程度。
96.最终,基于第一次数和第一权重共同确定的第一行程相似度值,以及,第二次数和第二权重共同确定的第二行程相似度值,共同确定待分析用户是否为与所述第一用户具有相同行程的用户。
97.一些实施例中,如图3所示,所述步骤s102包括:
98.s1021:根据所述第一移动轨迹信息,确定出与所述第一用户同一个时间段出现在所述第一移动轨迹中起点位置所在基站覆盖范围内的第一用户集合;
99.s1022:根据所述第一移动轨迹信息,确定出与所述第一用户同一个时间段出现在所述第一移动轨迹中终点位置所在基站覆盖范围内的第二用户集合;
100.s1023:求取所述第一用户集合和所述第二用户集合的交集,得到所述待分析用户。
101.具体地,结合上述表1进行说明:首先,根据所述第一移动轨迹信息,确定第一用户在第一移动轨迹的起点位置时所在基站(bts1)和在终点位置时所在基站(btsn),且第一用户在bts1下的时间段为t
11
至t
12
,第一用户在btsn下的时间段为t
n1
至t
n2
;然后,基于基站位置信令,确定出第一时段(第一时段至少包括时间段为t
11
至t
12
的一个时刻)内bts1下接入的用户集合,记为第一用户集合,以及第二时段(第二时段至少包括时间段为t
n1
至t
n2
的一个时刻)内btsn下接入的用户集合,记为第二用户集合;最后,求取第一用户集合和第二用户集合的交集,交集内的用户均为待分析用户。
102.通过上述求取交集的步骤,确定出与第一用户在起点位置的基站和终点位置的基站都同时出现过的用户为待分析用户。
103.可以理解地,在确定待分析用户时,除选取第一移动轨迹中起点位置和终点位置确定用户集合的交集外,还可以基于用户指定的任意2个位置确定其所在基站的用户集合的交集,从而确定交集内的用户为待分析用户。
104.在一些实施例中,所述第一用户的第一区块时间序列包括:
105.按照时间先后顺序排列的多个位置时间元素,一个所述位置时间元素包括:第一用户接入的基站所在位置归属的区块信息及接入对应所述基站的时间信息;
106.所述第二区块时间序列包括:
107.按照时间先后顺序排列的多个位置时间元素,一个所述位置时间元素包括:所述待分析用户接入的基站所在位置归属的区块信息及接入对应所述基站的时间信息。
108.本实施例中,区块划分后,可将第一用户的第一区块时间序列划分为多个区块,每一个区块对应于一个位置时间元素,位置时间元素可包括该区块的区块信息和时间信息,其中,区块信息可为第一用户接入的基站所在位置归属的区块,区块信息包括区块标识,时间信息可为第一用户接入该基站的时间。
109.同样,区块划分后,可将待分析用户的第二区块时间序列划分为多个区块,每一个区块对应于一个位置时间元素,位置时间元素可包括该区块的区块信息和时间信息,其中,区块信息可为待分析用户接入的基站所在位置归属的区块,区块信息包括区块标识,时间
信息可为待分析用户接入该基站的时间。
110.在分别对所述第一移动轨迹信息及所述待分析用户的第二移动轨迹信息的位置信息进行区块划分后,即,分别将第一移动轨迹信息和待分析用户的第二移动轨迹信息的位置信息分别对应至的不同区块的区块标识后,得到第一用户的第一区块时间序列和待分析用户的第二区块时间序列。
111.具体地,基于第一移动轨迹信息中用户接入过的每个基站的信息生成一位置时间元素,位置时间元素的第一用户接入的基站所在位置归属的区块信息设置为:第一用户接入的基站的位置信息对应的区块的区块标识,位置时间元素的接入对应所述基站的时间信息设置为:第一用户接入基站的时间信息。
112.作为一种示例,继续结合上述表1所示的第一移动轨迹信息,在进行区块划分后,即可得到如下表2所示的一种第一区块时间序列:
113.表2第一区块时间序列
[0114][0115]
上表2中,第一区块时间序列包括n个位置时间元素,依次为(b1,t1)、(b2,t2)、

、(bn,tn)。
[0116]
一些实施例中,如图4所示,在步骤s105之前,所述方法还包括:
[0117]
步骤s104:将所述第一区块时间序列和/或,所述第二区块时间序列的基站所在位置归属的区块信息相同的至少两个相邻的所述位置时间元素,合并为一个位置时间元素。
[0118]
本实施例中,若所述第一区块时间序列存在至少两个相邻的所述位置时间元素,所述至少两个相邻的所述位置时间元素的基站所在位置归属的区块信息相同,即可认为在相应时间段内,第一用户多次接入的基站即使发生了变化,但是,所接入的基站的位置归属的区块信息都是相同的,从而,从以区块为粒度的角度而言,通过合并位置时间元素的方式,将多次同区块下不同基站的接入转换为一次区块接入,从而可以减少满足位置相似条件的次数的计算次数,降低信息查询过程中的计算量。
[0119]
具体地,如图5所示,上述步骤s104中,所述将所述第一区块时间序列和/或,所述第二区块时间序列的基站所在位置归属的区块信息相同的至少两个相邻的所述位置时间元素,合并为一个位置时间元素,包括:
[0120]
步骤s1041:获取所述至少两个相邻的所述位置时间元素中的第一个所述位置时间元素的第一时间信息和最后一个所述位置时间元素的第二时间信息;
[0121]
步骤s1042:以所述第一时间信息和所述第二时间信息的平均值作为合并后的位置时间元素的时间信息,以所述至少两个相邻的所述位置时间元素的基站所在位置归属的区块信息作为合并后的位置时间元素的区块信息。
[0122]
这里,继续基于上述表2的第一区块时间序列,对将所述至少两个相邻的所述位置时间元素合并为一个位置时间元素进行说明:
[0123]
假设,在第一区块时间序列中,相邻的位置时间元素8(b8,t8)、位置时间元素9(b9,t9)和位置时间元素10(b
10
,t
10
)的基站所在位置归属的区块信息相同,即区块标识b8、b9和b
10
相同,从而,将位置时间元素8(b8,t8)、位置时间元素9(b9,t9)和位置时间元素10(b
10
,t
10
)合并为一个新的位置时间元素,该新的位置时间元素的区块信息不变,时间信息为相邻的位置时间元素中的第一个位置时间元素8和左后一个位置时间元素10的时间信息的平均值,因此,新的位置时间元素即为
[0124]
如下表3所示,为位置时间元素合并后的第一区块时间序列的一个示例:
[0125]
表3合并后的第一区块时间序列
[0126][0127]
上表3中,合并后第一区块时间序列包括n-3个位置时间元素,依次为(b1,t1)、(b2,t2)、

、(b7,t7)、(b
11
,t
11
)、

、(bn,tn)。
[0128]
一些实施例中,如图6所示,在步骤s105之前,所述方法还包括:
[0129]
步骤s104

:将所述位置时间元素中的区块信息得到编码序列。
[0130]
则,所述步骤s105包括:
[0131]
满足位置相似条件的第一次数;其中,所述满足位置相似条件的第一次数为:在所述第一区块时间序列和所述第二区块时间序列中,编码序列相同且所述时间信息指示的时间差在预设时长范围内的所述位置时间元素的对数。
[0132]
本实施例中,将位置时间元素中的区块信息编码得到编码序列。
[0133]
在确定满足位置相似条件的第一次数时,首先,分别确定第一区块时间序列和第二区块时间序列的位置时间元素;其次,针对每一个位置时间元素,确定用户接入的基站所在位置归属的区块信息及接入对应所述基站的时间信息;最后,比对第一区块时间序列和第二区块时间序列的位置时间元素,确定同时满足以下条件的位置时间元素的对数:
[0134]
a.第一用户接入对应所述基站的时间信息指示的时间和待分析用户接入对应所述基站的时间信息指示的时间的时间差在预设时长范围内;
[0135]
b.第一用户接入的基站所在位置归属的区块信息对应的编码序列和待分析用户接入的基站所在位置归属的区块信息对应的编码序列相同。
[0136]
具体地,在确定用户接入的基站所在位置归属的区块信息时,根据用户接入的基
站所在位置确定该基站对应的编码序列,并与预先确定的各个区块对应的编码序列进行比对,确定用户接入的基站所在位置归属的区块信息。
[0137]
作为一种示例,基于geohash算法,分别对所述第一移动轨迹信息及所述待分析用户的第二移动轨迹信息的位置信息进行区块划分。例如,根据指定区域的各位置的经度和纬度,基于geohash算法对该指定区域进行了区块化处理,使每一个矩形区域(即区块)对应于一编码序列。其中,指定区域至少覆盖第一移动轨迹和第二移动轨迹。
[0138]
在确定用户接入的基站所在位置归属的区块信息时,根据用户接入的基站的位置信息,包括经度和纬度,基于geohash算法确定该基站对应的编码序列,从而,通过比对可以确定用户接入的基站所在位置归属的区块信息。
[0139]
例如,用户接入的基站所在位置的位置信息loci包括经度lngi和纬度lati,通过geohash算法对该位置信息计算其对应的geohash值(即,编码序列)gi,即:gi=geohash(lngi,lati),在确定位置信息的geohash值后,即可将位置信息对应至用于标识不同区块的geohash值。
[0140]
一些实施例中,如图7所示,所述步骤s104

,包括:
[0141]
步骤s1041

:将所述区块信息编码成所述编码序列的第一部分;
[0142]
步骤s1042

:将所述基站所在位置的位置信息编码成所述编码序列的第二部分;
[0143]
所述步骤s105包括:
[0144]
满足所述位置相似条件的第二次数,其中,所述满足位置相似条件的第二次数为:在所述第一区块时间序列和所述第二区块时间序列中,所述编码序列的第一部分不同、所述编码序列的第二部分对应的距离小于距离阈值,且所述时间信息指示时间差在预设时长范围内的所述位置时间元素的对数。
[0145]
本实施例中,编码序列包括两部分:由所述区块信息编码成所述编码序列的第一部分,由所述基站所在位置的位置信息编码成所述编码序列的第二部分。在确定满足位置相似条件的第二次数时,比对第一区块时间序列和第二区块时间序列的位置时间元素,确定同时满足以下条件的位置时间元素的对数:
[0146]a′
.第一用户接入对应所述基站的时间信息指示的时间和待分析用户接入对应所述基站的时间信息指示的时间的时间差在预设时长范围内;
[0147]b′
.第一用户接入的基站所在位置归属的区块信息对应的编码序列和待分析用户接入的基站所在位置归属的区块信息对应的编码序列不同;
[0148]c′
.第一用户接入的基站所在位置和待分析用户接入的基站所在位置的距离小于距离阈值。
[0149]
如图8所示,本发明实施例提供的一种用户查询装置,包括:
[0150]
第一确定模块110,用于确定第一用户的第一移动轨迹信息;
[0151]
第二确定模块120,用于根据所述第一移动轨迹信息,确定出与所述第一用户的第一移动轨迹满足相似性条件的待分析用户;
[0152]
区块化模块130,用于分别对所述第一移动轨迹信息及所述待分析用户的第二移动轨迹信息的位置信息进行区块划分,得到所述第一用户的第一区块时间序列和所述待分析用户的第二区块时间序列;
[0153]
第三确定模块140,用于根据所述第一区块时间序列和所述第二区块时间序列,确
定所述第一用户和所述待分析用户在同一时间周期内位置信息满足位置相似条件的次数;
[0154]
第四确定模块150,用于根据满足位置相似条件的次数,从所述待分析用户中查询出与所述第一用户具有相同行程的用户。
[0155]
一些实施例中,所述第三确定模块140包括:
[0156]
第一次数确定单元,用于根据所述第一区块时间序列和第二区块时间序列,确定所述第一用户和所述待分析用户在同一个所述时间周期内出现在同一个区块内的第一次数;
[0157]
和/或,
[0158]
第二次数确定单元,用于根据所述第一区块时间序列和第二区块时间序列,确定所述第一用户和所述待分析用户在同一个所述时间周期内出现在不同区块内且距离小于距离阈值的第二次数。
[0159]
一些实施例中,所述第四确定模块150包括:
[0160]
第一行程相似度值确定单元,用于根据所述第一次数和所述第一次数对应的第一权重,确定第一行程相似度值;
[0161]
第二行程相似度值确定单元,用于根据所述第二次数和所述第二次数对应的第二权重,确定所述第二行程相似度值;其中,所述第二权重小于所述第一权重;
[0162]
同行用户确定单元,用于根据所述第一行程相似度值和所述第二行程相似度值,确定所述待分析用户是否为与所述第一用户具有相同行程的用户。
[0163]
一些实施例中,所述第二确定模块120包括:
[0164]
第一用户集合确定单元,用于根据所述第一移动轨迹信息,确定出与所述第一用户同一个时间段出现在所述第一移动轨迹中起点位置所在基站覆盖范围内的第一用户集合;
[0165]
第二用户集合确定单元,用于根据所述第一移动轨迹信息,确定出与所述第一用户同一个时间段出现在所述第一移动轨迹中终点位置所在基站覆盖范围内的第二用户集合;
[0166]
待分析用户确定单元,用于求取所述第一用户集合和所述第二用户集合的交集,得到所述待分析用户。
[0167]
一些实施例中,所述用户查询装置还包括:
[0168]
位置时间元素合并模块,用于将所述第一区块时间序列和/或,所述第二区块时间序列的基站所在位置归属的区块信息相同的至少两个相邻的所述位置时间元素,合并为一个位置时间元素。
[0169]
一些实施例中,所述位置时间元素合并模块包括:
[0170]
获取单元,用于获取所述至少两个相邻的所述位置时间元素中的第一个所述位置时间元素的第一时间信息和最后一个所述位置时间元素的第二时间信息;
[0171]
合并单元,用于以所述第一时间信息和所述第二时间信息的平均值作为合并后的位置时间元素的时间信息,以所述至少两个相邻的所述位置时间元素的基站所在位置归属的区块信息作为合并后的位置时间元素的区块信息。
[0172]
一些实施例中,所述用户查询装置还包括:
[0173]
编码模块,用于根据所述位置时间元素中的区块信息得到编码序列;
[0174]
所述第一次数确定单元,用于确定满足位置相似条件的第一次数;其中,所述满足位置相似条件的第一次数为:在所述第一区块时间序列和所述第二区块时间序列中,所述编码序列相同且所述时间信息指示的时间差在预设时长范围内的所述位置时间元素的对数。
[0175]
一些实施例中,所述编码模块,包括:
[0176]
第一编码单元,用于根据所述区块信息编码成所述编码序列的第一部分;
[0177]
第二编码单元,用于将所述基站所在位置的位置信息编码成所述编码序列的第二部分;
[0178]
所述第二次数确定单元,用于确定满足所述位置相似条件的第二次数,其中,所述满足位置相似条件的第二次数为:在所述第一区块时间序列和所述第二区块时间序列中,所述编码序列的第一部分不同、所述编码序列的第二部分对应的距离小于距离阈值,且所述时间信息指示时间差在预设时长范围内的所述位置时间元素的对数。
[0179]
本发明实施例还提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的信息处理程序,所述处理器执行所述信息处理程序时能够实现前述一个或多个技术方案提供的用户查询方法。
[0180]
本发明实施例还提供一种计算机存储介质,该计算机存储介质存储有计算机可执行指令;所述计算机可执行指令被处理器执行后,能够实现前述一个或多个技术方案提供的用户查询方法。
[0181]
所述计算机存储介质可为:移动存储设备、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质等存储介质,可选为非瞬间存储介质。
[0182]
以下,如图9所示,以一个具体示例对本发明实施例用户查询方法进行说明:
[0183]
步骤1:根据第一用户提取待分析用户及用户移动轨迹信息;
[0184]
步骤1-1:指定第一用户的轨迹段us的起始区县和终止区县,起始区县和终止区县对应于具体的基站,假定指定起始区县和终止区县对应的基站分别为county1和countyn,对第一用户移动轨迹按时间形成第一移动轨迹信息,从该序列中获取第一用户出现在county1的最后时刻hour1,以及出现在countyn的最早时刻hourn;
[0185]
步骤1-2:从位置信令数据中筛选出hour1或者hour1的前一小时出现在county1的用户的第一用户集合us1,从位置信令数据中筛选出hourn或者hourn的后一小时出现在countyn的用户的第二用户集合usn,求取第一用户集合us1和第二用户集合usn的交集usk,交集usk内的用户均为待分析用户,即在相同时刻(或相邻时刻)与第一用户有相同起始区县和终止区县的用户,即为待分析用户;
[0186]
步骤1-3:从位置信令数据分别提取交集usk中所有待分析用户在hour1的前一小时到hourn的后一小时的按时间排序的待分析用户的用户移动轨迹lk,其中k=1,2,3
……
m,m为交集usk中的待分析用户的个数;
[0187]
上述的位置信令数据包含的数据字段有:用户id、基站经度、基站纬度、时间戳。
[0188]
步骤2:将用户轨迹网格化;
[0189]
步骤2-1:分别对第一用户以及待分析用户的轨迹基于geohash算法进行转换;
[0190]
以lk中用户移动轨迹为li的待分析用户ui为例进行说明:待分析用户ui的移动轨
迹li,为基站经纬度时间序列(c1,c2,...,ci,...),其中,位置点ci包含经度lngi、纬度lati、时间戳ti信息,基于每个位置点的经度和纬度,计算其对应geohash值gi,即:gi=geohash(lngi,lati),这里,公式中的“geohash”表示geohash算法。geohash值长度取6时,根据下表4所示的geohash值长度与距离精度对应关系,网格长宽约为600m。网格化后,基站经纬度时间序列(c1,c2,...,ci,...)转换为geohash位置点序列(g1,g2,...,gi,...),其中,转换后的位置点gi包含geohash码gi、时间戳ti信息。
[0191]
表4geohash值长度与距离精度的对应关系
[0192]
geohash长度距离经度(km)4
±
205
±
2.46
±
0.61
[0193]
步骤2-2:对geohash位置点序列进行停留点合并;
[0194]
将geohash位置点序列中,具有相同geohash码的连续的位置点g
s-ge合并为一个位置点,其合并后geohash码不变,时间戳为t=(ts+te)/2。
[0195]
步骤3:基于网格编码计算待分析用户与第一用户之间的满足位置相似条件的次数;
[0196]
步骤3-1:分别计算各待分析用户的位置点序列与第一用户的位置点序列的满足位置相似条件的次数;
[0197]
假定待分析用户uk的位置点序列sk为(g
k1
,g
k2
,...,g
ki
,...),第一用户us的位置点序列ss为(g
s1
,g
s2
,...,g
si
,...);待分析用户uk与第一用户us满足位置相似条件的次数的计算方法如下:
[0198]
·
在一定时间周期内,uk与us位置点geohash码相同,即在满足|t
ki-t
si
|<=t
阈值
的同时,满足g
ki
=g
si
,其中,时间周期长度阈值t
阈值
设置为2分钟,则将第一次数加1。
[0199]
·
在一定时间周期内,uk与us位置点geohash码不相同,但其5位前缀相同,即uk与us虽然不在同一个长宽600m的地域网格范围,但处于同一个长宽2.4km的地域网格范围,此时,计算uk与us两个位置点的距离,若满足距离小于距离阈值(如,1.2km),则将第二次数加0.5。
[0200]
步骤3-2:将第一次数和第二次数求和,得到待分析用户与第一用户的满足位置相似条件的次数。
[0201]
步骤4:确定待分析用户是否为与所述第一用户具有相同行程的用户;
[0202]
对于满足位置相似条件的次数大于设定阈值t的待分析用户,即为与所述第一用户在区县county1和区县countyn间的具有相同行程的用户。
[0203]
其中,阈值t设置为ns×
ps,ns为第一用户的位置点序列ss的长度,ps为相似比例,一般ps设置为
[0204]
在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部
分相互之间的耦合、或直接耦合、或通信连接可以是通过一些端口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
[0205]
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
[0206]
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理模块中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
[0207]
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤。
[0208]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1