缺失POI的识别方法

文档序号:31152431发布日期:2022-08-17 06:35阅读:来源:国知局

技术特征:
1.一种缺失poi的识别方法,其特征在于,包括如下步骤:步骤1.输入基于位置社交网络服务平台的用户签到数据,进行数据清洗,并统一数据格式,保证数据一致性;步骤2.根据步骤1处理后的数据,构建基于用户、时间分别与poi、poi类别以及poi与poi类别之间的关系图网格,之后将上述多个关系图进行联合图嵌入,从而将用户、时间、poi和poi类别的表达向量嵌入到统一共享维度空间中,共同捕获顺序转换模式、时间周期影响与用户偏好;步骤3.考虑区域级别的空间邻近性,将城市区域进行网格划分,并将每个poi嵌入对应网络区域,然后对地理空间的距离进行加权;步骤4.将步骤2得到的用户偏好和步骤3距离权重融合进行联合概率估计,得出每个候选poi的概率得分并排名,根据排名,得出用户在过去某个时间缺失的poi签到,从而预测用户去过的位置信息。2.根据权利要求1所述的缺失poi的识别方法,其特征在于,步骤1中数据清洗的方法为滤除签到次数少于n次的poi地点和用户,其中,n根据实际需要设定。3.根据权利要求1所述的缺失poi的识别方法,其特征在于,步骤2具体还包括如下子步骤:步骤2.1、基于步骤1处理后的数据,构建5个关系图网格,即用户—poi、用户—poi、时间—poi、时间—poi类别以及poi类别—poi类别,其中每个图中的权重表示发生此项签到的频率;步骤2.2、基于2.1得到的5个关系图,使用联合图嵌入方法,将关系到用户个性化偏好的用户、poi、poi类别以及时间的表达向量,嵌入到统一共享维度空间中,得到统一共享维度空间中的用户、poi、poi类别、时间的嵌入向量:其中,包括和步骤2.3根据步骤2.2得到的用户、poi、poi类别、时间的嵌入向量,挖掘用户在某个时间的静态偏好得分s
p
:式中,p表示社会场所地点,c表示社会场所地点的语义类别(,u表示用户,τ表示查询的时间项,t表示时间,为的转置矩阵;同时,为了表达用户在社会地点类别之间的转移偏好,我们对每个社会场所地点的语义类别c赋予两个角色:出和入分别对应和因此,用表示相邻时刻社会地点语义类别转换的得分,其值越大,表示在
τ
时刻用户访问的社会地点类别c
τ
后越有可能在下一τ+1时刻,越有可能访问c
τ+1
;并基于上述的嵌入向量表达用户对地点的序列转移偏好得分s
q
:式中,c
τ
、c
τ-1
和c
τ+1
分别表示当前时刻、上一时刻和下一时刻社会场所地点类别,表示用户个性化偏好项,p(c
τ
|c
τ-1
,c
τ+1
)为转移概率:
其中,表示τ-1时刻社会地点类别特征的出分量,表示τ时刻社会地点类别特征的入分量,表示τ+1时刻的社会地点类别特征的入分量,为发生缺失poi标注的时刻与连续前项签到的时间间隔,为发生缺失poi标注的时刻与连续后项签到的时间间隔,η表示为时间间隔阈值,当连续签到时间大于η时,表示用户发生签到行为不受序列影响,而只受到长期静态偏好影响;基于上述两项因素,结合用户的静态偏好和序列转移偏好得出用户对候选poi的概率得分:式中,θ表示权重参数,范围为[0,1];当大于时间阈值η时,认为用户发生签到的行为只受长期静态偏好的影响;反之,则受两项因素同时影响。4.根据权利要求1所述的缺失poi的识别方法,其特征在于,步骤3具体包括:将城市划分成网格区域,得出每个网格区域的中心坐标;再根据用户发生poi缺失时的gps坐标,将其映射到对应网格区域,计算该网格区域和其他候选poi对应的网格中心坐标之间的距离,并计算空间距离的权重:l表示poi缺失时的gps坐标,p表示poi候选poi的gps坐标,d(
·
)表示为l2范式的gps坐标距离,a为参数,x
l
表示l坐标映射的网格区域中心gps坐标,xp表示候选poi映射的网格区域中心gps坐标。5.根据权利要求1所述的缺失poi的识别方法,其特征在于,步骤4中,将所有影响因素融合进行联合概率估计,得出每个候选poi的概率得分表示为:s
total
(p,c|u,l,t)=(1+w
l,p
)
·
s
p+q
(p,c|
·
);式中,p表示poi,c表示poi类别,u表示用户,l表示poi缺失时的gps坐标,t表示poi缺失的时间,w
l,p
表示步骤3得到得空间距离权重,s
p+q
(p,c|
·
)表示步骤2得到的用户偏好对候选poi的概率得分;最后,对缺失的poi签到进行识别预测,得到最终结果:其中,accuary@k代表top-k个候选中出现标准答案的概率,top-k为由s
total
按照得分顺序从高到低给出的推荐结果,hit@k表示给出的得分最高的top-k个候选poi中有正确的结
果就设为1否则就为0;|d
test
|表示测试集的样本数量。

技术总结
本发明提供一种缺失POI的识别方法,包括:首先通过处理原始签到数据,生成基于用户、时间、POI和POI类别的5个关系图网络;然后,通过联合图嵌入方法,将用户、时间、POI和POI类别嵌入共享维度空间,共同捕获顺序转换模式、时间周期影响与用户偏好;其次,结合了区域级别的空间邻近性,对地理空间的距离进行加权,以此来引入地理影响;最后将上述所有影响因素融合进行联合概率估计,得出每个POI的概率得分并排名,根据排名,得出用户在过去某个时间缺失的POI签到,从而预测用户去过的位置信息。本发明旨在通过建模整个历史信息与查询时间节点的前、后上下文信息,从而解决“你去了哪儿”识别的新问题。别的新问题。别的新问题。


技术研发人员:胡瑞敏 吴俊杭 李登实 肖益林 胡文怡 任灵飞 甄宇 臧屹隆
受保护的技术使用者:武汉大学
技术研发日:2022.05.30
技术公布日:2022/8/16
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1