缺失POI的识别方法

文档序号：31152431发布日期：2022-08-17 06:35阅读：来源：国知局

技术特征：
1.一种缺失poi的识别方法，其特征在于，包括如下步骤：步骤1.输入基于位置社交网络服务平台的用户签到数据，进行数据清洗，并统一数据格式，保证数据一致性；步骤2.根据步骤1处理后的数据，构建基于用户、时间分别与poi、poi类别以及poi与poi类别之间的关系图网格，之后将上述多个关系图进行联合图嵌入，从而将用户、时间、poi和poi类别的表达向量嵌入到统一共享维度空间中，共同捕获顺序转换模式、时间周期影响与用户偏好；步骤3.考虑区域级别的空间邻近性，将城市区域进行网格划分，并将每个poi嵌入对应网络区域，然后对地理空间的距离进行加权；步骤4.将步骤2得到的用户偏好和步骤3距离权重融合进行联合概率估计，得出每个候选poi的概率得分并排名，根据排名，得出用户在过去某个时间缺失的poi签到，从而预测用户去过的位置信息。2.根据权利要求1所述的缺失poi的识别方法，其特征在于，步骤1中数据清洗的方法为滤除签到次数少于n次的poi地点和用户，其中，n根据实际需要设定。3.根据权利要求1所述的缺失poi的识别方法，其特征在于，步骤2具体还包括如下子步骤：步骤2.1、基于步骤1处理后的数据，构建5个关系图网格，即用户—poi、用户—poi、时间—poi、时间—poi类别以及poi类别—poi类别，其中每个图中的权重表示发生此项签到的频率；步骤2.2、基于2.1得到的5个关系图，使用联合图嵌入方法，将关系到用户个性化偏好的用户、poi、poi类别以及时间的表达向量，嵌入到统一共享维度空间中，得到统一共享维度空间中的用户、poi、poi类别、时间的嵌入向量：其中，包括和步骤2.3根据步骤2.2得到的用户、poi、poi类别、时间的嵌入向量，挖掘用户在某个时间的静态偏好得分s
p
：式中，p表示社会场所地点，c表示社会场所地点的语义类别(，u表示用户，τ表示查询的时间项，t表示时间，为的转置矩阵；同时，为了表达用户在社会地点类别之间的转移偏好，我们对每个社会场所地点的语义类别c赋予两个角色：出和入分别对应和因此，用表示相邻时刻社会地点语义类别转换的得分，其值越大，表示在
τ
时刻用户访问的社会地点类别c
τ
后越有可能在下一τ+1时刻，越有可能访问c
τ+1
；并基于上述的嵌入向量表达用户对地点的序列转移偏好得分s
q
：式中，c
τ
、c
τ-1
和c
τ+1
分别表示当前时刻、上一时刻和下一时刻社会场所地点类别，表示用户个性化偏好项，p(c
τ
|c
τ-1
,c
τ+1
)为转移概率：
其中，表示τ-1时刻社会地点类别特征的出分量，表示τ时刻社会地点类别特征的入分量，表示τ+1时刻的社会地点类别特征的入分量，为发生缺失poi标注的时刻与连续前项签到的时间间隔，为发生缺失poi标注的时刻与连续后项签到的时间间隔，η表示为时间间隔阈值，当连续签到时间大于η时，表示用户发生签到行为不受序列影响，而只受到长期静态偏好影响；基于上述两项因素，结合用户的静态偏好和序列转移偏好得出用户对候选poi的概率得分：式中，θ表示权重参数，范围为[0,1]；当大于时间阈值η时，认为用户发生签到的行为只受长期静态偏好的影响；反之，则受两项因素同时影响。4.根据权利要求1所述的缺失poi的识别方法，其特征在于，步骤3具体包括：将城市划分成网格区域，得出每个网格区域的中心坐标；再根据用户发生poi缺失时的gps坐标，将其映射到对应网格区域，计算该网格区域和其他候选poi对应的网格中心坐标之间的距离，并计算空间距离的权重：l表示poi缺失时的gps坐标，p表示poi候选poi的gps坐标，d(
·
)表示为l2范式的gps坐标距离，a为参数，x
l
表示l坐标映射的网格区域中心gps坐标，xp表示候选poi映射的网格区域中心gps坐标。5.根据权利要求1所述的缺失poi的识别方法，其特征在于，步骤4中，将所有影响因素融合进行联合概率估计，得出每个候选poi的概率得分表示为：s
total
(p,c|u,l,t)＝(1+w
l,p
)
·
s
p+q
(p,c|
·
)；式中，p表示poi，c表示poi类别，u表示用户，l表示poi缺失时的gps坐标，t表示poi缺失的时间，w
l,p
表示步骤3得到得空间距离权重，s
p+q
(p,c|
·
)表示步骤2得到的用户偏好对候选poi的概率得分；最后，对缺失的poi签到进行识别预测，得到最终结果：其中，accuary@k代表top-k个候选中出现标准答案的概率，top-k为由s
total
按照得分顺序从高到低给出的推荐结果，hit@k表示给出的得分最高的top-k个候选poi中有正确的结
果就设为1否则就为0；|d
test
|表示测试集的样本数量。

技术总结
本发明提供一种缺失POI的识别方法，包括：首先通过处理原始签到数据，生成基于用户、时间、POI和POI类别的5个关系图网络；然后，通过联合图嵌入方法，将用户、时间、POI和POI类别嵌入共享维度空间，共同捕获顺序转换模式、时间周期影响与用户偏好；其次，结合了区域级别的空间邻近性，对地理空间的距离进行加权，以此来引入地理影响；最后将上述所有影响因素融合进行联合概率估计，得出每个POI的概率得分并排名，根据排名，得出用户在过去某个时间缺失的POI签到，从而预测用户去过的位置信息。本发明旨在通过建模整个历史信息与查询时间节点的前、后上下文信息，从而解决“你去了哪儿”识别的新问题。别的新问题。别的新问题。

技术研发人员：胡瑞敏吴俊杭李登实肖益林胡文怡任灵飞甄宇臧屹隆
受保护的技术使用者：武汉大学
技术研发日：2022.05.30
技术公布日：2022/8/16

完整全部详细技术资料下载

当前第2页1 2