兴趣点推荐方法、装置、计算机设备和存储介质与流程

文档序号:31053657发布日期:2022-08-06 09:42阅读:117来源:国知局
兴趣点推荐方法、装置、计算机设备和存储介质与流程

1.本技术涉及地址推荐领域,特别是涉及一种兴趣点推荐方法、装置、计算机设备和存储介质。


背景技术:

2.现如今已经步入互联网时代,电子地图高度发达,人们在使用地图的时候不可避免用到拖动大头针选址功能,而这背景涉及到的技术就是逆地理编码技术。逆地理编码(reverse geocoding)也可称为反向地址查询、逆地址编码,本质上就是根据用户大头针的经纬度解析出一个对应的兴趣点返回给用户。
3.目前包含逆地理编码的媒介主要通过如下几种方案进行逆地理编码:
4.1.基于父子点关系:提前构建省市区街道道路等父子点关系,当执行逆地理编码时,根据坐标依次查找省市区街道道路等,并将查询结果拼接完成完整描述返回给用户。
5.2.基于空间索引:提前将地理空间进行划分成网格,构建网格和坐标的索引;并对每个网格构建一个对应的地址描述,此地址描述是一个虚拟兴趣点。当执行逆地理编码的时,根据请求的经纬度找到对应的网格,将网格对应的虚拟兴趣点为逆地理编码结果返回给用户。
6.3.基于最短距离:提前将地理空间进行划分成网格,构建网格和坐标的索引;当执行逆地理编码的时,根据请求的经纬度找到对应的网格,然后将网格内和请求经纬度最近的兴趣点返回给用户。
7.上述方案1可以根据提前构建的父子点关系实现快速查找,然而方案1向用户返回的兴趣点是门址兴趣点,而用户对门址的认知通常比较模糊。
8.上述方案2可以根据提前构建的索引实现快速查找,响应速度快,然而方案2给用户返回的是虚拟兴趣点,而虚拟兴趣点存在部分用户无法和实际兴趣点对应上的认知问题。
9.上述方案3可以根据提前构建的索引实现快速查找,然而,方案3在实施时容易向用户推荐冷门兴趣点,而大部分用户不认识此冷门兴趣点。
10.总的来说,上述现有的逆地理编码方案均无法准确给用户推荐兴趣点,即推荐的兴趣点不是用户想要的兴趣点(可称为目的兴趣点),或者和用户的目的兴趣点区别较大。


技术实现要素:

11.本技术针对上述不足或缺点,提供了一种兴趣点推荐方法、装置、计算机设备和存储介质,本技术实施例能够提高兴趣点推荐的准确性。
12.本技术根据第一方面提供了一种兴趣点推荐方法,在一个实施例中,该方法包括:
13.接收携带有请求坐标的逆地址编码请求;
14.根据请求坐标确定关联兴趣点,关联兴趣点的数量为多个;
15.根据请求坐标和各关联兴趣点生成各关联兴趣点的特征标量,将各关联兴趣点的
特征标量输入基于兴趣点历史行为热度训练的兴趣点推荐模型,获取兴趣点推荐模型输出的推荐兴趣点;
16.根据推荐兴趣点响应逆地址编码请求。
17.在一个实施例中,根据请求坐标确定关联兴趣点,包括:
18.以请求坐标为圆心,以预设长度为直径,确定目标搜索区域;
19.将地理位置处于目标搜索区域内的每个兴趣点确定为关联兴趣点。
20.在一个实施例中,兴趣点推荐模型的训练过程,包括:
21.获取多个历史逆地址编码请求的请求日志;历史逆地址编码请求的请求日志包括历史请求坐标;
22.根据获取的请求日志进行特征工程,得到多时间维度的时空特征;
23.根据多时间维度的时空特征和各历史请求坐标生成训练样本数据;
24.根据训练样本数据训练兴趣点推荐模型,得到训练好的兴趣点推荐模型。
25.在一个实施例中,根据获取的请求日志进行特征工程,包括:
26.对获取的请求日志进行预处理,预处理包括空值处理、异常值处理和/或缺失字段处理;
27.根据预处理后的请求日志进行特征工程。
28.在一个实施例中,兴趣点推荐模型为集成树模型。
29.在一个实施例中,时空特征包括兴趣点历史行为热度,兴趣点与历史请求坐标的距离。
30.在一个实施例中,将各关联兴趣点的特征标量输入基于兴趣点历史行为热度训练的兴趣点推荐模型,获取兴趣点推荐模型输出的推荐兴趣点,包括:
31.将各关联兴趣点的特征标量输入兴趣点推荐模型;
32.通过兴趣点推荐模型计算各特征标量对应的置信度,并将置信度最高的特征标量对应的关联兴趣点作为推荐兴趣点输出。
33.本技术根据第二方面提供了一种兴趣点推荐装置,在一个实施例中,该装置包括:
34.请求接收模块,用于接收携带有请求坐标的逆地址编码请求;
35.关联兴趣点确定模块,用于根据请求坐标确定关联兴趣点,关联兴趣点的数量为多个;
36.推荐模块,用于根据请求坐标和各关联兴趣点生成各关联兴趣点的特征标量,将各关联兴趣点的特征标量输入基于兴趣点历史行为热度训练的兴趣点推荐模型,获取兴趣点推荐模型输出的推荐兴趣点;
37.响应模块,用于根据推荐兴趣点响应逆地址编码请求。
38.本技术根据第三方面提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述任一方法的实施例的步骤。
39.本技术根据第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一方法的实施例的步骤。
40.在本技术实施例中,服务器在接收到携带有请求坐标的逆地址编码请求之后,根据请求坐标确定关联兴趣点,根据请求坐标和各关联兴趣点生成各关联兴趣点的特征标
量,将各关联兴趣点的特征标量输入基于兴趣点历史行为热度训练的兴趣点推荐模型,获取兴趣点推荐模型输出的推荐兴趣点,根据推荐兴趣点响应逆地址编码请求,本技术实施例在进行逆地址编码时,还考虑了兴趣点历史行为热度对兴趣点的影响,从而能够提高兴趣点推荐的准确性。
附图说明
41.图1为一个实施例中一种兴趣点推荐方法的流程示意图;
42.图2为一个实施例中兴趣点推荐的架构示意图;
43.图3为一个实施例中模型原理的示意图;
44.图4为一个实施例中一种兴趣点推荐装置的结构框图;
45.图5为一个实施例中计算机设备的内部结构图。
具体实施方式
46.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本技术,并不用于限定本技术。
47.如前所示,现有的逆地址编码方案的准确性不够高。具体地,在设计思想上,传统逆地址编码方法都只考虑了地理空间因素,这样的结果是,可能给用户推荐冷门兴趣点或者虚拟兴趣点。
48.具体地,兴趣点存在长尾问题,即少量兴趣点积累了大量逆地址编码请求,而大量兴趣点积累的逆地址编码请求非常少,甚至没有,这类逆地址编码请求非常少,甚至没有的兴趣点可称为长尾兴趣点。长尾兴趣点对于绝大部分用户来说是很不熟悉的,因此也可以称为冷门兴趣点,因而假如逆地址编码返回这类兴趣点给用户,用户很可能会改变请求坐标重新请求逆地址编码,直到得到一个自己比较熟悉的兴趣点或者有标志性的兴趣点,这样用户体验不太好;而虚拟兴趣点则比较宽泛,无法和大部分用户认知对应上。
49.例如:某用户想打车去购物,但对目的地并不熟悉。此用户向服务器提交逆地址编码请求,请求坐标在某大型超市附近,距离请求坐标更近地方有个小便利店。假如采用父子点的逆地址编码方法,那么最终会返回类似“上海市杨浦区人民街道世界路18号”的门址兴趣点,不熟悉的用户对此兴趣点认知往往会比较模糊;假如采用最近距离的逆地址编码方法,那么最终会返回距离更近的小便利店,然而小便利店比较冷门,因而用户很大几率不了解该便利店,甚至没有听过便利店的名字。
50.对于上述不足,本技术提供了一种兴趣点推荐方法。在一个实施例中,上述兴趣点推荐方法包括如图1所示的步骤,下面以该方法应用于服务器为例进行说明。
51.s110:接收携带有请求坐标的逆地址编码请求。
52.其中,逆地址编码请求可以来自用户端,用户端可以是智能手机、平板电脑,笔记本电脑等计算设备。请求坐标可以是经纬度信息。
53.s120:根据请求坐标确定关联兴趣点。
54.其中,关联兴趣点的数量为多个。
55.在一个实施方式中,上述的根据请求坐标确定关联兴趣点,可以包括以请求坐标
为圆心,以预设长度为直径,确定目标搜索区域,将地理位置处于目标搜索区域内的每个兴趣点确定为关联兴趣点。
56.s130:根据请求坐标和各关联兴趣点生成各关联兴趣点的特征标量,将各关联兴趣点的特征标量输入基于兴趣点历史行为热度训练的兴趣点推荐模型,获取兴趣点推荐模型输出的推荐兴趣点。
57.在一个实施方式中,上述的将各关联兴趣点的特征标量输入基于兴趣点历史行为热度训练的兴趣点推荐模型,获取兴趣点推荐模型输出的推荐兴趣点,包括:将各关联兴趣点的特征标量输入兴趣点推荐模型;通过兴趣点推荐模型计算各特征标量对应的置信度,并将置信度最高的特征标量对应的关联兴趣点作为推荐兴趣点输出。置信度是指兴趣点推荐模型给兴趣点的评分,其用于表示兴趣点能让用户满意的可能性,其取值通常是介于0-1之间的浮点数。
58.兴趣点(point of interest,简称poi)上积累的所有用户逆地址编码请求次数本实施例将其称为兴趣点历史行为热度。为了解决上述不足,发明人在经过大量实践后发现,兴趣点历史行为热度越高通常此兴趣点大部分用户认知的概率越高,并且是用户的目的兴趣点的概率也更大。因而,本实施例在训练兴趣点推荐模型时,不仅会考虑地理空间位置,如兴趣点和请求坐标之间的距离,还会考虑到兴趣点的历史行为热度,通过综合请求坐标和兴趣点距离以及兴趣点历史行为热度等因素,可以使得逆地址编码的效果更好,即可以提高推荐准确性。
59.兴趣点推荐模型可以用集成树模型来实现。其中,由于本方案对请求坐标和兴趣点距离以及兴趣点历史行为热度等因素进行了综合,相当于引入多元特征,为了能够综合参考所有特征并能输出一个有意义的结果,发明人在经过大量试验后,发现集成树模型(也可称为树模型)的效果最好。通过把所有特征打包传入树模型,树模型充分利用二叉树的结构优势以及树模型的可解释性,将不同特征综合评估并输出置信度,最后再将该置信度排序,通过这样的方法使得多元特征可以应用在地址推荐场景中,最终通过思想和实现方法上的改进,可以解决了传统方法推荐的虚拟兴趣点或者冷门兴趣点用户认知问题。
60.s140:根据推荐兴趣点响应逆地址编码请求。
61.在获取推荐兴趣点之后,将推荐兴趣点的信息返回给发送逆地址编码请求的用户端。
62.如图2所示,本实施例中,服务器在接收到携带有请求坐标的逆地址编码请求之后,根据请求坐标确定关联兴趣点,根据请求坐标和各关联兴趣点生成各关联兴趣点的特征标量,将各关联兴趣点的特征标量输入基于兴趣点历史行为热度训练的兴趣点推荐模型,获取兴趣点推荐模型输出的推荐兴趣点,根据推荐兴趣点响应逆地址编码请求,本技术实施例在进行逆地址编码时,还考虑了兴趣点历史行为热度对兴趣点的影响,能够提高兴趣点推荐的准确性,进而解决用户对逆地址编码返回的兴趣点存在认知障碍的问题,从根本上提升了逆地址编码的合理性和可用性,适用面广。
63.在一个实施例中,兴趣点推荐模型的训练过程,包括:获取多个历史逆地址编码请求的请求日志;历史逆地址编码请求的请求日志包括历史请求坐标;根据获取的请求日志进行特征工程,得到多时间维度的时空特征;根据多时间维度的时空特征和各历史请求坐标生成训练样本数据;根据训练样本数据训练兴趣点推荐模型,得到训练好的兴趣点推荐
模型。
64.其中,上述的时空特征至少包括兴趣点历史行为热度,兴趣点与历史请求坐标的距离等特征。
65.具体地,上述的根据获取的请求日志进行特征工程,包括:对获取的请求日志进行预处理,预处理包括空值处理、异常值处理和/或缺失字段处理;根据预处理后的请求日志进行特征工程。
66.为了更好地理解上述实施例,以下通过具体的应用实施例(可称为应用例)来对上述实施例进行说明。
67.在本应用例中,包括日志抽取、特征工程、模型训练和预测四个部分。以下对各部分进行介绍。
68.1.日志抽取
69.(1)日志收集
70.本应用例基于各用户的历史逆地址编码请求日志来进行模型训练,首先需要收集各用户的历史逆地址编码日志,由于收集的请求日志的数据量非常大,可以将收集到的请求日志存放到分布式文件系统中,之后对分布式文件系统中的请求日志进行预处理,其中,上述的预处理操作可以至少包括空值处理、异常值处理和/或缺失字段处理等手段,预处理后的请求日志可用于生成模型依赖的特征。
71.(2)标签生成
72.本应用例采用“监督学习”方法,需要为每个兴趣点打标,将每个兴趣点分为正例或负例,其中,正例代表用户接受的逆地址编码兴趣点,负例代表用户不接受的逆地址编码兴趣点。整个训练过程中,会以标签作为基准来判断每个兴趣点是哪一类别。
73.2.特征工程
74.历史逆地址编码请求日志中中蕴含大量用户行为及操作习惯,部分行为习惯不容易被发现但却隐含在数据中。通过对数据进行不同维度的拆解抽取可以生成不同维度的特征(如距离、兴趣点历史行为热度等维度的特征),其中部分特征在经验上有利于判断用户倾向于哪个兴趣点,部分特征与用户的最终选择在相关性系数(如协方差、皮尔斯系数等)上呈现一定相关性。
75.具体地,从预处理后的请求日志中提取时空特征,例如距离,用户历史行为热度等,此外还可以进一步利用多时间维度日志聚合工程,分别聚合30天、60天等时间维度请求日志,从而得到30天、60天用户历史行为热度等特征。
76.进一步地,以每个历史逆地址编码请求中的历史请求坐标作为单位,以每个历史请求坐标和在每个历史请求坐标直径1000米(仅作为示例)内的所有兴趣点(这些兴趣点可以称为关联兴趣点,比如,以历史请求坐标a为例,地理位置处于以历史请求坐标a为圆心的直径1000米的区域内的每个兴趣点均是历史请求坐标a的关联兴趣点)作为生成特征的基础数据,最终可以生成每个历史请求坐标对于自己的每一个关联兴趣点的特征标量,即《逆地址编码请求坐标,《兴趣点id,特征》》。
77.每个历史逆地址编码请求的请求日志都可以提取出一条训练样本,在从多个历史逆地址编码请求的请求日志中提取出训练样本后,可以基于提取的训练样本进行下一步的模型训练。
78.3.模型训练
79.以每条训练样本中包含的特征作为输入,以均方误差(mean squared error,简称mse)作为目标函数,寻找使得目标函数取极小值的参数,当目标函数取得极小值时,基于此时的参数可以获得训练好的兴趣点推荐模型。该模型可用作对未知输入进行类别的预测,该模型会输出一个介于0到1之间的浮点型的“置信度”,“置信度”最高的兴趣点会返回给用户。
80.具体地,本应用例采用“集成树模型”为作为兴趣点推荐模型,模型训练过程可参见图3,“集成树模型”由多棵“二叉树”型数据结构(即一个根节点,最多两个子结点分别称为左节点和右结点)顺序连接组成,每个形式意义上的“根结点”用来存放划分阈值(即条件),两个子结点分别用来存放满足条件的数据和不满足条件的数据,对于第t棵树而言,接收的信息为第t-1棵树的对于某一特征的输出结果(介于0-1之间的浮点数,表示可能性)与标签之间(0或1)的数值上的误差,模型的最终目标就是要降低整体误差,让模型输出的值更接近真实标签,从而具备对未知数据的高度可信的分类能力。
81.4.预测
82.预测即是分类的过程,对于一条真实数据(《用户uid,逆地址编码请求坐标,直径1000m内兴趣点》),利用相同的特征工程方法将逆地址编码请求坐标和逆地址编码请求坐标直径1000米内所有兴趣点转化为特征标量,将生成的各特征标量对输入到训练好的模型中,模型会根据输入的特征标量得出各兴趣点的置信度,并输出置信度性最高的兴趣点。
83.示例性地,例如用户端发送的逆地址编码请求如下:
84.uid:803668
85.用户输入逆地址编码请求坐标:121.48398(经度),31.231107(纬度);
86.逆地址编码坐标1000米内存在2个兴趣点,即兴趣点1和兴趣点2:
87.兴趣点1的信息如下:
88."兴趣点id":2002383103283";
89.兴趣点名字":上海广场;
90."兴趣点坐标":121.484667(经度),31.231242(纬度);
91.兴趣点2的信息如下:
92."兴趣点id":23202238243";
93.兴趣点名字":全家便利店";
94.兴趣点坐标":121.483302(经度),31.230988(纬度);
95.对上述兴趣点1和兴趣点2进行特征过程,能为每个兴趣点生成一组10维(10个浮点数)特征标量:
96.兴趣点1的特征标量为:
97."71.2342,105.0,85.0,50.0,3.0,0.2322323,0,0,0.0012223,0"
98.兴趣点2的特征标量为:
99."69.8623,6.0,3.0,0,0,0.1239372,0,0,0.00023321,0"
100.将各特征标量传入训练好的兴趣点推荐模型,兴趣点推荐模型最终输出如下打分:
101.兴趣点1:0.872
102.兴趣点2:0.354
103.根据得分倒排,输出分数最高的兴趣点:兴趣点1;
104.将兴趣点1的信息返回给用户端。
105.图1为一个实施例中兴趣点推荐方法的流程示意图。应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
106.基于相同的发明构思,本技术还提供了一种兴趣点推荐装置。在本实施例中,如图4所示,该兴趣点推荐装置包括以下模块:
107.请求接收模块110,用于接收携带有请求坐标的逆地址编码请求;
108.关联兴趣点确定模块120,用于根据请求坐标确定关联兴趣点,关联兴趣点的数量为多个;
109.推荐模块130,用于根据请求坐标和各关联兴趣点生成各关联兴趣点的特征标量,将各关联兴趣点的特征标量输入基于兴趣点历史行为热度训练的兴趣点推荐模型,获取兴趣点推荐模型输出的推荐兴趣点;
110.响应模块140,用于根据推荐兴趣点响应逆地址编码请求。
111.在一个实施例中,关联兴趣点确定模块,用于:
112.以请求坐标为圆心,以预设长度为直径,确定目标搜索区域;
113.将地理位置处于目标搜索区域内的每个兴趣点确定为关联兴趣点。
114.在一个实施例中,装置还包括训练模块,训练模块,用于:
115.获取多个历史逆地址编码请求的请求日志;历史逆地址编码请求的请求日志包括历史请求坐标;
116.根据获取的请求日志进行特征工程,得到多时间维度的时空特征;
117.根据多时间维度的时空特征和各历史请求坐标生成训练样本数据;
118.根据训练样本数据训练兴趣点推荐模型,得到训练好的兴趣点推荐模型。
119.在一个实施例中,训练模块在根据获取的请求日志进行特征工程时,用于:
120.对获取的请求日志进行预处理,预处理包括空值处理、异常值处理和/或缺失字段处理;
121.根据预处理后的请求日志进行特征工程。
122.在一个实施例中,兴趣点推荐模型为集成树模型。
123.在一个实施例中,时空特征包括兴趣点历史行为热度,兴趣点与历史请求坐标的距离。
124.在一个实施例中,推荐模块,用于:
125.将各关联兴趣点的特征标量输入兴趣点推荐模型;
126.通过兴趣点推荐模型计算各特征标量对应的置信度,并将置信度最高的特征标量对应的关联兴趣点作为推荐兴趣点输出。
127.关于兴趣点推荐装置的具体限定可以参见上文中对于兴趣点推荐方法的限定,在此不再赘述。上述兴趣点推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
128.在一个实施例中,提供了一种计算机设备,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储各请求日志等数据,具体存储的数据还可以参见上述方法实施例中的限定。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种兴趣点推荐方法。
129.本领域技术人员可以理解,图5中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
130.本实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上述任一方法实施例中提供的方法中的步骤。
131.在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述任一方法实施例中提供的方法中的步骤。
132.本领域普通技术人员可以理解实现上述方法实施例中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
133.以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
134.以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1