本发明涉及一种兴趣地点推荐方法,更具体的,涉及一种基于大数据的兴趣地点推荐方法、系统及存储介质。
背景技术:
随着移动互联网技术的迅猛发展和智能移动设备的广泛普及,基于地点的社交媒体应运而生,并产生了大量与地点相关的用户行为数据,地点社交网络的广泛使用与其规模的不断扩大使得地点推荐系统成为时下热门应用之一。地点推荐系统即为用户推荐那些可能感兴趣地点的系统,其中地点通常指真实存在于城市中的商家、机构以及公共场所等。利用位置社交网络中的推荐系统,一方面,用户可以探索城市,发现新奇有趣的商家与地点,并获得丰富的生活体验:另一方面,商家也可以利用该系统进行即时的广告推送与商品营销,从而提升利润。
为了能够实现在社交网络中按照用户的偏好程度推荐兴趣地点,需要开发一款基于大数据的兴趣地点推荐系统进行匹配,该系统通过将目标用户及兴趣地点进行低维嵌入式表达,并通过目标用户及兴趣地点的隐变量构建相似度矩阵;将所述相似度矩阵转换为节点距离矩阵;建立距离信息分解模型,确定节点距离向量;通过距离向量建立兴趣地点的地理偏好模型,根据所述地理偏好模型实现对目标用户的兴趣地点推荐。在系统实现过程中如何通过矩阵分解确定节点距离向量以及如何构建地理偏好模型对低维空间中节点距离进行排序都是亟不可待需要解决的问题。
技术实现要素:
为了解决上述至少一个技术问题,本发明提出了一种基于大数据的兴趣地点推荐方法、系统及可读存储介质。
本发明第一方面提供了一种基于大数据的兴趣地点推荐方法,包括:
将目标用户及兴趣地点进行低维嵌入式表达,并通过目标用户及兴趣地点的隐含特征构建相似度矩阵;
将所述相似度矩阵转换为节点距离矩阵;
建立距离信息分解模型,确定目标用户及兴趣地点在低维空间中的节点距离向量;
通过距离向量建立兴趣地点的地理偏好模型,根据所述地理偏好模型对低维空间中节点距离进行排序;
通过排序生成目标用户对兴趣地点的偏好程度,从而实现对目标用户的兴趣地点推荐。
本方案中,通过目标用户及兴趣地点的隐含特征构建相似度矩阵,具体为:
提取目标用户的行为信息及兴趣地点的隐含特征,将所述隐含特征确定主题并进行分类;
根据目标用户的行为信息与兴趣地点的交互信息计算所述隐含特征之间的相似度;
建立相似度矩阵,预设相似度阈值,将所述相似度与相似度阈值进行比较;
若大于,则在所述相似度矩阵中的元素用1表示;
若小于,则在所述相似度矩阵中的元素用0表示。
本方案中,将所述相似度矩阵转换为节点距离矩阵,并基于矩阵分解获取节点距离向量,具体为:
通过目标用户相似度矩阵计算求得节点距离矩阵;
建立距离信息分解模型,通过对节点距离矩阵的分解来学习目标用户和兴趣地点在低维空间中的位置和距离;
根据所述位置和距离生成节点距离向量;
根据节点距离向量学习将低维空间中的目标用户节点和兴趣地点节点进行聚类;
通过低维空间中的节点距离向量来表示目标用户对兴趣地点的偏好程度。
其中,将所述相似度矩阵转换为节点距离矩阵的公式,具体为:
其中,
本方案中,所述的通过距离向量建立兴趣地点的地理偏好模型,具体为:
获取目标用户和兴趣地点在低维空间中的节点距离向量,根据节点距离向量确定目标用户和兴趣地点在低维空间中的位置;
建立地理偏好模型,线性融合目标用户的偏好程度以及目标用户兴趣的动态变化;
利用地理坐标信息生成地理距离信息,将地理距离作为权重进行约束;
运用地理偏好模型计算低维空间中的节点距离值;
将所述低维空间中的节点距离值进行降序排序,生成兴趣地点的推荐信息,根据所述推荐信息对目标用户进行推荐。
本方案中,将目标用户和兴趣地点嵌入到低维空间,目标用户在低维空间表示为
其中,
本方案中,还包括运用目标用户反馈数据对地理偏好模型进行修正,具体为:
获取目标用户进行兴趣地点签到后的反馈数据,生成兴趣地点签到信息;
将地理偏好模型推荐兴趣地点和兴趣地点签到信息进行比较,获取偏差率信息;
预设偏差率阈值,判断所述偏差率信息是否大于偏差率阈值;
若大于,则生成误差信息,根据所述误差信息计算修正参数;
根据所述修正参数,对地理偏好模型进行修正。
本发明第二方面还提供了一种基于大数据的兴趣地点推荐系统,该系统包括:存储器、处理器,所述存储器中包括一种基于大数据的兴趣地点推荐方法程序,所述一种基于大数据的兴趣地点推荐方法程序被所述处理器执行时实现如下步骤:
将目标用户及兴趣地点进行低维嵌入式表达,并通过目标用户及兴趣地点的隐含特征构建相似度矩阵;
将所述相似度矩阵转换为节点距离矩阵;
建立距离信息分解模型,确定目标用户及兴趣地点在低维空间中的节点距离向量;
通过距离向量建立兴趣地点的地理偏好模型,根据所述地理偏好模型对低维空间中节点距离进行排序;
通过排序生成目标用户对兴趣地点的偏好程度,从而实现对目标用户的兴趣地点推荐。
本方案中,通过目标用户及兴趣地点的隐含特征构建相似度矩阵,具体为:
提取目标用户的行为信息及兴趣地点的隐含特征,将所述隐含特征确定主题并进行分类;
根据目标用户的行为信息与兴趣地点的交互信息计算所述隐含特征之间的相似度;
建立相似度矩阵,预设相似度阈值,将所述相似度与相似度阈值进行比较;
若大于,则在所述相似度矩阵中的元素用1表示;
若小于,则在所述相似度矩阵中的元素用0表示。
本方案中,将所述相似度矩阵转换为节点距离矩阵,并基于矩阵分解获取节点距离向量,具体为:
通过目标用户相似度矩阵计算求得节点距离矩阵;
建立距离信息分解模型,通过对节点距离矩阵的分解来学习目标用户和兴趣地点在低维空间中的位置和距离;
根据所述位置和距离生成节点距离向量;
根据节点距离向量学习将低维空间中的目标用户节点和兴趣地点节点进行聚类;
通过低维空间中的节点距离向量来表示目标用户对兴趣地点的偏好程度。
其中,将所述相似度矩阵转换为节点距离矩阵的公式,具体为:
其中,
本方案中,所述的通过距离向量建立兴趣地点的地理偏好模型,具体为:
获取目标用户和兴趣地点在低维空间中的节点距离向量,根据节点距离向量确定目标用户和兴趣地点在低维空间中的位置;
建立地理偏好模型,线性融合目标用户的偏好程度以及目标用户兴趣的动态变化;
利用地理坐标信息生成地理距离信息,将地理距离作为权重进行约束;
运用地理偏好模型计算低维空间中的节点距离值;
将所述低维空间中的节点距离值进行降序排序,生成兴趣地点的推荐信息,根据所述推荐信息对目标用户进行推荐。
本方案中,将目标用户和兴趣地点嵌入到低维空间,目标用户在低维空间表示为
其中,
本方案中,还包括运用目标用户反馈数据对地理偏好模型进行修正,具体为:
获取目标用户进行兴趣地点签到后的反馈数据,生成兴趣地点签到信息;
将地理偏好模型推荐兴趣地点和兴趣地点签到信息进行比较,获取偏差率信息;
预设偏差率阈值,判断所述偏差率信息是否大于偏差率阈值;
若大于,则生成误差信息,根据所述误差信息计算修正参数;
根据所述修正参数,对地理偏好模型进行修正。
本发明第三方面还提供一种计算机可读存储介质,所述计算机可读存储介质中包括一种基于大数据的兴趣地点推荐方法程序,所述一种基于大数据的兴趣地点推荐方法程序被处理器执行时,实现如上述任一项所述的一种基于大数据的兴趣地点推荐方法的步骤。
本发明公开了一种基于大数据的偏好地点推荐方法、系统及可读存储介质,包括:将目标用户及兴趣地点进行低维嵌入式表达,并通过目标用户及兴趣地点的隐变量构建相似度矩阵;将所述相似度矩阵转换为节点距离矩阵;建立距离信息分解模型,确定目标用户及兴趣地点在低维空间中的节点距离向量;通过距离向量建立兴趣地点的地理偏好模型,根据所述地理偏好模型对低维空间中节点距离进行排序,通过排序生成目标用户对兴趣地点的偏好程度,从而实现对目标用户的兴趣地点推荐。本发明利用学习目标用户和兴趣地点在低维空间中节点距离进行排序同时生成推荐信息,避免了传统矩阵分解方法的不足,另一方面在建立模型时考虑目标用户兴趣的动态变化因素,确保了推荐的有效性,还通过用户的反馈信息对地理偏好模型进行修正,使得模型具有良好的推荐效果并使得推荐内容更加准确。
附图说明
图1示出了本发明一种基于大数据的偏好地点推荐方法的流程图;
图2示出了本发明通过距离向量建立兴趣地点的地理偏好模型方法流程图;
图3示出了本发明运用目标用户反馈数据对地理偏好模型进行修正方法流程图;
图4示出了本发明一种基于大数据的偏好地点推荐系统的框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了本发明一种基于大数据的偏好地点推荐方法的流程图。
如图1所示,本发明第一方面提供了一种基于大数据的偏好地点推荐方法,包括:
s102,将目标用户及兴趣地点进行低维嵌入式表达,并通过目标用户及兴趣地点的隐含特征构建相似度矩阵;
s104,将所述相似度矩阵转换为节点距离矩阵;
s106,建立距离信息分解模型,确定目标用户及兴趣地点在低维空间中的节点距离向量;
s108,通过距离向量建立兴趣地点的地理偏好模型,根据所述地理偏好模型对低维空间中节点距离进行排序;
s110,通过排序生成目标用户对兴趣地点的偏好程度,从而实现对目标用户的兴趣地点推荐。
需要说明的是,通过目标用户及兴趣地点的隐含特征构建相似度矩阵,具体为:
提取目标用户的行为信息及兴趣地点的隐含特征,将所述隐含特征确定主题并进行分类;
根据目标用户的行为信息与兴趣地点的交互信息计算所述隐含特征之间的相似度;
建立相似度矩阵,预设相似度阈值,将所述相似度与相似度阈值进行比较;
若大于,则在所述相似度矩阵中的元素用1表示;
若小于,则在所述相似度矩阵中的元素用0表示。
需要说明的是,将所述相似度矩阵转换为节点距离矩阵,并基于矩阵分解获取节点距离向量,具体为:
通过目标用户相似度矩阵计算求得节点距离矩阵;
建立距离信息分解模型,通过对节点距离矩阵的分解来学习目标用户和兴趣地点在低维空间中的位置和距离;
根据所述位置和距离生成节点距离向量;
根据节点距离向量学习将低维空间中的目标用户节点和兴趣地点节点进行聚类;
通过低维空间中的节点距离向量来表示目标用户对兴趣地点的偏好程度。
其中,将所述相似度矩阵转换为节点距离矩阵的公式,具体为:
其中,
图2示出了本发明通过距离向量建立兴趣地点的地理偏好模型方法流程图。
根据本发明实施例,所述的通过距离向量建立兴趣地点的地理偏好模型,具体为:
s202,获取目标用户和兴趣地点在低维空间中的节点距离向量,根据节点距离向量确定目标用户和兴趣地点在低维空间中的位置;
s204,建立地理偏好模型,线性融合目标用户的偏好程度以及目标用户兴趣的动态变化;
s206,利用地理坐标信息生成地理距离信息,将地理距离作为权重进行约束;
s208,运用地理偏好模型计算低维空间中的节点距离值;
s210,将所述低维空间中的节点距离值进行降序排序,生成兴趣地点的推荐信息,根据所述推荐信息对目标用户进行推荐。
需要说明的是,将目标用户和兴趣地点嵌入到低维空间,目标用户在低维空间表示为
其中,
图3示出了本发明运用目标用户反馈数据对地理偏好模型进行修正方法流程图。
根据本发明实施例,还包括运用目标用户反馈数据对地理偏好模型进行修正,具体为:
s302,获取目标用户进行兴趣地点签到后的反馈数据,生成兴趣地点签到信息;
s304,将地理偏好模型推荐兴趣地点和兴趣地点签到信息进行比较,获取偏差率信息;
s306,预设偏差率阈值,判断所述偏差率信息是否大于偏差率阈值;
s308,若大于,则生成误差信息,根据所述误差信息计算修正参数;
s310,根据所述修正参数,对地理偏好模型进行修正。
需要说明的是,用户在位置社交网络中,社交网络软件通过用户允许获取用户的地理位置权限,用户在社交网络软件平台中积累大量的兴趣地点签到记录。所述兴趣地点签到记录中包括了用户身份信息、兴趣地点地理坐标信息、用户签到时间、用户签到内容等信息。
根据本发明实施例,还包括,基于卷积神经网络建立兴趣地点推荐框架,具体为:
根据目标用户在兴趣地点的签到的时间周期性,建立目标用户的签到时序模型;
计算目标用户签到数据中连续签到兴趣地点的地理距离,将所述地理距离值映射到离散的等距离间隔,建立地理距离模型;
基于卷积神经网络建立兴趣地点推荐框架;
通过拓展因果卷积层输入的方式将所述签到时序模型和所述地理距离模型融合到兴趣地点推荐框架;
训练所述兴趣地点推荐框架,根据所述兴趣地点推荐模型的输出结果引入条件概率分布模型;
通过所述条件概率分布模型生成推荐兴趣地点的概率分布,根据所述概率分布生成兴趣地点推荐列表。
本发明第二方面还提供了一种基于大数据的兴趣地点推荐系统4,该系统包括:存储器41、处理器42,所述存储器中包括一种基于大数据的兴趣地点推荐方法程序,所述一种基于大数据的兴趣地点推荐方法程序被所述处理器执行时实现如下步骤:
将目标用户及兴趣地点进行低维嵌入式表达,并通过目标用户及兴趣地点的隐含特征构建相似度矩阵;
将所述相似度矩阵转换为节点距离矩阵;
建立距离信息分解模型,确定目标用户及兴趣地点在低维空间中的节点距离向量;
通过距离向量建立兴趣地点的地理偏好模型,根据所述地理偏好模型对低维空间中节点距离进行排序;
通过排序生成目标用户对兴趣地点的偏好程度,从而实现对目标用户的兴趣地点推荐。
需要说明的是,通过目标用户及兴趣地点的隐含特征构建相似度矩阵,具体为:
提取目标用户的行为信息及兴趣地点的隐含特征,将所述隐含特征确定主题并进行分类;
根据目标用户的行为信息与兴趣地点的交互信息计算所述隐含特征之间的相似度;
建立相似度矩阵,预设相似度阈值,将所述相似度与相似度阈值进行比较;
若大于,则在所述相似度矩阵中的元素用1表示;
若小于,则在所述相似度矩阵中的元素用0表示。
需要说明的是,将所述相似度矩阵转换为节点距离矩阵,并基于矩阵分解获取节点距离向量,具体为:
通过目标用户相似度矩阵计算求得节点距离矩阵;
建立距离信息分解模型,通过对节点距离矩阵的分解来学习目标用户和兴趣地点在低维空间中的位置和距离;
根据所述位置和距离生成节点距离向量;
根据节点距离向量学习将低维空间中的目标用户节点和兴趣地点节点进行聚类;
通过低维空间中的节点距离向量来表示目标用户对兴趣地点的偏好程度。
其中,将所述相似度矩阵转换为节点距离矩阵的公式,具体为:
其中,
根据本发明实施例,所述的通过距离向量建立兴趣地点的地理偏好模型,具体为:
获取目标用户和兴趣地点在低维空间中的节点距离向量,根据节点距离向量确定目标用户和兴趣地点在低维空间中的位置;
建立地理偏好模型,线性融合目标用户的偏好程度以及目标用户兴趣的动态变化;
利用地理坐标信息生成地理距离信息,将地理距离作为权重进行约束;
运用地理偏好模型计算低维空间中的节点距离值;
将所述低维空间中的节点距离值进行降序排序,生成兴趣地点的推荐信息,根据所述推荐信息对目标用户进行推荐。
需要说明的是,将目标用户和兴趣地点嵌入到低维空间,目标用户在低维空间表示为
其中,
根据本发明实施例,还包括运用目标用户反馈数据对地理偏好模型进行修正,具体为:
获取目标用户进行兴趣地点签到后的反馈数据,生成兴趣地点签到信息;
将地理偏好模型推荐兴趣地点和兴趣地点签到信息进行比较,获取偏差率信息;
预设偏差率阈值,判断所述偏差率信息是否大于偏差率阈值;
若大于,则生成误差信息,根据所述误差信息计算修正参数;
根据所述修正参数,对地理偏好模型进行修正。
需要说明的是,用户在位置社交网络中,社交网络软件通过用户允许获取用户的地理位置权限,用户在社交网络软件平台中积累大量的兴趣地点签到记录。所述兴趣地点签到记录中包括了用户身份信息、兴趣地点地理坐标信息、用户签到时间、用户签到内容等信息。
根据本发明实施例,还包括,基于卷积神经网络建立兴趣地点推荐框架,具体为:
根据目标用户在兴趣地点的签到的时间周期性,建立目标用户的签到时序模型;
计算目标用户签到数据中连续签到兴趣地点的地理距离,将所述地理距离值映射到离散的等距离间隔,建立地理距离模型;
基于卷积神经网络建立兴趣地点推荐框架;
通过拓展因果卷积层输入的方式将所述签到时序模型和所述地理距离模型融合到兴趣地点推荐框架;
训练所述兴趣地点推荐框架,根据所述兴趣地点推荐模型的输出结果引入条件概率分布模型;
通过所述条件概率分布模型生成推荐兴趣地点的概率分布,根据所述概率分布生成兴趣地点推荐列表。
本发明第三方面还提供一种计算机可读存储介质,所述计算机可读存储介质中包括一种基于大数据的兴趣地点推荐程序,所述一种基于大数据的兴趣地点推荐方法程序被处理器执行时,实现如上述任一项所述的一种基于大数据的兴趣地点推荐方法的步骤。
本发明公开了一种基于大数据的偏好地点推荐方法、系统及可读存储介质,包括:将目标用户及兴趣地点进行低维嵌入式表达,并通过目标用户及兴趣地点的隐变量构建相似度矩阵;将所述相似度矩阵转换为节点距离矩阵;建立距离信息分解模型,确定目标用户及兴趣地点在低维空间中的节点距离向量;通过距离向量建立兴趣地点的地理偏好模型,根据所述地理偏好模型对低维空间中节点距离进行排序,通过排序生成目标用户对兴趣地点的偏好程度,从而实现对目标用户的兴趣地点推荐。本发明利用学习目标用户和兴趣地点在低维空间中节点距离进行排序同时生成推荐信息,避免了传统矩阵分解方法的不足,另一方面在建立模型时考虑目标用户兴趣的动态变化因素,确保了推荐的有效性,还通过用户的反馈信息对地理偏好模型进行修正,使得模型具有良好的推荐效果并使得推荐内容更加准确。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。