
1.本发明属于计算机技术推荐算法领域,尤其涉及带有停留时间的图卷积网络会话推荐算法。
背景技术:2.本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
3.伴随着互联网的发展,各种各样的信息层出不穷。信息过载使人们找到需要的信息异常困难,推荐系统的出现,解决了这一问题。基于会话的推荐算法,帮助用户匹配不同的需求,已经在流媒体、电子商务等广泛应用,具有高度的实用价值。
4.在现实生活中,短视频、淘宝购物以及家电产业链等场景都是根据历史记录进行推荐;用户在一个项目上的停留时间反映了对项目的喜爱程度,停留时间越长,表明喜爱程度越高,像京东、淘宝这种购物网站,通常会记录用户的浏览时间,根据用户的浏览时间,以此分析出用户的偏好。相比于根据点击次数对用户进行推荐,提高了推荐的效率。传统的推荐算法是根据用户的历史记录进行推荐,忽略项目之间的潜在关系,基于会话的推荐是根据用户在一段时间内的会话序列进行推荐,最可能反映用户的短期兴趣偏好,基于图神经网络的会话推荐,不仅能反映用户的短期兴趣偏好,还能挖掘项目之间的潜在关系,对用户进行长期偏好预测,通过结合用户短期偏好和长期偏好,进行精准推荐。
5.wu,zhu等人提出基于会话的图神经网络推荐算法,把图神经网络应用到基于会话的推荐,证明了图神经网络在推荐方面的优越性;wang,cai等人提出的基于会话的注意力增强图神经网络推荐算法,该方法利用目标注意力网络捕获了与目标项目相关的特定用户兴趣,利用自我注意机制捕获不同项目的不同优先级;但这两种推荐算法存在以下问题:只是固定地把会话序列构造成会话图,忽略了可以引入一些特性合并到会话图中,导致推荐效果不佳,而且经过图神经网络得到的节点向量特征,容易出现过拟合问题。
技术实现要素:6.为克服上述现有技术的不足,本发明提供了一种带有停留时间的图卷积网络会话推荐方法,将停留时间合并到会话图中作为图卷积网络的输入,得到的节点向量特征经过特征选择层作为目标注意力网络的输入,防止过拟合,提高推荐的精确度。
7.为实现上述目的,本发明的一个或多个实施例提供了如下技术方案:
8.本发明第一方面提供了带有停留时间的图卷积网络会话推荐方法;
9.带有停留时间的图卷积网络会话推荐方法,包括:
10.获取项目和会话序列,对会话序列中的停留时间进行缩放;
11.基于停留时间缩放后的会话序列,构建有向会话图,根据停留时间和边的出现次数,设置会话图中边的权重;
12.通过图卷积网络提取会话图中的特征,用基于惩罚项的特征选择方法对重复特征
进行筛选;
13.利用注意力机制捕获用户长期和短期偏好,根据用户长期和短期偏好进行项目推荐。
14.进一步的,所述用户交互序列s={v
s,1
,v
s,2
,......v
s,n
},是根据时间戳排序的项目集合,停留时间t={t1,t2,......,tn}表示会话序列s停留时间分布,tn∈t表示从项目v
s,n
到项目v
s,n+1
的停留时间。
15.进一步的,采用归一化和反归一化两种方法对停留时间进行缩放。
16.进一步的,构建有向会话图gs=(vs,es),v
s,i
∈v表示一个节点代表一个项目,每条边(v
s,i-1
,v
s,i
)表示用户在会话中点击v
s,i-1
之后点击v
s,i
,为每条边设置标准化权重;
17.权重的计算方式为停留时间与出现次数相乘,表示两个节点之间关系的强度。
18.进一步的,图卷积网络中节点特征向量的提取方式,包括以下过程:
19.根据会话图,提取项目特征向量;
20.基于项目特征向量,通过激活函数,聚合节点的邻居信息;
21.利用遗忘门、输入门和输出门,获取保留的特征信息;
22.利用激活函数,得到保留的特征信息中的候选信息;
23.对遗忘门保留的信息和输入门选择的候选信息合并,得到最终的新信息;
24.用输出门对得到的新信息进行选择输出。
25.进一步的,所述特征选择,基于l1惩罚项的逻辑回归模型,保留特征中推荐值相同的特征,用l2惩罚项的逻辑回归模型进行优化。
26.进一步的,所述特征选择具体逻辑为:如果特征权重在l1为1,建一个相似的集合,如果它们的权重在l2中差别并不大并且权重在l1中为0,就将这个集合中的特征划分为l1中的等权值。
27.本发明第二方面提供了带有停留时间的图卷积网络会话推荐系统。
28.带有停留时间的图卷积网络会话推荐系统,包括:
29.停留时间缩放模块,被配置为:获取项目和会话序列,对会话序列中的停留时间进行缩放;
30.会话图构建模块,被配置为:基于停留时间缩放后的会话序列,构建有向会话图,根据停留时间和边的出现次数,设置会话图中边的权重;
31.特征提取和选择模块,被配置为:通过图卷积网络提取的会话图中的特征,用基于惩罚项的特征选择方法对重复特征进行筛选;
32.项目推荐模块,被配置为:利用注意力机制捕获用户长期和短期偏好,根据用户长期和短期偏好进行项目推荐。
33.本发明第三方面提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本发明第一方面所述的带有停留时间的图卷积网络会话推荐方法中的步骤。
34.本发明第四方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本发明第一方面所述的带有停留时间的图卷积网络会话推荐方法中的步骤。
35.以上一个或多个技术方案存在以下有益效果:
36.本发明针对会话推荐算法,提出将停留时间引入到图神经网络会话推荐之中,并增加特征选择层,对推荐的准确率和召回率进行了改进。
37.改进会话序列预处理的表示方式,提出把停留时间合并到会话图中,不仅反映用户对产品的兴趣,还能反映项目之间的潜在关系。
38.引入特征选择层,解决过拟合问题,同时将利用目标注意力网络捕获与目标项目相关的特定用户兴趣,利用自我注意力机制获得不同项目的不同优先级,再结合用户的长期和短期偏好更全面的推荐,提高预测的性能和精度。
39.本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
40.构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
41.图1为第一个实施例的方法流程图。
42.图2为第二个实施例的系统结构图。
具体实施方式
43.应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
44.需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。
45.在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
46.本发明提出的总体思路:
47.基于会话的图卷积网络以会话序列s和停留时间t作为输入,然后输出所有可能点击项目的概率作为分数,前k个得分高的项目推荐给用户,其中将停留时间合并到会话图中作为图卷积网络的输入,得到的节点向量特征经过特征选择层作为目标注意力网络的输入,然后,利用自我注意力机制获得用户的长期偏好,最后,长期和短期偏好结合,对用户进行预测。
48.实施例一
49.本实施例公开了一种带有停留时间的图卷积网络会话推荐方法;
50.如图1所示,带有停留时间的图卷积网络会话推荐方法,包括:
51.s11:获取项目和会话序列,对会话序列中的停留时间进行缩放;
52.基于会话推荐算法中,v={v1,v2,.....,vm}表示所有会话中涉及到所有项目组成的集合,用户交互序列{v
s,1
,v
s,2
,......v
s,n
},根据时间戳排序,其中交互序列s中涉及的交互项目表示为v
s,i
∈v,停留时间t={t1,t2,......,tn}表示会话序列s停留时间分布,tn∈t表示从项目v
s,n
到项目v
s,n+1
的停留时间,基于会话的推荐方法的目的是根据历史交互序列v
s,n
,预测用户下一个交互事件v
s,n+1
。
53.根据时间戳计算停留时间,测量单位为毫秒(ms),因为停留时间分布太过稀疏,影
响用户兴趣的获取,所以将停留时间合并到会话图之前,对停留时间进行缩放,采用归一化和反归一化两种方法对停留时间进行缩放,停留时间与关系强度是正相关关系(即两个项目之间的停留时间越长,它们之间的关系越强)时,用归一化方法;停留时间与关系强度是负相关关系(即两个项目之间的停留时间越短,它们之间的关系越强)时,用反归一化方法。
54.归一化的公式:
[0055][0056]
反归一化的公式:
[0057][0058]
在公式(1)和公式(2)中,t
max
和t
min
是列表中最大和最小的停留时间。缩放是根据会话顺序进行的,因此t
max
和t
min
在不同会话发生了变化。
[0059]
s12:基于停留时间缩放后的会话序列,构建有向会话图,根据停留时间和边的出现次数,设置会话图中边的权重;
[0060]
每个会话交互序列s都可以构建一个有向的会话图gs=(vs,es),v是项目节点,e是会话图中的边,在会话图中,v
s,i
∈v表示用户在会话s中一个被点击的项目,每条边(v
s,i-1
,v
s,i
)表示用户在会话中点击v
s,i-1
之后点击v
s,i
;由于很多项目可能会在序列中出现多次,为每条边分配一个标准化权重,计算方式为边出现的次数/该边的起始节点的出度;将边的出现次数权重表示为(w
s,i-1
,w
s,i
),将缩放之后的停留时间与出现次数相乘;例如,从v
s,i-1
到v
s,i
之间的转换出现三次,第一次缩放的停留时间为t
’1,第二次缩放的停留时间为t
’2,则边(w
s,i-1
,w
s,i
)的权值为3*(t
’1+t
’2),停留时间和出现次数的乘积表示两个节点之间关系的强度。
[0061]
s13:通过图卷积网络提取会话图中的特征,用基于惩罚项的特征选择方法对重复特征进行筛选。
[0062]
将每个项目v∈v嵌入到统一的向量空间,节点向量e∈rd表示经过图卷积网络学习到的项目v嵌入向量,其中d表示嵌入节点的维数,每个会话s用一个嵌入向量s表示,s由该会话图中的节点向量组成,图卷积网络非常适合基于会话的推荐,能自动提取会话图的特征,考虑到丰富的节点连接,下面是会话图节点向量的学习过程,图中节点嵌入的更新过程如下:
[0063][0064]
公式(3)中,uj→i表示从项目j转换到项目i的信息,ni表示项目i的邻居节点集。wj表示边的权重矩阵,表示项目j的嵌入。
[0065][0066][0067]
公式(4)计算v
s,i
的邻居节点信息,公式(5)将邻居节点信息转换为邻居节点的嵌入。σ(
·
)是一个激活函数,wa是一个参数矩阵。
[0068][0069][0070][0071]
分别表示遗忘门、输入门和输出门。表示从上层留下和丢弃的信息,表示需要更新的信息,表示最终输入的新信息,bf是遗忘门的偏置项,bz是输入门的偏置项、br是输出门的偏置项。
[0072][0073]
公式(9)中,利用tanh(
·
)函数重新输入信息,和上层信息中生成信息中生成是最终产生的新信息中的候选信息,b
p
是偏置项。
[0074][0075][0076]
公式(10)表示经过遗忘门保留的信息和经过输入门选择的新信息合并在一起,形成最终的新信息。公式(11)表示经过输出门从最终的新信息中选择部分信息,形成e
s,i
的新嵌入。
[0077]
图卷积网络输出的特征存在过拟合问题,本技术增加特征选择层,采用基于惩罚项的方法对特征进行选择。
[0078]
采用基于l1惩罚项的逻辑回归模型,保留特征中最终推荐值相同的特征,结合l2惩罚项的逻辑回归模型对剩余的特征进行优化。具体的说,如果特征权重在l1为1,形成一个相似的集合,集合中权重在l2中差别不大并且权重在l1中为0的特征,则将该特征划分为l1的等权值特征。
[0079]
s14:利用注意力机制捕获用户长期和短期偏好,根据用户长期和短期偏好进行项目推荐。
[0080]
构建目标注意力网络和自我注意力机制,利用目标注意力网络激活与目标项目相关的用户兴趣,采用自我注意力机制捕获用户的长期偏好,同时考虑到遥远项目之间的复杂转换,进一步计算会话s中所有项目vi与每个目标项目vi∈v之间的注意力得分,作为用户对项目的评分,根据评分结果进行项目的推荐。
[0081]
实施例二
[0082]
本实施例公开了带有停留时间的图卷积网络会话推荐系统;
[0083]
如图2所示,带有停留时间的图卷积网络会话推荐系统,包括:
[0084]
停留时间缩放模块,被配置为:获取项目和会话序列,对会话序列中的停留时间进行缩放;
[0085]
会话图构建模块,被配置为:基于停留时间缩放后的会话序列,构建有向会话图,根据停留时间和边的出现次数,设置会话图中边的权重;
[0086]
特征提取和选择模块,被配置为:通过图卷积网络提取带会话图中的特征,用基于
惩罚项的特征选择方法对重复特征进行筛选;
[0087]
项目推荐模块,被配置为:利用注意力机制捕获用户长期和短期偏好,根据用户长期和短期偏好进行项目推荐。
[0088]
实施例三
[0089]
本实施例的目的是提供一种计算机可读存储介质。
[0090]
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开实施例1所述的带有停留时间的图卷积网络会话推荐方法中的步骤。
[0091]
实施例四
[0092]
本实施例的目的是提供一种电子设备。
[0093]
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开实施例1所述的带有停留时间的图卷积网络会话推荐方法中的步骤。
[0094]
以上实施例二、三和四的装置中涉及的各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。
[0095]
本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。
[0096]
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。