一种联合主题模型和异质信息网络的评分预测方法与流程

文档序号:19421158发布日期:2019-12-14 01:29阅读:来源:国知局

技术特征:

1.一种联合主题模型和异质信息网络的评分预测方法,其特征在于包含如下步骤:

步骤(1)针对指定用户商品对,利用主题模型提取评论信息,从而构建用户和商品的向量表示;

步骤(2)利用商品属性信息和用户共同购买信息构建异质信息网络;

步骤(3)从异质网络中提取出用户商品对的最终关系表示向量;

步骤(4)针对用户商品对,连接用户向量、关系表示向量、商品向量表示,并输入到afm实现评分预测;

步骤5、根据模型计算出的预测评分数据和真实评分数据,计算rmse值,并把此值作为模型效果的评价指标。

2.根据权利要求1所述的一种联合主题模型和异质信息网络的评分预测方法,其特征在于步骤(1)具体实现如下:

1-1.首先通过双向lstm获取评论中某个单词的上下文向量表示;假设用户表示为一个k维的潜在因子向量,其中的每一维表示用户对相关主题喜爱程度;即k表示主题的个数;

1-2.为每一个主题设置一个上下文主题向量vk∈rdim,对于用户的第i条评论,表示为(wi,1,wi,2,wi,3…,wi,t),其中t表示单词的个数,wi,t表示单词对应的上下文表示向量:

首先通过一层的mlp获取单词wi,t在第k个主题下的隐藏表示

其次将单词表示向量和第k个主题的相似度,作为此单词对这个主题的重要权重,并且通过softmax函数获取标准重要权重

接着通过每个单词向量的加权求和来表示此条评论在这个主题上的表示

最终通过一层mlp把此条评论向量映射为一个对主题相关度的值ci,k;

最终第i条评论,映射到每一个主题之后的最终表示为ci=[ci,1,ci,2,…,ci,k];其中ci,k表示第i条评论对第k个主题相关程度值;表示隐藏参数矩阵,它把单词向量hi,t转换为主题k下的隐藏向量表示,表示可训练的偏差向量.表示此单词对主题k的重要程度;表示映射矩阵,它把评论在主题k的表示映射为对相应主题的反映程度值;表示偏差系数;

1-3.首先针对每个用户获取u∈rlu×k,其中lu表示用户评论的个数,k表示主题的个数,也是用户表示向量的维度;u=[c1,c2,…,clu],其中ci∈rk表示用户第i条评论的表示向量.同理针对每个商品我们用v∈rlv×k,其中lv表示商品评论的条数;通过直接相乘获得关联矩阵的结果,然后对每行元素的最大池化来获取此条评论的重要程度,接着通过一个softmax层获取标准化的重要程度值,最后通过用户矩阵中行向量的线性加权来获取最终的用户表示;

wr=umvt(5)

其中m∈rk×k,表示可训练的中间矩阵;wr∈rlu×lv,表示最终获得的关联矩阵;

接着通过最大行池化来计算每条评论的重要程度,并最终获得用户的一个向量表示:

au=softmax(maxrow(wr))(6)

au∈rlu×1向量的每一维表示对应评论的重要程度权重值,表示最终的用户向量表示.上面的公式(7)中,只对用户每条评论重要程度进行选择,并没有针对物品,主要是因为在现实世界中,商品的特点相对稳定。

3.根据权利要求2所述的一种联合主题模型和异质信息网络的评分预测方法,其特征在于步骤2具体实现如下:

利用商品属性信息和用户共同购买信息构建异质信息网络,根据三种元路径构建异质信息网络,三种元路径分别为ubub、ubcatb和ubbrdb,其中ubub表示用户共同购买信息;ubcatb表示和用户以前购买商品的类别相同的商品;ubbrdb表示和用户以前购买商品的品牌相同的商品。

4.根据权利要求3所述的一种联合主题模型和异质信息网络的评分预测方法,其特征在于步骤3具体实现如下:

3-1.首先通过metapath2vec++获取所有节点的初始向量表示,提取信息的时候采用cnn卷积每种类型元路径的所有实例数据:

其中,hu,i,p,s∈rl1表示对于指定的用户和商品对,元路径类型为p的某个具体路径s卷积后的向量表示;fu→i,p∈rl1表示对于指定的用户商品对,元路径类型为p的关联向量表示;

3-2.通过注意力机制实现不同路径信息的融合:

用fu→i表示对于指定用户商品对,融合所有类型的元路径实例之后的向量表示,pu→i表示用户u到商品i的三种元路径类型集合,由于最终要进行评分预测,把从评论中提取的信息也关联到attention中,设计一个两层的结构来实现attention:

au,i,p=relu(w2αu,i,p+b)(11)

其中[]表示的是连接操作,表示主题模型中提取出的用户向量表示,表示主题模型中提取出的商品向量表示,w1∈rl3×(l1+2×k),bv∈rl3,w2∈r1×l3都表示可训练的参数矩阵;

接着通过softmax层标准化权重大小,然后通过线性加权获得用户商品对的表示向量:

其中fu→i,p表示用户u和商品i,在元路径类型为p下的关联向量,au,i,p表示对用关联向量的权重系数。

5.根据权利要求4所述的一种联合主题模型和异质信息网络的评分预测方法,其特征在于步骤4具体实现如下:

针对用户商品对,连接用户向量、关系表示向量、商品对的表示向量,并输入到afm实现评分预测;把三个向量直接连接组成最终afm输入x,其中

其中,表示评论信息中提取的用户表示向量,表示商品所受到的所有评论中提取出的商品表示向量,fu→i表示商品属性信息和用户共同购买信息中提取出的表示向量;⊙表示向量之间的乘积,{v1,v2…,vn}表示因子参数向量,用来表示任意二维特征xi和xj的交互;aij表示特征xi和xj交互之后的二维特征的权重系数;wi表示一维特征xi的重要程度系数;w0是全局偏差系数。


技术总结
本发明公开了一种联合主题模型和异质信息网络的评分预测方法。本发明步骤如下:步骤(1)针对指定用户商品对,利用主题模型提取评论信息,从而构建用户和商品的向量表示;步骤(2)利用商品属性信息和用户共同购买信息构建异质信息网络;步骤(3)从异质网络中提取出用户商品对的最终关系表示向量;步骤(4)针对用户商品对,连接用户向量、关系表示向量、商品向量表示,并输入到AFM实现评分预测;步骤5、根据模型计算出的预测评分数据和真实评分数据,计算RMSE值,并把此值作为模型效果的评价指标。本发明解决了评分预测中出现的冷启动,可解释性不强,准确率不高的问题。

技术研发人员:汤景凡;张秀杰;张旻;姜明;黄涛;吴鑫强
受保护的技术使用者:杭州电子科技大学
技术研发日:2019.07.10
技术公布日:2019.12.13
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1