1.一种联合主题模型和异质信息网络的评分预测方法,其特征在于包含如下步骤:
步骤(1)针对指定用户商品对,利用主题模型提取评论信息,从而构建用户和商品的向量表示;
步骤(2)利用商品属性信息和用户共同购买信息构建异质信息网络;
步骤(3)从异质网络中提取出用户商品对的最终关系表示向量;
步骤(4)针对用户商品对,连接用户向量、关系表示向量、商品向量表示,并输入到afm实现评分预测;
步骤5、根据模型计算出的预测评分数据和真实评分数据,计算rmse值,并把此值作为模型效果的评价指标。
2.根据权利要求1所述的一种联合主题模型和异质信息网络的评分预测方法,其特征在于步骤(1)具体实现如下:
1-1.首先通过双向lstm获取评论中某个单词的上下文向量表示;假设用户表示为一个k维的潜在因子向量,其中的每一维表示用户对相关主题喜爱程度;即k表示主题的个数;
1-2.为每一个主题设置一个上下文主题向量vk∈rdim,对于用户的第i条评论,表示为(wi,1,wi,2,wi,3…,wi,t),其中t表示单词的个数,wi,t表示单词对应的上下文表示向量:
首先通过一层的mlp获取单词wi,t在第k个主题下的隐藏表示
其次将单词表示向量
接着通过每个单词向量的加权求和来表示此条评论在这个主题上的表示
最终通过一层mlp把此条评论向量映射为一个对主题相关度的值ci,k;
最终第i条评论,映射到每一个主题之后的最终表示为ci=[ci,1,ci,2,…,ci,k];其中ci,k表示第i条评论对第k个主题相关程度值;
1-3.首先针对每个用户获取u∈rlu×k,其中lu表示用户评论的个数,k表示主题的个数,也是用户表示向量的维度;u=[c1,c2,…,clu],其中ci∈rk表示用户第i条评论的表示向量.同理针对每个商品我们用v∈rlv×k,其中lv表示商品评论的条数;通过直接相乘获得关联矩阵的结果,然后对每行元素的最大池化来获取此条评论的重要程度,接着通过一个softmax层获取标准化的重要程度值,最后通过用户矩阵中行向量的线性加权来获取最终的用户表示;
wr=umvt(5)
其中m∈rk×k,表示可训练的中间矩阵;wr∈rlu×lv,表示最终获得的关联矩阵;
接着通过最大行池化来计算每条评论的重要程度,并最终获得用户的一个向量表示:
au=softmax(maxrow(wr))(6)
au∈rlu×1向量的每一维表示对应评论的重要程度权重值,
3.根据权利要求2所述的一种联合主题模型和异质信息网络的评分预测方法,其特征在于步骤2具体实现如下:
利用商品属性信息和用户共同购买信息构建异质信息网络,根据三种元路径构建异质信息网络,三种元路径分别为ubub、ubcatb和ubbrdb,其中ubub表示用户共同购买信息;ubcatb表示和用户以前购买商品的类别相同的商品;ubbrdb表示和用户以前购买商品的品牌相同的商品。
4.根据权利要求3所述的一种联合主题模型和异质信息网络的评分预测方法,其特征在于步骤3具体实现如下:
3-1.首先通过metapath2vec++获取所有节点的初始向量表示,提取信息的时候采用cnn卷积每种类型元路径的所有实例数据:
其中,hu,i,p,s∈rl1表示对于指定的用户和商品对,元路径类型为p的某个具体路径s卷积后的向量表示;fu→i,p∈rl1表示对于指定的用户商品对,元路径类型为p的关联向量表示;
3-2.通过注意力机制实现不同路径信息的融合:
用fu→i表示对于指定用户商品对,融合所有类型的元路径实例之后的向量表示,pu→i表示用户u到商品i的三种元路径类型集合,由于最终要进行评分预测,把从评论中提取的信息也关联到attention中,设计一个两层的结构来实现attention:
au,i,p=relu(w2αu,i,p+b)(11)
其中[]表示的是连接操作,
接着通过softmax层标准化权重大小,然后通过线性加权获得用户商品对的表示向量:
其中fu→i,p表示用户u和商品i,在元路径类型为p下的关联向量,au,i,p表示对用关联向量的权重系数。
5.根据权利要求4所述的一种联合主题模型和异质信息网络的评分预测方法,其特征在于步骤4具体实现如下:
针对用户商品对,连接用户向量、关系表示向量、商品对的表示向量,并输入到afm实现评分预测;把三个向量直接连接组成最终afm输入x,其中
其中,