一种带有时间权重的异构信息网络推荐方法与流程

文档序号:17587689发布日期:2019-05-03 21:28阅读:258来源:国知局
一种带有时间权重的异构信息网络推荐方法与流程
本发明属于通信
技术领域
,尤其涉及一种带有时间权重的异构信息网络推荐方法。
背景技术
:异构信息网络(heterogeneousinformationnetwork,hin)中节点和边的类型有多种,这使其能比通常的同构网络更好的表达各类复杂真实的数据,如著作网络数据、社会网络数据、知识图谱等。hin率先被用于解决信息检索中相似对象搜索问题,近年来也被用于链路预测、聚类、分类以及推荐等领域。数据的稀疏性,一直是推荐系统领域面临的严峻问题之一。由于用户和商品数量庞大,因此用户和商品之间的交互记录将会非常稀疏,这就使得推荐算法的依据不够充足。为了缓解数据稀疏性,很多学者提出要将边信息(sideinformation)融入推荐算法,如用户的社交网络信息、用户和商品的特征信息、用户交互过程中产生的文本图片等信息。基于异构信息网络挖掘的推荐方法虽然取得了良好的推荐效果,但仍然存在诸多挑战。比如,当前的异构信息网络并未考虑时间因素对边信息的影响。在真实的推荐系统中,用户的偏好和需求会随着时间发生变化,不同时期可能喜欢不一样的商品,这也说明用户的远期行为和近期行为对其当前需求的影响程度是不同的。一般来说,用户近期的行为更能反映出当前的需求和偏好。如果忽视边信息中的时间因素,推荐算法将难以及时发现用户最新的需求,生成的推荐结果也将很难被采纳,用户的使用体验也会随之下降。技术实现要素:本发明旨在解决上述问题,提供一种带有时间权重的异构信息网络推荐方法。本发明所述带有时间权重的异构信息网络推荐方法,包括通过增加时间属性构建带有时间权重的异构信息网络;所述异构信息网络包括若干元路径;任一所述元路径上任意两相邻实体间的关系带有时间属性,即为带有时间权重的元路径;及时间偏差矩阵,用于记录时间因素对两相邻实体之间关系的影响程度;及邻接矩阵,用于表示元路径上相邻实体之间的关系。如用户和商品之间的邻接矩阵表示用户和商品之间的评分关系,矩阵中的元素代表相应用户对相应商品的评分;及带有时间权重的交换矩阵,通过时间偏差矩阵和邻接矩阵构建带有时间权重的交换矩阵,用于表示用户与商品在元路径上的相关性;及预测矩阵,用于预测用户对商品的评分;建立推荐模型:将元路径上带有时间权重的关系对应的邻接矩阵与对应的时间偏差矩阵做hadamard(哈德曼)积,得到新的带有时间权重的邻接矩阵;将元路径上各相邻实体的邻接矩阵依次相乘,得到带有时间权重的交换矩阵。将带有时间权重的交换矩阵分解为用户因子矩阵和商品因子矩阵两个矩阵;对于任一元路径,通过对用户因子矩阵和商品因子矩阵的优化,构建预测矩阵,获得预测结果;采用线性组合的方式将多条元路径的预测结果进行融合,获得最终用户商品评分;依据最终用户商品评分进行推荐。本发明所述带有时间权重的异构信息网络推荐方法,所述带有时间权重的异构信息网络设定模式为带有时间权重的信息网络设定为g=(v,e,t);且满足映射关系当即实体类型不只一种,或者关系类型不只一种,g为异构信息网络;反之,g为同构信息网络;当且时,g为带有时间权重的异构信息网络;反之,g为普通异构信息网络;其中,为实体类型集合,为关系类型集合,为关系对应的时间属性集合;v为节点集,e为边集,t为时间属性集。本发明所述带有时间权重的异构信息网络推荐方法,所述元路径设定为p,表达式为当元路径p上任意一个关系ri带有时间属性,则p为带有时间权重的元路径;其中δi(ri)为时间属性函数,考虑关系ri的时间属性对元路径的影响,对ri对应的邻接矩阵进行变换,假设ri对应的邻接矩阵为wi,ri对应的时间偏差矩阵为ti,则δi(ri)=wi⊙ti。本发明所述带有时间权重的异构信息网络推荐方法,所述时间偏差矩阵定义为其计算公式如下:其中,tlk指ai和aj之间关系发生的时间;current为超参数,指当前时间;β也为一个超参数。本发明所述带有时间权重的异构信息网络推荐方法,所述交换矩阵设定为其中,是ai类型实体和aj类型实体之间的邻接矩阵,是ai和aj之间关系的时间偏差矩阵,可以反映时间因素对关系的影响程度,⊙为哈达玛积运算。本发明所述带有时间权重的异构信息网络推荐方法,所述交换矩阵cp分解为用户因子矩阵up和商品因子矩阵mp,所述用户因子矩阵包括用户的隐性特性;所述商品因子矩阵包括商品的隐性特性;通过以下优化函数得到cp≈upmp;其中,λu和λm为超参数,用以防止过拟合现象;对于l条元路径,可得到l组用户和商品的隐特征,记作u(1),m(1),...,u(l),m(l)。本发明所述带有时间权重的异构信息网络推荐方法,所述任意一条元路径pl,用户商品评分预测矩阵公式表示为:本发明所述带有时间权重的异构信息网络推荐方法,所述最终用户商品评分方程为:其中,ω=(ω(1),...,ω(l))为元路径的权重向量。本发明所述带有时间权重的异构信息网络推荐方法,所述元路径的权重向量ω=(ω(1),...,ω(l))的优化函数为:本发明所述带有时间权重的异构信息网络推荐方法,所述用户商品评分还包括用户偏差项和商品偏差项用户商品评分预测矩阵公式表示为:其中,是预测的用户ui对商品mj的评分;是用户ui的隐特征向量;是商品mj的隐特征向量;和分别为用户偏差项和商品偏差项的计算公式如下:其中,和分别指用户ui在推荐系统中第一次和最后一次打分时间,指用户ui打过分的所有商品类型数量;其中,和分别指商品mj在推荐系统中第一次和最后一次被评分的时间,指商品mj被评分的总次数;优化后元路径pl最终的计算公式如下:本发明所述带有时间权重的异构信息网络推荐方法,通过设置带有时间权重的异构信息网络、元路径以及交换矩阵,使传统异构信息网络不仅能够容纳大量语义信息,还能考虑这些信息随时间的变化情况。通过时间偏差矩阵,将时间因素对用户偏好的影响量化。通过用户偏差项和商品偏差项,考虑需求稳定的特殊用户以及优质商品,在原有基础上对算法进行了优化。附图说明图1为本发明所述带有时间权重的异构信息网络推荐方法流程示意图;图2为本发明实施例二元路径结构示意图。具体实施方式下面结合附图及实施例对本发明所述带有时间权重的异构信息网络推荐方法进行详细说明。实施例一本发明所述带有时间权重的异构信息网络推荐方法,包括通过增加时间属性构建带有时间权重的异构信息网络;所述异构信息网络包括若干元路径;任一所述元路径上任意两相邻实体间的关系带有时间属性,即为带有时间权重的元路径;及时间偏差矩阵,用于记录时间因素对两相邻实体之间关系的影响程度;及邻接矩阵,用于表示元路径上相邻实体之间的关系。如用户和商品之间的邻接矩阵表示用户和商品之间的评分关系,矩阵中的元素代表相应用户对相应商品的评分;及带有时间权重的交换矩阵,通过时间偏差矩阵和邻接矩阵构建带有时间权重的交换矩阵,用于表示用户与商品在元路径上的相关性;及预测矩阵,用于预测用户对商品的评分;建立推荐模型:如图1所示,将带有时间权重的交换矩阵分解为用户因子矩阵和商品因子矩阵两个矩阵;对于任一元路径(不特指带有时间权重的元路径),通过对用户因子矩阵和商品因子矩阵的优化,及时间偏差矩阵构建预测矩阵,获得预测结果;采用线性组合的方式将多条元路径的预测结果进行融合,获得最终用户商品评分;依据最终用户商品评分进行推荐。本发明所述带有时间权重的异构信息网络推荐方法,所述带有时间权重的异构信息网络设定模式为带有时间权重的信息网络设定为g=(v,e,t);且满足映射关系当即实体类型不只一种,或者关系类型不只一种,g为异构信息网络;反之,g为同构信息网络;当且时,g为带有时间权重的异构信息网络;反之,g为普通异构信息网络;其中,为实体类型集合,为关系类型集合,为关系对应的时间属性集合;v为节点集,e为边集,t为时间属性集。本发明所述带有时间权重的异构信息网络推荐方法,所述元路径设定为p,表达式为当元路径p上任意一个关系ri带有时间属性,则p为带有时间权重的元路径;其中δi(ri)为时间属性函数,考虑关系ri的时间属性对元路径的影响,对ri对应的邻接矩阵进行变换,假设ri对应的邻接矩阵为wi,ri对应的时间偏差矩阵为ti,则δi(ri)=wi⊙ti。本发明所述带有时间权重的异构信息网络推荐方法,所述时间偏差矩阵定义为其计算公式如下:其中,tlk指ai和aj之间关系发生的时间;current为超参数,指当前时间;β也为一个超参数。本发明所述带有时间权重的异构信息网络推荐方法,所述交换矩阵设定为其中,是ai类型实体和aj类型实体之间的邻接矩阵,是ai和aj之间关系的时间偏差矩阵,可以反映时间因素对关系的影响程度,⊙为哈达玛积运算。本发明所述带有时间权重的异构信息网络推荐方法,所述交换矩阵cp分解为用户因子矩阵up和商品因子矩阵mp,所述用户因子矩阵包括用户的隐性特性;所述商品因子矩阵包括商品的隐性特性;通过以下优化函数得到cp≈upmp;其中,λu和λm为超参数,用以防止过拟合现象;对于l条元路径,可得到l组用户和商品的隐特征,记作u(1),m(1),...,u(l),m(l)。本发明所述带有时间权重的异构信息网络推荐方法,所述任意一条元路径pl,用户商品评分预测矩阵公式表示为:本发明所述带有时间权重的异构信息网络推荐方法,所述最终用户商品评分方程为:其中,ω=(ω(1),...,ω(l))为元路径的权重向量。本发明所述带有时间权重的异构信息网络推荐方法,所述元路径的权重向量ω=(ω(1),...,ω(l))的优化函数为:本发明所述带有时间权重的异构信息网络推荐方法,所述用户商品评分还包括用户偏差项和商品偏差项用户商品评分预测矩阵公式表示为:其中,是预测的用户ui对商品mj的评分;是用户ui的隐特征向量;是商品mj的隐特征向量;和分别为用户偏差项和商品偏差项的计算公式如下:其中,和分别指用户ui在推荐系统中第一次和最后一次打分时间,指用户ui打过分的所有商品类型数量;其中,和分别指商品mj在推荐系统中第一次和最后一次被评分的时间,指商品mj被评分的总次数;优化后元路径pl最终的计算公式如下:实施例二首先,提出带有时间权重的异构信息网络概念;其次,在挖掘异构信息网络时采用了经典的元路径法,并依据元路径上的时间信息构造了一个时间偏差矩阵t,以此区分用户远期行为和近期行为对当前需求的影响程度;再得到每条元路径对应的推荐结果,最终的推荐结果由各条元路径对应推荐结果线性融合得到;最后,考虑到某些用户可能具有稳定的需求和偏好,某些优质商品可能具有持久的关注度,因此在最终的推荐结果中加入了用户偏差项和商品偏差项进行优化。带有时间权重的异构信息网络(time-weightedheterogeneousinformationnetwork,thin):给定基本模式为实体类型集合,为关系类型集合,为关系对应的时间属性集合。g=(v,e,t)为带有时间权重的信息网络,v为节点集,e为边集,t为时间属性集,且满足映射关系某个节点v∈v属于某一种实体类型同理某个边e∈e属于某一种关系类型某个时间属性t∈t属于某一种关系对应的时间属性当即实体类型不只一种,或者关系类型不只一种,g为异构信息网络;反之,g为同构信息网络。当且时,g为带有时间权重的异构信息网络;反之,g为普通异构信息网络。对于复杂的异构信息网络,可将其分解为若干个元路径进行分析。元路径,是异构信息网络的一种基本网络结构,它是一条有向的路径,由若干实体和关系连接组成。以下给出了带有时间权重的元路径定义。带有时间权重的元路径(time-weightedmetapath):给定元路径p,表达为当路径p上任意一个关系ri带有时间属性,则p为带有时间权重的元路径,其中δi(ri)为一个时间属性函数,用以衡量时间对于关系ri的影响。对于一个带有时间权重的异构信息网络,它的元路径既可以有时间属性,也可以没有时间属性。如图2所示给出了从ciaodvd数据集中抽取出的4条元路径,由于原数据集中包含用户打分的具体时间,因此p1、p2和p4为带有时间权重的元路径,p3为普通元路径。对于得到的元路径,利用交换矩阵来衡量元路径源节点(用户)和目标节点(商品)之间的相关性。带有时间权重的交换矩阵(time-weightedcommutingmatrix):对于带有时间权重的元路径p=(a1→a2→...→al),它的交换矩阵为其中是ai类型实体和aj类型实体之间的邻接矩阵,是ai和aj之间关系的时间偏差矩阵,可以反映时间因素对关系的影响程度。⊙为哈达玛积运算。矩阵cp的元素cp(m,n)表示,实体a1m∈a1和实体aln∈al在元路径p上的相关性。如果ai和aj之间的关系没有时间属性,那么的所有元素均为1。如图2所示的元路径p2,它的交换矩阵其中wum为用户实体和商品实体之间的邻接矩阵,实际上就是用户评分矩阵;wmm为商品实体之间的邻接矩阵,当矩阵元素为1时,表示对应商品属于同一类型;tum表示用户给商品评分的时间。时间偏差矩阵;时间偏差矩阵用于记录时间因素对ai和aj之间关系的影响程度,其计算公式如下:其中tlk指ai和aj之间关系发生的时间,如2017-12-12;current为超参数,指当前时间;β也是一个超参数,通常可以通过交叉验证获得最佳取值,本实施例中β=0.5。在中,关系发生时间距离当前时间越接近,其影响力越大,对应越大,这与现实场景相符。推荐模型;使用隐向量模型的思想,将交换矩阵cp分解为两个低维矩阵up和mp,分别代表用户的隐性特征和商品的隐性特征。为了提高矩阵分解的效率,采用funksvd算法替代传统的svd(奇异值分解)。通过以下优化函数,得到cp≈upmp。λu和λm为超参数,用以防止过拟合现象。对于l条元路径,能够得到l组用户和商品的隐特征,记作u(1),m(1),...,u(l),m(l)。对于某一条元路径pl,它的用户商品评分预测矩阵不同的元路径,得到的预测结果不同,采用线性组合的方式将多条元路径的预测结果进行融合。最终的预测矩阵其中元路径的权重向量ω=(ω(1),...,ω(l))通过以下优化函数获得:用户偏差项和商品偏差项;推荐结果的获得,考虑了时间因素对于用户需求的影响,认为用户的近期行为比远期行为具有更大的影响力。但值得考虑的是:有些用户的需求和偏好是相对稳定的,随时间变化较小;而有些优质商品的受关注度也是持久的。这说明当前的很可能忽略了用户的一些稳定需求以及一些优质的商品。为了解决该问题,在每对“用户-商品”的预测评分的计算公式中设置用户偏差项和商品偏差项,新的计算如下:是预测的用户ui对商品mj的评分;是用户ui的隐特征向量;是商品mj的隐特征向量;和分别为用户偏差项和商品偏差项,计算公式如下:和分别指用户ui在推荐系统中第一次和最后一次打分时间,指用户ui打过分的所有商品类型数量。越大,表示用户偏好和需求的稳定性越强。和分别指商品mj在推荐系统中第一次和最后一次被评分的时间,指商品mj被评分的总次数。越大,表示商品越优质,受关注度越持久。因此,优化后元路径pl最终的计算如下:各条元路径的融合方式不变。实施例三(一)数据集在ciaodvd数据集上进行了实验,验证本发明所述方法的有效性ciaodvd数据包含17615个用户、16121部电影、72665条评分行为,以及用户间的信任关系和电影的属性信息。数据集的详细信息如下表:表1关系(a-b)a的数量b的数量(a-b)的数量用户-电影(评分行为)176151612172665用户-评论(评论撰写行为)21019716331635480用户-用户(信任关系)1438429940133评论-电影(评分行为)726651612172665(二)评价指标采用rmse(均方根误差)和mae(平均绝对误差)来评估方法的有效性;rtest指整个测试集,ru,m是真实评分,为预测评分。mae和rmse越小,表示算法精度越高。(三)比较对象选择近几年来两种经典的且相关算法的推荐算法作为比较对象,分别是pmf和hetemf。其中pmf采用矩阵分解的方式进行推荐,hetemf是将矩阵分解运用于异构信息网络挖掘来实现推荐。(四)实验结果pmfhetemftmprmse0.7670.7510.723mae0.6010.5650.542对比pmf和tmp发现:tmp算法和pmf算法,从根本上都使用了矩阵分解的思想,但tmp将异构信息融入推荐,极大的缓解了原始数据的稀疏性,因此预测精度得到提高,tmp指带有时间权重的异构信息网络推荐方法的结果。对比hetemf和tmp发现:hetemf和tmp都运用了基于元路径的异构信息网络挖掘思想,但tmp将时间因素纳入推荐策略的设计,使得预测精度得到了提高。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1