信息推荐方法、装置、设备和可读存储介质与流程

文档序号:21632452发布日期:2020-07-29 02:42阅读:231来源:国知局
信息推荐方法、装置、设备和可读存储介质与流程

本发明涉及人工智能领域,尤其涉及一种信息推荐方法、装置、设备和可读存储介质。



背景技术:

在包含图书、音乐或者视频等信息的信息提供平台中,平台往往为用户提供了信息推荐的功能,帮助用户从海量的信息中选择出自己感兴趣的信息。为用户进行信息推荐,基于的主要依据之一是用户在平台中产生过的信息浏览、购买、点击、收藏、评分、评论等行为数据,而用户的这些行为数据涉及到的信息的数量在平台提供的所有信息中所占比极低,所以信息推荐是典型的数据稀疏性问题。

将深度学习模型运用于信息推荐是近年来的研究热点,其中生成对抗网络gan(generativeadversarialnetworks)能够通过生成模型和对抗模型的博弈,挖掘出用户行为语义层面的差异,使得生成的推荐结果更能体现用户的真实兴趣,然而,现有的基于irgan、graphgan、cfgan等gan模型的信息推荐方法仍然存在推荐准确率不高的问题。



技术实现要素:

针对现有技术存在的上述至少一个技术问题,本发明实施例提供一种信息推荐方法、装置、电子设备和可读存储介质。

第一方面,本发明实施例提供一种信息推荐方法,包括:

确定目标用户对应的用户特征属性向量;

将所述目标用户对应的用户特征属性向量输入至待推荐物品对应的推荐模型中,得到所述推荐模型输出的关于所述待推荐物品的兴趣偏好分的预测结果;

其中,所述推荐模型与对抗模型组成生成对抗网络;所述生成对抗网络是以随机噪声向量样本、用户特征属性向量样本作为推荐模型的输入,以用户特征属性向量样本、融合特征向量样本以及所述推荐模型输出的用户行为隐反馈特征向量样本作为对抗模型的输入训练得到;

所述融合特征向量样本是基于用户行为数据样本和所述待推荐物品对应的物品辅助信息样本确定的。

可选地,所述融合特征向量样本是基于用户行为数据样本和所述待推荐物品对应的物品辅助信息样本确定的,包括:

将所述用户行为数据样本和所述待推荐物品对应的物品辅助信息样本输入至融合模型中,得到所述融合模型输出的所述融合特征向量样本;

其中,所述融合模型是基于所述用户行为数据样本和所述待推荐物品对应的所述物品辅助信息样本作为训练样本,以及用户行为标签作为训练标签,训练得到的;所述用户行为标签用于标识用户对所述待推荐物品的是否有过操作行为。

可选地,将所述用户行为数据样本和所述待推荐物品对应的物品辅助信息样本输入至融合模型中,得到所述融合模型输出的所述融合特征向量样本,包括:

将所述用户行为数据样本和所述待推荐物品对应的物品辅助信息样本输入至所述融合模型的神经网络嵌入层,得到所述神经网络嵌入层输出的经过降维处理的用户行为数据特征向量和物品辅助信息特征向量;

将所述用户行为数据特征向量和所述物品辅助信息特征向量输入至所述融合模型的隐藏层,得到所述隐藏层输出的经过融合处理的所述融合特征向量样本。

可选地,所述生成对抗网络是以随机噪声向量样本、用户特征属性向量样本作为推荐模型的输入,并以用户特征属性向量样本、融合特征向量样本以及所述推荐模型输出的用户行为隐反馈特征向量样本作为对抗模型的输入训练得到,包括:

将所述用户特征属性向量样本和所述随机噪声向量样本输入所述推荐模型,得到所述推荐模型输出的所述用户行为隐反馈特征向量样本;

将所述用户特征属性向量样本、所述融合特征向量样本和所述用户行为隐反馈特征向量样本输入对抗模型,得到所述对抗模型输出的判别结果;

更新所述生成对抗网络的网络参数,直至所述生成对抗网络对应的损失函数满足收敛条件。

可选地,所述更新所述生成对抗网络的网络参数,包括:

采用批梯度下降法和反向传播方法,更新所述推荐模型和对抗模型的参数。

可选地,所述方法还包括:

根据关于所述待推荐物品的兴趣偏好分的预测结果,将兴趣偏好分最高的预设数量的待推荐物品推荐给目标用户。

可选地,所述用户特征属性向量样本和用户行为数据样本通过信息平台的数据库获取,所述物品辅助信息样本通过信息提供平台的数据库或外站爬虫结果汇总库获取。

第二方面,本发明实施例提供一种信息推荐装置,包括:

用户特征确定模块,用于确定目标用户对应的用户特征属性向量;

预测模块,用于将所述目标用户对应的用户特征属性向量输入至待推荐物品对应的推荐模型中,得到所述推荐模型输出的关于所述待推荐物品的兴趣偏好分的预测结果;

其中,所述推荐模型与对抗模型组成生成对抗网络;所述生成对抗网络是以随机噪声向量样本、用户特征属性向量样本作为推荐模型的输入,以用户特征属性向量样本、融合特征向量样本以及所述推荐模型输出的用户行为隐反馈特征向量样本作为对抗模型的输入训练得到;

所述融合特征向量样本是基于用户行为数据样本和所述待推荐物品对应的物品辅助信息样本确定的。

第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供的方法的步骤。

第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。

本发明实施例提供的信息推荐方法,在生成对抗网络中引入了待推荐物品对应的物品辅助信息作为训练数据,增加了模型训练数据的信息维度,能有效挖掘出用户行为和待推荐物品属性间的关系,从而提升推荐的准确率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例中信息推荐方法的流程示意图;

图2为本发明实施例中所采用的模型的结构示意图;

图3为本发明实施例中信息推荐方法的另一流程示意图;

图4为本发明实施例中信息推荐方法的又一流程示意图;

图5为本发明实施例中信息推荐方法的再一流程示意图;

图6为本发明实施例中信息推荐装置的结构示意图;

图7为本发明实施例中电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明实施例提供的信息推荐方法的流程示意图,如图1所示,该方法包括:

s110,确定目标用户对应的用户特征属性向量;

具体地,本发明实施例中的目标用户,是指要向其进行信息推荐的用户。目标用户对应的用户特征属性向量是指目标用户对应的用户特征属性的向量形式的表示。

具体地,目标用户的用户特征属性可以表征与目标用户本身相关的各项参数,其可以来源于目标用户在信息提供平台的注册信息,或者可以来源于基于目标用户在信息提供平台的各项行为所挖掘出的用户画像数据。举例而言,用户特征属性具体可以是目标用户的年龄、性别、职业、收入、偏好、地域、手机型号、注册时间、平均访问时长、是否会员等。其中,目标用户的注册信息可以随着目标用户对注册信息的修改实时更新,目标用户的用户画像数据也可以随着目标用户在信息提供平台上行为的增加而实时更新。

s120,将所述目标用户对应的用户特征属性向量输入至待推荐物品对应的推荐模型中,得到所述推荐模型输出的关于所述待推荐物品的兴趣偏好分的预测结果。

具体地,本发明实施例中的待推荐物品,可以是小说、音乐、视频等不同类型的物品,相应地目标用户也可以是电子书平台、音乐平台、视频平台等不同类型的信息提供平台的用户,本发明实施例不作具体地限定。也就是说,本发明实施例记载的信息推荐方法,适用于本领域技术人员可以做出的合理推断中任何类型的物品推荐。

本发明实施例中针对于具体地待推荐物品,使用推荐模型来进行对应的物品推荐。该推荐模型的输入可以是步骤s110中确定的目标用户对应的用户特征属性向量,推荐模型可以是一个具有推荐功能的多层神经网络模型,根据所输入的用户特征属性向量,输出的数据包含了关于所述待推荐物品的兴趣偏好分的预测结果。具体地,关于所述待推荐物品的兴趣偏好分的预测结果,可以理解为模型根据计算结果给用户对待推荐物品中的每一个都打出了相应的分值。

进一步地,所述推荐模型与对抗模型组成生成对抗网络;所述生成对抗网络是以随机噪声向量样本、用户特征属性向量样本作为推荐模型的输入,以用户特征属性向量样本、融合特征向量样本以及所述推荐模型输出的用户行为隐反馈特征向量样本作为对抗模型的输入训练得到。

具体地,图2所示了本发明实施例所采用的模型的结构示意图。本发明实施例中的推荐模型并不是单独存在的,而是与对应的对抗模型组成生成对抗网络,而本发明实施例中的推荐模型在本发明实施例描述的信息推荐方法中实现具体的推荐功能。本发明实施例中的生成对抗网络的原理就是通过推荐模型和对抗模型的共同训练,最终使得推荐模型所输出的推荐结果与真实结果几乎没有区别,此时推荐的结果最为准确。

具体地,图2中还示出了本发明实施例中相关模型训练过程涉及的输入输出数据。其中,推荐网络的输入数据为随机噪声向量样本、用户特征属性向量样本。随机噪声向量样本可以是基于高斯噪声生成的,该噪声符合正态分布,且维度与用户特征属性向量保持一致。在训练过程中,推荐模型可以通过噪声生成非真实的样本来“欺骗”对抗模型,实现与对抗模型在训练过程中的博弈。用户特征属性向量样本的含义前文已做过介绍,在此不再赘述。

用户行为隐反馈特征向量样本不仅是推荐网络的输出,还是对抗模型的输入之一。用户行为隐反馈特征向量是用于表征用户对于待推荐物品的兴趣偏好的向量。由于推荐网络的输入之一为随机噪声向量样本,因此其输出的用户行为隐反馈特征向量样本并非来自于真实数据的样本。在实际的训练过程中,正是需要大量的非真实数据的样本,和真实数据样本一起来训练对抗模型对于不同样本的判别能力。

对抗模型的另外两个输入为用户特征属性向量样本和融合特征向量样本。其中,用户特征属性向量样本前文已做过介绍。而融合特征向量样本是基于用户行为数据样本和所述待推荐物品对应的物品辅助信息样本确定的。

具体地,用户行为数据是指用户在信息提供平台对待推荐物品进行的各项操作行为。以待推荐物品为图书、信息提供平台为图书阅读app平台为例,用户行为数据可以包括用户对图书产生的阅读、笔记、评论、评分、搜索、收藏、分享、已阅读章节数、阅读时长等行为记录。因此,用户行为数据是用于表征用户对于待推荐物品喜好的真实数据。

具体地,物品辅助信息是指待推荐物品自身的属性信息。以待推荐物品为图书为例,物品辅助信息可以是书名、作者、图书关键词、图书简介、图书分类、出版社、出版时间、图书类型(连载或完结)、图书价格、营销情况、平台上榜情况、图书全网浏览量、是否有影视题材、对应影视题材简介、是否有相关热搜、站外上榜情况、站外上架平台的数量、站外推广情况等信息。有别于现有技术中通常仅采用用户行为数据,来表征用户对于待推荐物品喜好的真实数据,本发明实施例中还引入了物品辅助信息,同样作为用于分析用户对于待推荐物品喜好的真实数据之一,增加真实数据的维度。

进一步地,本发明实施例还包括根据关于所述待推荐物品的兴趣偏好分的预测结果,将兴趣偏好分最高的预设数量的待推荐物品推荐给目标用户。由于在使用训练好的推荐模型时,所输出的数据可以理解为模型根据计算结果给用户对待推荐物品打出的相应分值。由于模型的输入数据维度都可能比较高导致分值可能相差得较大,因此,本发明实施例可以对待推荐物品中的每一个的分值先进行归一化处理,得到用户对物品产生行为的可能程度。具体计算公式如下:

其中,向量为用户关于待推荐物品的兴趣偏好分的预测结果,f(u)可以为softmax函数,为用户u对具体物品ik的产生行为的可能程度。

按照上述公式,可以依次计算出用户u对于所有图书的兴趣偏好程度,再将其中产生行为可能性最高的top-n物品推荐给用户。以图书为例,也可以在用户未曾阅读过的图书中,将用户产生行为可能性最高的预设数量的几本图书推荐给用户。

进一步地,所述用户特征属性向量样本和用户行为数据样本通过信息平台的数据库获取,所述物品辅助信息样本通过信息提供平台的数据库或外站爬虫结果汇总库获取。首先,本发明实施例中用户特征属性向量、用户行为数据、物品辅助信息中的一部分都属于信息提供平台本身就包含的数据,根据平台各类数据的更新实时地保存在平台的数据库中,因此,直接通过信息提供平台的数据库,就能获取到这些数据作为训练数据。物品辅助信息中包含的图书全网浏览量、是否有相关热搜、站外上榜情况等数据不是平台本身记录的信息,是平台数据库无法提供的,需要通过爬虫方法在外站进行获取。

本发明实施例提供的信息推荐方法,在所使用的生成对抗网络中引入了待推荐物品对应的物品辅助信息作为训练数据,增加了模型训练数据的信息维度,能有效挖掘出用户行为和待推荐物品属性间的关系,从而提升推荐的准确率。

基于上述任一实施例,图3为本发明实施例提供的信息推荐方法的流程示意图,如图3所示,所述融合特征向量样本是基于用户行为数据样本和所述待推荐物品对应的物品辅助信息样本确定的,包括:

s310,将所述用户行为数据样本和所述待推荐物品对应的物品辅助信息样本输入至融合模型中,得到所述融合模型输出的所述融合特征向量样本。

具体地,本发明实施例描述了对抗模型的输入之一融合特征向量样本,是如何由用户行为数据样本和待推荐物品对应的物品辅助信息样本生成的。如图2所示,本发明实施例除了生成对抗网络中的推荐模型和对抗模型,还包括一个融合模型,对对抗模型的输入数据之一进行前置处理。

步骤s310具体包括:

s311,将所述用户行为数据样本和所述待推荐物品对应的物品辅助信息样本输入至所述融合模型的神经网络嵌入层,得到所述神经网络嵌入层输出的经过降维处理的用户行为数据特征向量和物品辅助信息特征向量。

具体地,在融合模型中,首先需要将用户行为数据样本和物品辅助信息样本输入至神经网络嵌入层(embedding)。神经网络嵌入层能将离散的数据序列映射为连续的向量,同时能够挖掘变量间的关系,常用于深度学习模型输入数据的前置处理,实现稀疏数据的密集化。而本发明实施例中的用户行为数据也属于典型的高维稀疏型数据,使用神经网络嵌入层将其降维后,能够大大提高模型训练的效率。本发明实施例中可以设置两个结构相同的神经网络嵌入层,分别对用户行为数据样本和物品辅助信息样本进行降维处理,生成用户行为数据特征向量和物品辅助信息特征向量。

s312,将所述用户行为数据特征向量和所述物品辅助信息特征向量输入至所述融合模型的隐藏层,得到所述隐藏层输出的经过融合处理的所述融合特征向量样本。

在得到经过降维处理的用户行为数据特征向量和物品辅助信息特征向量之后,本步骤使用隐藏层将两个向量进行融合处理,得到对抗网络的输入之一融合特征向量样本。该融合特征向量样本是用户行为和物品信息相结合的真实数据的低维、融合形式的表示。将该数据输入生成对抗网络后,可以使得生成对抗网络的推荐模型学习用户行为和物品本身特性相关的数据分布函数,从而提升推荐的准确性。具体输出的融合特征向量样本ru与推荐网络输出的向量维度保持一致,具体计算公式为:ru=f(λe+b);

其中b为隐藏层的偏置项,λ为隐藏层的参数,e为融合模型的输入向量,f为激活函数,该激活函数可以采用relus函数。

进一步地,本发明实施例中的融合模型是基于所述用户行为数据样本和所述待推荐物品对应的所述物品辅助信息样本作为训练样本,以及用户行为标签作为训练标签,训练得到的;所述用户行为标签用于标识用户对所述待推荐物品是否有过操作行为。

具体地,融合模型需要通过训练,使得融合模型所生成的融合特征向量样本尽可能真实完整地反映用户行为数据样本和所述待推荐物品对应的物品辅助信息样本的内容,最终满足收敛条件。其训练的过程是基于所述用户行为数据样本和所述待推荐物品对应的所述物品辅助信息样本作为训练样本,以及用户行为标签作为训练标签进行训练的。本发明实施例中,融合模型的训练过程应该在生成对抗网络的训练之前,只有先训练好融合模型,才能保证输入生成对抗网络的融合特征向量样本与真实数据相符合。

具体地,用户行为标签用于标识用户对所述待推荐物品是否有过操作行为。具体而言,假设用户对图书产生行为的标签集合a,aij∈a,aij∈{0,1},其中aij表示用户i对图书j的行为,1表示有过行为,0表示没有行为。使用用户行为标签作为训练标签,可以有效地检验所生成的融合特征向量样本是否与用户行为标签中的数据相符合,从而优化融合模型中神经网络嵌入层和隐藏层的参数。

本发明实施例提供的信息推荐方法,通过融合模型对生成对抗网络的输入数据进行了降维和融合的前置处理,使得具有稀疏性的用户行为数据更加密集化,从而提高了后续生成对抗网络训练的效率。

基于上述任一实施例,图4为本发明实施例提供的信息推荐方法的流程示意图,如图4所示,所述生成对抗网络是以随机噪声向量样本、用户特征属性向量样本作为推荐模型的输入,并以用户特征属性向量样本、融合特征向量样本以及所述推荐模型输出的用户行为隐反馈特征向量样本作为对抗模型的输入训练得到,包括:

s410,将所述用户特征属性向量样本和所述随机噪声向量样本输入所述推荐模型,得到所述推荐模型输出的所述用户行为隐反馈特征向量样本;

具体地,本步骤中首先需要在用户特征属性向量的数据集中随机获取一个用户特征属性向量样本,然而通过随机生成一个高斯噪声向量样本,将用户特征属性向量样本与高斯噪声向量样本进行连接,就构成了推荐网络的输入,经由推荐模型计算,得到用户行为隐反馈特征向量样本。

进一步地,以图书推荐为例,用户行为隐反馈特征向量样本的行属性可以表示用户的阅读行为数据,包括点击、阅读、收藏、评论、笔记、分享等阅读行为的隐反馈信息,向量的列属性可以表示具体的图书。

s420,将所述用户特征属性向量样本、所述融合特征向量样本和所述用户行为隐反馈特征向量样本输入对抗模型,得到所述对抗模型输出的判别结果;

具体地,本步骤中输入的用户特征属性向量样本是从用户特征属性向量的数据集中随机获取的,其与步骤s410中的用户特征属性向量样本对应于同一个用户;融合特征向量样本是基于用户行为数据样本和所述待推荐物品对应的物品辅助信息样本所生成的,其中用户行为数据样本与用户特征属性向量样本也对应于同一个用户;用户行为隐反馈特征向量样本是由推荐模型输出后输入至对抗模型的。

其中,用户特征属性向量样本是为用户进行信息推荐的基础信息,而融合特征向量样本和用户行为隐反馈特征向量样本则分别代表了真实数据和非真实数据。将这三个数据样本输入至对抗模型,能够使对抗模型去区分真实样本和非真实样本之间的区别,即生成对抗模型的判别结果。当对抗模型无法分辨出融合特征向量样本和用户行为隐反馈特征向量样本的区别时,代表着推荐模型已经具备了较强的推荐能力。

s430,更新所述生成对抗网络的网络参数,直至所述生成对抗网络对应的损失函数满足收敛条件。

具体地,本发明实施例在训练生成对抗网络的过程中需要不断地更新生成对抗网络的参数,使得推荐模型和对抗模型之间的博弈最终达到一个平衡,才能结束生成对抗网络的训练过程。否则,就需要执行步骤s410和s420重复进行训练。而本发明实施例判断训练结束的条件可以是判断所述生成对抗网络对应的交叉熵损失函数满足收敛条件。该损失函数具体可以表示为:

其中d(x|c)表示对抗网络判断真实推荐数据是否为真实推荐数据的概率,对于对抗网络来说d(x|c)的值越接近于1越好。d(g(z|c))是对抗网络判断推荐模型生成的非真实推荐数据是否是真实推荐数据的概率。推荐网络g希望d(g(z|c))尽可能大,表示对抗网络无法区分真实推荐数据和非真实推荐数据之间的区别,此时推荐网络g的能力达到最强。v(g,d)即为对抗网络d基于用户特征属性向量样本cu、融合特征向量样本ru和用户行为隐反馈特征向量样本的目标函数。

进一步地,在训练过程中,采用批梯度下降法和反向传播方法,将对抗网络的判别结果反馈到推荐模型中,进而更新所述推荐模型和对抗模型的参数。

本发明实施例提供的信息推荐方法,通过融合特征向量样本和用户行为隐反馈特征向量样本分别代表真实推荐数据和非真实推荐数据输入对抗模型,使得在生成对抗网络的训练过程中,使得训练好的推荐模型能够提供准确的推荐结果。

基于上述任一实施例,图5为本发明实施例提供的信息推荐方法的流程示意图,图5示出的本发明实施例中以图书推荐为例,描述信息推荐方法涉及的模型训练和应用的完整流程,该方法包括:

501,原始数据集准备。从图书信息提供平台的数据库中获取用户特征属性数据集c,用户行为数据集u,用户对图书产生行为的标签集合a。

用户特征属性数据集c包含了多个平台用户对应的用户特征属性数据,具体可以是用户在平台中的注册数据和用户画像数据;用户行为数据集u包含了多个平台用户对应的用户行为数据,具体可以是用户在平台中对不同图书进行的操作行为;用户对图书产生行为的标签集合a中,每一个元素aij表示用户i对图书j是否有过相关的行为,1表示有行为,0表示无行为。

此外,从图书信息提供平台的数据库中及外站爬虫结果生成的图书信息汇总库中,获取图书辅助信息数据集b。图书辅助信息数据集b包含多本图书自身的属性信息。由于图书辅助信息数据集b的数据来源于平台以及不同的外部站点,因此在使用数据集b前需要对数据集进行清洗,包括字段和格式统一、删除空值等操作。

因此,步骤501获取了用户特征属性数据集c,用户行为数据集u,用户对图书产生行为的标签集合a和图书辅助信息数据集b,作为本发明实施例的信息推荐方法中模型训练的数据基础。

502,确定模型训练任务的训练方式。对于步骤501中准备的所有原始数据集,本发明实施例中的模型训练任务是对于数据集中的全部数据进行多次完整训练,即训练多次epoch。对于其中每一次训练epoch,由于训练集中可能会包含的数据条目非常多,例如上百万的用户以及图书相关数据,因此,本步骤中的模型训练任务的训练方式,是指在训练时需要把原始数据按用户进行分批训练,以提高训练的效率,并且在每一批数据训练结束后调整模型参数。

举例而言,原始数据集中包含一百万用户的相关数据,在训练一个epoch时将原始数据集分为100个批,其中每个批包含1万左右的用户相关数据。批的大小可以根据实际需求进行调整,批设置得越大,则一次模型参数的调整受益的样本会越多,但参数调整次数会越少;相反地,批设置得越小,参数调整的次数就会越多,但每次参数的调整具有一定的随机性。

503,初始化模型参数。具体地,本步骤中需要初始化的模型参数包括:推荐模型的网络参数φ,对抗模型的网络模型参数θ,融合模型中神经网络嵌入层的参数和隐藏层的参数λ,即对本发明实施例中涉及的全部三个模型的参数进行初始化,且上述模型参数均会在后续的训练过程中进行更新。步骤501至503均为模型训练前的准备步骤。

504,优化融合模型的参数。在步骤503进行初始化的模型参数中,首先要对融合模型中神经网络嵌入层的参数和隐藏层的参数λ进行更新优化。本发明实施例中融合模型的作用是为了对生成对抗网络的输入数据进行降维和融合的前置处理,使得具有稀疏性的用户行为数据更加密集化,进而提高后续生成对抗网络训练的效率。然而,融合模型所生成的融合特征向量样本在不经过优化的情况下,难以真实完整地反映用户行为数据样本和所述图书对应的物品辅助信息样本的内容,进而无法传达出用户关于图书的真实阅读行为,影响后续生成对抗网络训练的准确性。

因此,本步骤中的优化融合模型的参数,是以用户行为数据样本和图书对应的物品辅助信息样本为训练样本,以对应用户的行为标签为训练标签进行训练。使用用户行为标签作为训练标签,可以有效地检验所生成的融合特征向量样本是否与用户行为标签中的数据相符合,从而优化融合模型中神经网络嵌入层和隐藏层的参数,使得融合模型在处理输入数据时的数据损失降到最低。

505,生成用户行为隐反馈特征向量样本。从步骤505开始,信息推荐方法进入训练生成对抗网络的阶段。对于生成对抗网络的训练而言,首先需要推荐模型生成出非真实样本用于“欺骗”对抗模型。推荐模型需要先从数据集c随机获取用户特征属性向量样本cu,并随机生成一个高斯噪声向量z,再连接向量cu和z作为推荐模型的输入,噪声的设置是用于在真实数据cu的基础上进行扰动,从而生成非真实样本数据。推荐网络输出的数据即为用户行为隐反馈特征向量样本该向量的行属性表示用户的阅读行为数据,包括点击、阅读、收藏、评论、笔记、分享等阅读行为的隐反馈信息,向量的列属性表示图书。该向量即为用于“欺骗”对抗网络的非真实用户行为数据。

506,生成融合特征向量样本。根据步骤505从数据集c随机获取的用户特征属性向量样本cu,对应地从数据集u和b中获取对应的用户行为数据样本ru′和所述待推荐物品对应的物品辅助信息样本rb,经融合模型后输出融合特征向量样本ru,ru的维度和推荐网络的输出向量的维度一致,这样才能训练对抗网路的判别能力。ru的计算公式如下:ru=f(λe+b);

其中b为隐藏层的偏置项,λ为隐藏层的参数,e为融合模型的输入向量,f为激活函数,该激活函数可以采用relus函数。

所生成的融合特征向量样本表征反映用户行为的真实数据,并会作为输入数据之一输入到对抗模型中,训练对抗网络的判别能力。

507,优化生成对抗网络的参数。基于步骤505和506分别生成的用户行为隐反馈特征向量样本和融合特征向量样本ru,再结合表征用户自身属性的用户特征属性向量样本cu,连接上述三个向量作为对抗模型的输入,对抗模型的网络层级ld可以大于2,根据生成对抗网络的基本原理,取交叉熵损失函数为模型的损失函数,设对抗网络d的目标函数为v(g,d),v(g,d)可以表示:

基于批梯度下降法和反向传播方法训练推荐网络、对抗网络,优化参数φ和θ,直至损失函数收敛,模型训练结束,保存最后的模型参数φ’和θ’;若损失函数未达到收敛,则返回步骤505,继续训练其它样本。

508,应用训练好的推荐模型进行信息推荐。待生成对抗网络对应的损失函数收敛后,向推荐模型g输入一个用户特征属性cu,输出的向量包含了用户对相应图书的兴趣偏好分值的预测结果。由于模型的输入数据维度都可能比较高导致分值可能相差得较大,因此,本发明实施例可以对待推荐物品中的每一个的分值先进行归一化处理,得到用户对物品产生行为的可能程度。具体计算公式如下:

其中,向量为用户关于待推荐物品的兴趣偏好分的预测结果,f(u)可以为softmax函数,为用户u对具体物品ik的产生行为的可能程度。

按照上述公式,可以依次计算出用户u对于所有图书的兴趣偏好程度,再将其中产生行为可能性最高的top-n物品推荐给用户。以图书为例,也可以在用户未曾阅读过的图书中,将用户产生行为可能性最高的预设数量的几本图书推荐给用户。

本发明实施例提供的信息推荐方法,在生成对抗网络中引入了待推荐物品对应的物品辅助信息作为训练数据,并且通过融合模型对生成对抗网络的输入数据进行了降维和融合的前置处理,增加了模型训练数据的信息维度,能有效挖掘出用户行为和待推荐物品属性间的关系,不仅提升了信息推荐的准确率,还提升了模型训练的效率。

基于上述任一实施例,图6为本发明实施例提供的信息推荐装置的结构示意图,该装置包括:

用户特征确定模块610,用于确定目标用户对应的用户特征属性向量;

具体地,本发明实施例中的目标用户,是指要向其进行信息推荐的用户。目标用户对应的用户特征属性向量是指目标用户对应的用户特征属性的向量形式的表示。

具体地,目标用户的用户特征属性可以表征与目标用户本身相关的各项参数,其可以来源于目标用户在信息提供平台的注册信息,或者可以来源于基于目标用户在信息提供平台的各项行为所挖掘出的用户画像数据。

预测模块620,用于将所述目标用户对应的用户特征属性向量输入至待推荐物品对应的推荐模型中,得到所述推荐模型输出的关于所述待推荐物品的兴趣偏好分的预测结果;

具体地,本发明实施例中的待推荐物品,可以是小说、音乐、视频等不同类型的物品,相应地目标用户也可以是电子书平台、音乐平台、视频平台等不同类型的信息提供平台的用户,本发明实施例不作具体地限定。也就是说,本发明实施例记载的信息推荐方法,适用于本领域技术人员可以做出的合理推断中任何类型的物品推荐。

本发明实施例中针对于具体地待推荐物品,使用推荐模型来进行对应的物品推荐。该推荐模型的输入可以是用户特征确定模块610中确定的目标用户对应的用户特征属性向量,推荐模型可以是一个具有推荐功能的多层神经网络模型,根据所输入的用户特征属性向量,输出的数据包含了关于所述待推荐物品的兴趣偏好分的预测结果。具体地,关于所述待推荐物品的兴趣偏好分的预测结果,可以理解为模型根据计算结果给用户对待推荐物品中的每一个都打出了相应的分值。

其中,所述推荐模型与对抗模型组成生成对抗网络;所述生成对抗网络是以随机噪声向量样本、用户特征属性向量样本作为推荐模型的输入,以用户特征属性向量样本、融合特征向量样本以及所述推荐模型输出的用户行为隐反馈特征向量样本作为对抗模型的输入训练得到;所述融合特征向量样本是基于用户行为数据样本和所述待推荐物品对应的物品辅助信息样本确定的。

本发明实施例提供的信息推荐装置,在所使用的生成对抗网络中引入了待推荐物品对应的物品辅助信息作为训练数据,增加了模型训练数据的信息维度,能有效挖掘出用户行为和待推荐物品属性间的关系,从而提升推荐的准确率。

图7示例了一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(communicationsinterface)720、存储器(memory)730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器630中的逻辑指令,以执行如下方法:确定目标用户对应的用户特征属性向量;将所述目标用户对应的用户特征属性向量输入至待推荐物品对应的推荐模型中,得到所述推荐模型输出的关于所述待推荐物品的兴趣偏好分的预测结果;其中,所述推荐模型与对抗模型组成生成对抗网络;所述生成对抗网络是以随机噪声向量样本、用户特征属性向量样本作为推荐模型的输入,以用户特征属性向量样本、融合特征向量样本以及所述推荐模型输出的用户行为隐反馈特征向量样本作为对抗模型的输入训练得到;所述融合特征向量样本是基于用户行为数据样本和所述待推荐物品对应的物品辅助信息样本确定的。

此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的信息推荐方法,例如包括:确定目标用户对应的用户特征属性向量;将所述目标用户对应的用户特征属性向量输入至待推荐物品对应的推荐模型中,得到所述推荐模型输出的关于所述待推荐物品的兴趣偏好分的预测结果;其中,所述推荐模型与对抗模型组成生成对抗网络;所述生成对抗网络是以随机噪声向量样本、用户特征属性向量样本作为推荐模型的输入,以用户特征属性向量样本、融合特征向量样本以及所述推荐模型输出的用户行为隐反馈特征向量样本作为对抗模型的输入训练得到;所述融合特征向量样本是基于用户行为数据样本和所述待推荐物品对应的物品辅助信息样本确定的。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1