一种用户偏好的预测方法及装置,电子设备与流程

文档序号:14837002发布日期:2018-06-30 12:50阅读:213来源:国知局
一种用户偏好的预测方法及装置,电子设备与流程

本申请涉及计算机技术领域,特别是涉及一种用户偏好的预测方法及装置,电子设备。



背景技术:

为了提高网络对象,如商品、服务等的点击率或购买率,或者为了提升平台的用户体验,很多网络平台会根据用户偏好为用户推荐对象,或者在搜索应用中,结合用户偏好召回搜索结果。目前,确定用户偏好的方法大多是通过统计用户浏览、点击或购买平台上的对象的行为次数得到的。而用户在浏览或点击某个对象(如商品、POI)时,通常根据当时的环境有着倾向性的选择,这些因素最终决定用户是否下单购买,因此,单纯根据用户浏览、点击或购买平台上的对象的行为次数得到用户偏好是不准确的。并且,现有技术中,仅对于支持删除对象操作或设置有关闭对象展示窗口的平台或应用,才能够确定用户的负向偏好,对于未知对象,现有技术无法确定用户的负向偏好。

可见,现有技术中的负向用户偏好预测方法,至少存在预测结果不准确或者适用范围有限的缺陷。



技术实现要素:

本申请提供一种用户偏好的预测方法,解决现有技术中的用户偏好的预测方法存在的使用范围有限、对于未知对象无法预测其偏好、预测结果不准确中的至少一个问题。

为了解决上述问题,第一方面,本申请实施例提供了一种用户偏好的预测方法包括:

获取目标用户对目标对象的交互行为特征;

通过预先训练的偏好预测模型,基于所述交互行为特征进行预测,确定所述目标用户对所述目标对象的偏好预测结果;

根据所述偏好预测结果确定所述目标用户对所述目标对象的偏好。

第二方面,本申请实施例提供了一种用户偏好的预测装置,包括:

待预测特征获取模块,用于获取目标用户对目标对象的交互行为特征;

偏好预测模块,用于通过预先训练的偏好预测模型,基于所述交互行为特征进行预测,确定所述目标用户对所述目标对象的偏好预测结果;

偏好确定模块,用于根据所述偏好预测结果确定所述目标用户对所述目标对象的偏好。

第三方面,本申请实施例还公开了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本申请实施例所述的用户偏好的预测方法。

第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时本申请实施例公开的用户偏好的预测方法的步骤。

本申请实施例公开的用户偏好的预测方法,通过获取目标用户对目标对象的交互行为特征,并通过预先训练的偏好预测模型,基于所述交互行为特征进行预测,确定所述目标用户对所述目标对象的偏好预测结果,并根据所述偏好预测结果确定所述目标用户对所述目标对象的偏好,解决了现有技术中的用户偏好的预测方法存在的预测结果不准确的问题。通过采用预先训练的偏好预测模型对用户和对象对进行偏好预测,由于模型训练通常是基于大量共性数据实现的,使得训练得到的模型是针对共性特征进行预测,而不是基于单个用户标识或对象标识进行预测,因此用户偏好的预测结果更准确。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例一用户偏好的预测方法流程图;

图2是本申请实施例二用户偏好的预测方法流程图;

图3是本申请实施例三用户偏好的预测装置结构示意图之一;

图4是本申请实施例三用户偏好的预测装置结构示意图之二;

图5是本申请实施例三用户偏好的预测装置结构示意图之三。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

网络平台上的对象可以为菜品、服装等商品,也可以为休闲娱乐服务、旅游项目等产品,本申请实施例中统一将网络平台中的一件商品或产品称为一个对象。本申请的具体实施例中,为了便于理解,将以商品对象为例对用户偏好的预测方法的具体技术方案进行说明。

实施例一

本实施例公开的一种用户偏好的预测方法,如图1所示,该方法包括:步骤110至步骤130。

步骤110,获取目标用户对目标对象的交互行为特征。

具体实施时,目标用户对目标对象的交互行为特征可以包括,目标用户购买、点击、浏览、收藏目标对象的次数中的任意一项或多项。以预测用户u对商品I的偏好为例,首先,根据平台或全网存储的用户历史行为数据,确定用户u对商品I在一段时间内的购买次数、点击次数、浏览次数和收藏次数,作为不同维度的交互行为特征。

步骤120,通过预先训练的偏好预测模型,基于所述交互行为特征进行预测,确定所述目标用户对所述目标对象的偏好预测结果。

然后,将确定的用户u对商品I的交互行为特征作为预先训练的偏好预测模型的输入,进行偏好预测,确定偏好预测结果。

步骤130,根据所述偏好预测结果确定所述目标用户对所述目标对象的偏好。

具体实施时,偏好预测结果对应用户u对商品I的偏好得分。具体实施时,偏好预测模型输出的偏好得分有正有负,当偏好得分为负数时,表示用户u对商品I不偏好,否则,表示用户u对商品I偏好。

本申请实施例公开的用户偏好的预测方法,通过获取目标用户对目标对象的交互行为特征,并通过预先训练的偏好预测模型,基于所述交互行为特征进行预测,确定所述目标用户对所述目标对象的偏好预测结果,并根据所述偏好预测结果确定所述目标用户对所述目标对象的偏好,解决了现有技术中的用户偏好的预测方法存在的预测结果不准确的问题。通过采用预先训练的偏好预测模型对用户和对象对进行偏好预测,由于模型训练通常是基于大量共性数据实现的,使得训练得到的模型是针对共性特征进行预测,而不是基于单个用户标识或对象标识进行预测,因此偏好预测结果更准确。

实施例二

如图2所示,本申请另一实施例公开的一种用户偏好的预测方法,包括:步骤210至步骤240。

步骤210,通过训练购买预测模型,确定构成所述购买预测模型的偏好预测模型。

其中,所述购买预测模型由偏好预测模型、用户因素模型和对象因素模型叠加后,进行sigmoid运算得到;所述偏好预测模型用于拟合用户对对象的偏好;所述用户因素模型用于拟合用户自身购物的潜在非直观因素;所述对象因素模型用于拟合对象热门程度。其中,用于训练所述购买预测模型的训练数据至少包括:用户基本特征、对象基本特征、用户对对象的交互行为特征。

本申请在具体实施之前,首先需要根据离线用户历史行为数据训练偏好预测模型。本申请实施例中,偏好预测模型作为构成购买预测模型的一个模型,通过训练购买预测模型,进一步得到偏好预测模型。具体实施时,购买预测模型至少由偏好预测模型、用户因素模型和对象因素模型构成,通过对三个模型的计算结果值求和后再使用Sigmoid函数进行转换,得到购买预测结果。例如,购买预测模型可以表示为:

p(y|(u,i))=σ(f1(φ(u,i))+f2(φ(u))+f3(φ(i)));其中,f1(φ(u,i))为偏好预测模型,φ(u,i)为用户u对对象i的交互行为特征;f2(φ(u))为用户因素模型,φ(u)为用户u的基本特征;f3(φ(i))为对象因素模型,φ(i)为对象i的基本特征;u为用户标识,i为对象标识。其中,所述偏好预测模型f1(φ(u,i))用于拟合用户对对象的偏好;所述用户因素模型f2(φ(u))用于拟合用户自身购物的潜在非直观因素;所述对象因素模型f3(φ(i))用于拟合对象热门程度。

具体实施时,每个模型fi(i=1,2,3)可以是逻辑回归模型,或者决策树模型等机器学习模型。譬如使用逻辑回归(Logistics Regression)模型时,f1(φ(u,i))=w1x1+w2x2+...+wnxn,其中xi是样本的每个维度特征值,wi是模型参数,表示每个维度特征所对应的权重,值越大表示该特征越重要,对模型的贡献越大。同样后面f2和f3也使用同样的模型,训练的目标是求解最优参数wi*(i=1,2,...,n)。

相对于传统的基于用户的购买次数等数据进行统计,预测用户对对象的购买结果的方法,本申请通过结合用户特征和产品特征,并用模型训练的方式进行购买结果预测,对预测结果的准确性有很大提升。

在训练购买预测模型时,首先需要收集、标注样本。具体实施时,可以从最近一段时间内的流量数据和订单数据中进行收集。例如,对最近一段时间的平台日志数据进行解析,选取用户下单购买某个商品的日志作为正例数据,然后再选取用户浏览某个商品未点击的日志或用户点击某个商品但未进行购买的日志作为负例数据。具体实施时,正例数据和负例数据的数量保持均衡。对每条正例数据和负例数据,进一步从中提取用户标识和对象标识(如商品标识),构成用户对象组合,作为训练模型时的样本的一部分数据,如作为训练样本的第一列。具体实施时,用户对象组合可以表示为<userid,item>,其中,userid代表用户标识,item代表产品标识。同时,对于每条正例数据得到的正样本,设置相应样本标签为1;对于每条负例数据得到的负样本,设置相应样本标签为0。例如,对于根据一条正例数据确定的正样本,其第一列和第二列可以表示为:“20323546,3245 1”,其第一列中,“20323546”为用户标识,“3245”为对象标识,第二列中“1”为样本标签,代表该样本为正样本。

然后,可以从最近一段时间内的流量数据和订单数据中收集各用户对象对对应的特征。具体实施时,提取的样本特征至少包括:用户基本特征、对象基本特征和用户对对象的交互行为特征。其中,用户基本特征表示为φ(u)包括性别、年龄、常驻城市、收入、消费水平中的任意一项或多项;对象基本特征表示为φ(i),包括对象(如商品)在一段时间的被展示次数、被浏览次数、被点击次数、被收藏次数、被购买次数及对象所属类别中的任意一项或多项;用户对对象的交互行为特征表示为φ(u,i),具体实施时,包括:用户购买、点击、浏览、收藏对象的次数中的任意一项或多项。训练模型时,提取的特征对用户和对象具有共性,因此,训练的模型对于新对象或者新用户同样适用,有效解决了现有技术中通过统计无法预测新用户或用户对新对象的用户偏好的问题。

从用户历史行为数据或日志数据中提取用户基本特征、对象基本特征和用户对对象的交互行为特征的具体方式可采用现有技术,本申请中不再赘述。

最后,可以将提取的特征数据都会转换成机器学习中常用的libsvm格式,数据间以空格分隔,生成购买预测模型的训练样本。例如生成如下格式的训练样本:

20323546,3245 1 1:0.19 2:0.64 3:0.36 16:4 17:0…31:0。

上述样本示例中:第一列为“用户对象对”,第二列为样本标签,第三列及以后各列为不同维度的特征值。本例中,特征值的格式为<index:value>,其中,index为特征维度索引,value为该维度索引对应的特征值。

之后,基于采集的上述特征数据训练用户(userid)是否购买某个对象(item)的模型,即购买预测模型。具体实施时,分为两个阶段训练所述购买预测模型。所述通过训练购买预测模型,确定构成所述购买预测模型的偏好预测模型包括:将偏好预测模型的输出设置为零,通过训练购买预测模型,确定所述用户因素模型和对象因素模型的最优参数;将训练得到的所述用户因素模型和对象因素模型的最优参数带入所述购买预测模型,通过再次训练所述购买预测模型,确定所述偏好预测模型的最优参数。

具体实施时,由于偏好预测模型中采用的用户对对象的交互行为特征与用户因素模型中采用的用户基本特征、对象因素模型中采用的对象基本特征会有重合,为了避免模型之间相互影响,解决模型的耦合问题,在训练购买预测模型时,分两个阶段进行训练。第一阶段,关闭偏好预测模型在所述购买预测模型中的输出,即将偏好预测模型f1设置为常数,如0,保持f2和f3不变,基于采集的训练样本训练所述购买预测模型,以确定所述用户因素模型f2和对象因素模型f3的最优参数,如使用Logistics Regression模型f2的各个特征xi对应的权重wi。第二阶段,基于第一阶段求解得到的用户因素模型f2和对象因素模型f3的最优参数,代入构成所述购买预测模型的用户因素模型f2和对象因素模型f3中,并保持f2和f3的参数不变,即固定用户因素模型f2和对象因素模型f3的模型参数,再一次训练所述购买预测模型,即求解偏好预测模型f1,得到偏好预测模型f1的最优参数。当所述购买预测模型训练完成,即确定了偏好预测模型f1的最优参数,此时,即确定了偏好预测模型f1。

具体实施时,偏好预测模型f1、用户因素模型f2和对象因素模型f3采用决策树模型等机器学习模型时,也同样采用分两阶段训练模型的方法,最终得到购买预测模型时,同时确定了偏好预测模型f1。

步骤220,获取目标用户对目标对象的交互行为特征。

具体实施时,目标用户对目标对象的交互行为特征可以包括,目标用户购买、点击、浏览、收藏目标对象的次数中的任意一项或多项。以预测用户u对商品I的偏好为例,首先,根据平台或全网存储的用户历史行为数据,确定用户u对商品I在一段时间内的购买次数、点击次数、浏览次数和收藏次数,作为不同维度的交互行为特征。获取目标用户对目标对象的交互行为特征的具体方法与训练模型时从流量数据或购买记录中提取用户对对象的交互行为特征φ(u,i)的方法相同,此处不再赘述。

步骤230,通过预先训练的偏好预测模型,基于所述交互行为特征进行预测,确定所述目标用户对所述目标对象的偏好预测结果。

预测阶段只选取用户对某个对象(如商品)的交互行为特征进行计算,以确定用户对该对象的偏好预测结果。具体实施时,预测结果可以用偏好得分表示。以确定的用户u对商品i的交互行为特征为φ(u,i)举例,用户u对商品i的偏好得分score通过偏好预测模型f1预估,表示为:

score=f1(φ(u,i))=w1x1+w2x2+...+wnxn。其中,x1、x2、...、xn为目标用户对目标对象的交互行为特征。

步骤240,根据所述偏好预测结果确定所述目标用户对所述目标对象的偏好。

所述根据所述偏好预测结果确定所述目标用户对所述目标对象的偏好,包括:若所述偏好预测结果对应的得分为负数,则确定所述目标用户不偏好所述目标对象;若所述偏好预测结果对应的得分为正数,则确定所述目标用户偏好所述目标对象。具体实施时,预测得到的score值有正也有负,当score<0时表示用户对对象的不偏好,绝对值越大表示用户越不偏好该对象。使用传统的模型训练和预测时,预测的用户偏好得分都会是正的,因为目标函数的结果取值在[0,1]。通过本申请实施例公开的用户偏好的预测方法预测得到的偏好得分可能为负分,譬如-0.5,表示用户对该对象(如某个商品或POI)的不偏好。具体实施时,所述偏好预测结果对应的得分还可以等于0。可选的,可以根据实际情况定义得分0对应的偏好预测结果为:目标用户偏好所述目标对象,或者,目标用户不偏好所述目标对象,本申请对得分0对应的偏好预测结果的具体含义不作限定。

具体实施时,优选的,所述根据所述偏好预测结果确定所述目标用户对所述目标的偏好之后,还包括:根据所述目标用户对所述目标对象的偏好输出推荐和/或搜索结果。

在搜索或推荐等应用中,当通过购买预测模型预估用户对某个对象的购买倾向时,由于某个对象太过于热门,如某一对象因素模型输出的得分值为0.6,用户对该对象的用户偏好得分等于-0.5,如果不考虑用户因素模型的输出,则整体得分等于0.1,预测结果为正,即模型最终的分类结果是用户购买该对象,因为p(y(u,i))=σ(-0.5+0+0.6)>0.5。然而,实际上用户对该对象是不偏好的,即不喜欢该对象,为了进一步改善用户体验,可以根据所述偏好得分输出推荐和/或搜索结果,例如,从用户购买对象中删除偏好得分绝对值大于预设阈值的对象,或将偏好得分绝对值大于预设阈值的对象排列在推荐和/或搜索结果的末尾。通过根据所述偏好得分输出推荐和/或搜索结果,可以解决在个性化推荐时热门对象天然被推荐然后点击购买,而冷门对象天然不被推荐然后点击购买的问题,可以有效提高推荐应用的点击转换率。

本申请实施例公开的用户偏好的预测方法,通过根据预先采集的训练购买预测模型,线上应用时,获取目标用户对目标对象的交互行为特征,并通过预先训练的偏好预测模型,基于所述交互行为特征进行预测,确定所述目标用户对所述目标对象的偏好预测结果,并根据所述偏好预测结果确定所述目标用户对所述目标对象的偏好,解决了现有技术中的用户偏好的预测方法存在的预测结果不准确的问题。通过采用预先训练的偏好预测模型对用户和对象对进行偏好预测,由于模型训练通常是基于大量共性数据实现的,使得训练得到的模型是针对共性特征进行预测,而不是基于单个用户标识或对象标识进行预测,因此用户偏好预测结果更准确。通过基于用户对对象的真实偏好、对象热门度、用户冲动因素等因素分别对应的模型,训练点击购买模型,能够提升点击购买模型的预测准确度,相应的,也提升了用户偏好预测的准确度。

实施例三

本实施例公开的一种用户偏好的预测装置,如图3所示,所述装置包括:

待预测特征获取模块310,用于获取目标用户对目标对象的交互行为特征;

偏好预测模块320,用于通过预先训练的偏好预测模型,基于所述交互行为特征进行预测,确定所述目标用户对所述目标对象的偏好预测结果;

偏好确定模块330,用于根据所述偏好预测结果确定所述目标用户对所述目标对象的偏好。

可选的,所述偏好确定模块330进一步用于,若所述偏好预测结果对应的得分为负数,则确定所述目标用户不偏好所述目标对象;若所述偏好预测结果对应的得分为正数,则确定所述目标用户偏好所述目标对象。

可选的,如图4所示,还包括模型训练模块340,

用于通过训练购买预测模型,确定构成所述购买预测模型的偏好预测模型;

其中,所述购买预测模型由偏好预测模型、用户因素模型和对象因素模型叠加后,进行Sigmoid运算得到;所述偏好预测模型用于拟合用户对对象的偏好;所述用户因素模型用于拟合用户自身购物的潜在非直观因素;所述对象因素模型用于拟合对象热门程度。

优选的,如图4所示,所述模型训练模块340进一步包括:

第一训练单元3401,用于将偏好预测模型的输出设置为零,通过训练购买预测模型,确定所述用户因素模型和对象因素模型的最优参数;

第二训练单元3402,用于将所述第一训练单元3401训练得到的所述用户因素模型和对象因素模型的最优参数带入所述购买训练模型,通过再次训练所述购买预测模型,确定所述偏好预测模型的最优参数。

由于偏好预测模型中采用的用户对对象的交互行为特征与用户因素模型中采用的用户基本特征、对象因素模型中采用的对象基本特征会有重合,通过设置两个训练单元,分两个阶段进行训练,可以避免模型之间相互影响,解决模型的耦合问题。

可选的,用于训练所述购买预测模型的训练数据至少包括:用户基本特征、对象基本特征、用户对对象的交互行为特征。

其中,用户基本特征包括性别、年龄、常驻城市、收入、消费水平中的任意一项或多项;对象基本特征包括对象(如商品)在一段时间的被展示次数、被浏览次数、被点击次数、被收藏次数、被购买次数及对象所属类别中的任意一项或多项;用户对对象的交互行为特征包括:用户购买、点击、浏览、收藏对象的次数中的任意一项或多项。本申请实施例公开的用户偏好的预测装置,通过获取目标用户对目标对象的交互行为特征,并通过预先训练的偏好预测模型,基于所述交互行为特征进行预测,确定所述目标用户对所述目标对象的偏好预测结果,并根据所述偏好预测结果确定所述目标用户对所述目标对象的偏好,解决了现有技术中的用户偏好的预测方法存在的预测结果不准确的问题。通过采用预先训练的偏好预测模型对用户和对象对进行偏好预测,由于模型训练通常是基于大量共性数据实现的,使得训练得到的模型是针对共性特征进行预测,而不是基于单个用户标识或对象标识进行预测,因此偏好预测结果更准确。

通过基于用户对对象的真实偏好、对象热门度、用户冲动因素等因素分别对应的模型,训练点击购买模型,能够提升点击购买模型的预测准确度,相应的,也提升了用户偏好预测的准确度。

可选的,如图5所示,所示装置,还包括:

结果输出模块350,用于根据所述目标用户对所述目标对象的偏好输出推荐和/或搜索结果。

通过根据用户对对象的偏好输出推荐和/或搜索结果,可以解决在个性化推荐时热门对象天然被推荐然后点击购买,而冷门对象天然不被推荐然后点击购买的问题,可以有效提高推荐应用的点击转换率,同时进一步改善用户体验。

相应的,本申请还公开了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例一和实施例二所述的用户偏好的预测方法。所述电子设备可以为PC机、移动终端、个人数字助理、平板电脑等。

本申请还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例一和实施例二所述的用户偏好的预测方法的步骤。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上对本申请提供的一种用户偏好的预测方法及装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1