一种商品推荐模型训练方法、装置、设备及存储介质与流程

文档序号：16540096发布日期：2019-01-08 20:17阅读：152来源：国知局

本发明实施例涉及数据处理技术，尤其涉及一种商品推荐模型训练方法、装置、设备及存储介质。

背景技术：

电子商务平台是个性化商品推荐系统的一大应用领域。其中，个性化商品推荐方式包括：基于用户的历史行为数据和实时行为数据，通过各种商品召回策略确定推荐商品的候选集；通过点击率预测模型确定候选集商品的展示顺序，点击概率高的商品优先被展示。

其中，现有技术中，点击率预测模型的建模可以是：通过用户对商品的曝光和点击行为构建训练集，曝光未点击的样本的标签为0，曝光并点击的样本的标签为1；对模型进行训练，然后利用模型预测每个用户对候选集商品的点击概率，通过点击概率确定该用户的个性化商品推荐顺序，点击概率高的商品优先展示给该用户。

但是上述建模的模型不能很好地刻画用户对商品的兴趣度。例如，用户可能只是误点了该商品，或者只是被吸引人的商品描述或者图片所迷惑，点击了该商品后即离开该商品相关页面。因此，预测模型最终预测出的用户点击概率也不能很好地反映用户真正的兴趣。

技术实现要素：

本发明实施例提供一种商品推荐模型训练方法、装置、设备及存储介质，可以准确预测用户对商品的兴趣度，从而增加推荐结果的点击率。

第一方面，本发明实施例提供了一种商品推荐模型训练方法，包括：

获取各用户分别浏览商品的首页、详情页以及评价页的历史停留时间，以及获取各用户浏览所述商品的历史停留总时间；

根据各所述用户浏览各页面的历史停留时间，分别确定各页面对应的第一时间均值，并分别确定所述第一时间均值对应的第一方差；

根据各所述用户浏览所述商品的所述历史停留总时间，确定所述商品对应的第二时间均值，并确定所述第二时间均值对应的第二方差；

根据所述第一时间均值、所述第一方差、所述第二时间均值以及所述第二方差，确定所述用户对所述商品的兴趣度；

以所述商品的特征数据以及所述用户的特征数据为输入变量，以所述兴趣度为输出变量对设定模型进行训练，得到训练的商品推荐模型。

第二方面，本发明实施例还提供了一种商品推荐模型训练装置，包括：

获取模块，用于获取各用户分别浏览商品的首页、详情页以及评价页的历史停留时间，以及获取各用户浏览所述商品的历史停留总时间；

第一确定模块，用于根据各所述用户浏览各页面的历史停留时间，分别确定各页面对应的第一时间均值，并分别确定所述第一时间均值对应的第一方差；

第二确定模块，用于根据各所述用户浏览所述商品的所述历史停留总时间，确定所述商品对应的第二时间均值，并确定所述第二时间均值对应的第二方差；

第三确定模块，用于根据所述第一时间均值、所述第一方差、所述第二时间均值以及所述第二方差，确定所述用户对所述商品的兴趣度；

训练模块，用于以所述商品的特征数据以及所述用户的特征数据为输入变量，以所述兴趣度为输出变量对设定模型进行训练，得到训练的商品推荐模型。

第三方面，本发明实施例还提供了一种设备，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器本发明实施例提供的商品推荐模型训练方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本发明实施例提供的商品推荐模型训练方法。

本发明实施例提供的技术方案，通过各用户浏览商品各页面的历史停留时间，确定各页面对应的第一时间均值，并确定第一时间均值对应的第一方差，通过各用户浏览商品的历史停留总时间，确定商品对应的第二时间均值，并确定第二时间均值对应的第二方差，通过第一时间均值、第一方差、第二时间均值以及第二方差，确定用户对商品的兴趣度；从而进行模型训练，得到训练模块，通过该模型可以准确预测用户对商品的兴趣度，从而增加推荐结果的点击率。

附图说明

图1是本发明实施例提供的一种商品推荐模型训练方法流程图；

图2是本发明实施例提供的一种商品推荐模型训练装置结构框图；

图3是本发明实施例提供的一种设备结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

图1是本发明实施例提供的一种商品推荐模型训练方法流程图，所述方法由一种商品推荐模型训练装置来执行，所述装置由软件和/或硬件来执行，所述装置可集成在终端、服务器等设备中。所述方法应用于对商品进行推荐的场景中。如图1所示，本发明实施例提供的方法包括：

s110：获取各用户分别浏览商品的首页、详情页以及评价页的历史停留时间，以及获取各用户浏览所述商品的历史停留总时间。

在本发明实施例中，用户浏览商品的历史停留总时间是用户浏览商品的首页、详情页以及评价页的总时间，例如，一个用户浏览商品的首页的历史停留时间是20s，浏览商品的详情页的历史停留时间是50s，浏览商品的评价页的历史停留时间是50s，则该用户浏览商品的历史停留总时间是50+50+20＝120s。

s120：根据各所述用户浏览各页面的历史停留时间，分别确定各页面对应的第一时间均值，并分别确定所述第一时间均值对应的第一方差。

s130：根据各所述用户浏览所述商品的所述历史停留总时间，确定所述商品对应的第二时间均值，并确定所述第二时间均值对应的第二方差。

在本发明的实施例的一个实施方式中，根据各所述用户浏览各页面的历史停留时间，分别确定各页面对应的第一时间均值，并分别确定所述第一时间均值对应的第一方差，包括：分别对各页面的历史停留时间取对数，并计算取对数的历史停留时间的平均值，并作为各页面对应的第一时间均值；根据取对数的历史停留时间以及所述第一时间均值，确定所述第一方差。

相应的，所述根据各所述用户浏览所述商品的所述历史停留总时间确定所述商品对应的第二时间均值，并确定所述第二时间均值对应的第二方差，包括：对所述历史停留总时间取对数，并计算取对数的历史停留总时间的平均值，并作为第二时间均值；根据取对数的历史停留总时间以及所述第二时间均值确定所述第二方差。

其中，对各页面的历史停留时间取对数，然后计算平均值，并作为各页面对应的第一时间均值，最后确定第一方差。例如，5个用户对一个商品的首页的历史停留时间分别是20s，10s，10s，20s和30s，分别对历史停留时间取对数，即分别对应log20、log10、log10、log20和log30，然后计算平均值，即(log20+log10+log10+log20+log30)/5，得到平均值，作为该商品的首页对应的第一时间均值。则第一方差的计算方法可以将log20、log10、log10、log20、log30以及(log20+log10+log10+log20+log30)/5代入方差公式进行计算。

其中，该商品的其他页面对应的第一时间均值的计算方法与首页对应的第一时间均值的计算方法相同，则第一方差的计算方法也可以参照上述的方法。并且其他商品页面对应的第一时间均值以及第一方差的计算方法可参照上述方法。

其中，根据用户浏览商品的历史停留总时间确定商品对应的第二时间均值，从而确定第二时间均值对应的第二方差。例如，共存在5个用户，每个用户浏览商品历史停留总时间是100s，120s,110s、50s和30s，则对每个历史停留总时间取对数，然后求第二时间均值，第二时间均值是log100+log120+log110+log50+log30)/5，然后可以根据方差公式计算得到第二时间均值对应的第二方差。

由此，通过对用户浏览各个页面的历史停留时间取对数，以及对用户浏览各个商品的历史停留总时间取对数，可以减小数据的数值，便于数据处理，方便计算。

在本发明实施例的一个实施方式中，可选的，所述根据各所述用户浏览各页面的历史停留时间，分别确定各页面对应的第一时间均值，并分别确定所述第一时间均值对应的第一方差，还可以包括：根据各所述用户浏览各页面的历史停留时间，分别计算各页面的历史停留时间的平均值，并作为各页面对应的第一时间均值；根据所述历史停留时间以及所述第一时间均值，确定所述第一方差。

相应的，所述根据各所述用户浏览所述商品的所述历史停留总时间，确定所述商品对应的第二时间均值，并确定所述第二时间均值对应的第二方差，可以包括：根据各所述用户浏览所述商品的所述历史停留总时间，计算所述商品的历史停留总时间的平均值，并作为所述第二时间均值；根据历史停留总时间以及所述第二时间均值确定所述第二方差。

其中，也可以对各页面的历史停留时间不分别取对数，直接由各页面的历史停留时间确定时间平均值，从而确定第二方差。例如，5个用户对一个商品的首页的历史停留时间分别是20s，10s，10s，20s和30s，则计算首页的历史停留时间的平均值，并作为第一时间均值，即为(20+10+10+20+30)/5＝16,则第一均值对应的第一方差可以参照方差公式进行计算，由平均值和各个历史停留时间即可计算第一方差。

相应的，当计算第一时间均值以及第一方差，且对各页面的历史停留时间不求取对数时，则计算第二时间均值以及第二方差，对商品的历史停留时间也不求取对数。例如，若共存在5个用户，每个用户浏览商品历史停留总时间是100s，120s,110s、50s和30s，历史停留总时间的平均值作为第二时间均值，则为(100+120+110+50+30)/5,并将各个历史停留总时间，以及第二时间均值代入到方差计算公式即可得到第二方差。

s140：根据所述第一时间均值、所述第一方差、所述第二时间均值以及所述第二方差，确定所述用户对所述商品的兴趣度。

在本发明实施例的一个实施方式中，可选的，所述根据所述第一时间均值、所述第一方差、第二时间均值以及所述第二方差，确定所述用户对所述商品的兴趣度，包括：

根据如下的公式确定所述用户对所述商品的兴趣度：

其中，pui为第u个用户对商品i的兴趣度；其中，j是商品页面的编号；

其中，tij＝exp(μi+σ×zcj)；μi为针对商品i，取对数的历史停留总时间的平均值，或者为是商品i对应的第二时间均值，σi为所述μi对应的第二方差；

其中，tcuij为第u个用户浏览商品i的第j页面的历史停留时间，ucj为针对商品i的第j页面，取对数的历史停留时间的平均值，或者为商品i的第j页面对应的第一时间均值；σcj为ucj对应的第一方差。

其中，上述用户对商品兴趣度的计算方法适用于对各页面的历史停留时间取对数确定第一时间均值以及第一方差，且对商品的历史停留总时间取对数确定第二时间均值以及第二方差的情况。

在本发明实施例的另外一种实施方式中，可选的，所述根据所述第一时间均值、所述第一方差、所述第二时间均值以及所述第二方差，确定所述用户对所述商品的兴趣度，包括：根据如下的公式确定所述用户对所述商品的兴趣度：

其中，pui为第u个用户对商品i的兴趣度；其中，j是商品页面的编号；

其中，tij＝exp(μi+σ×zcj)；μi为商品i的历史停留总时间的平均值，或者所述商品i对应的第二时间均值，σi为所述μi对应的第二方差；

其中，tcuij为第u个用户浏览商品i的第j页面的历史停留时间；ucj为商品i的第j页面的历史停留时间的平均值，或者为商品i的第j页面的对应的第一时间均值；σcj为ucj对应的第一方差。

其中，上述其用户对商品兴趣度的计算方法适用于：通过各页面的历史停留时间直接确定第一时间均值以及第一方差，且通过商品的历史停留总时间直接确定第二时间均值以及第二方差的情况。

s150：以所述商品的特征数据以及所述用户的特征数据为输入变量，以所述兴趣度为输出变量对设定模型进行训练，得到训练的商品推荐模型。

其中，所述用户的特征数据包括所述用户的年龄、或性别信息等，商品特征数据包括商品分类信息、价格信息等。所述设定模型为梯度提升树回归模型。其中，设定模型并不局限于梯度提升树回归模型，还可以是其他模型。

在本发明实施例中，通过用户对商品兴趣度的计算公式可以计算出每个用户对每个商品的兴趣度。将用户的特征数据、商品的特征数据以及用户对商品的兴趣度输入到设定模型中，对模型进行训练，调整模型中的参数。其中，在对设定模型进行训练时，为了使模型预测准确，可以选择多组数据对设定模型进行训练，得到训练后的模型。其中，多组数据包括多组用户特征数据，商品特征数据，以及多个用户对商品的兴趣度的数据，或者其他多组数据的组合方式。

在上述实施例的基础上，还包括：通过训练的商品推荐模型对商品候选集中的商品进行预测，得到各个商品的预测兴趣度，根据预测兴趣度对商品候选集中的商品进行排序，并推荐给用户。其中，商品候选集中的商品可以是用户历史浏览的商品，也可以是根据用户操作确定的一种类别的商品，或者还可以是其他方式确定的商品。

本发明实施例提供的技术方案，通过各用户浏览商品各页面的历史停留时间，确定各页面对应的第一时间均值，并确定第一时间均值对应的第一方差，通过各用户浏览商品的历史停留总时间，确定商品对应的第二时间均值，并确定第二时间均值对应的第二方差，通过第一时间均值、第一方差、第二时间均值以及第二方差，确定用户对商品的兴趣度，即通过用户浏览商品的时长来确定用户对用户的兴趣度，从而进行模型训练，得到训练模块，通过该模型可以准确预测用户对商品的兴趣度，从而增加推荐结果的点击率。

图2是本发明实施例提供的一种商品推荐模型训练装置结构框图，如图2所示，所述装置包括获取模块210、第一确定模块220、第二确定模块230、第三确定模块240和训练模块250。

获取模块210，用于获取各用户分别浏览商品的首页、详情页以及评价页的历史停留时间，以及获取各用户浏览所述商品的历史停留总时间；

第一确定模块220，用于根据各所述用户浏览各页面的历史停留时间，分别确定各页面对应的第一时间均值，并分别确定所述第一时间均值对应的第一方差；

第二确定模块230，用于根据各所述用户浏览所述商品的所述历史停留总时间，确定所述商品对应的第二时间均值，并确定所述第二时间均值对应的第二方差；

第三确定模块240，用于根据所述第一时间均值、所述第一方差、所述第二时间均值以及所述第二方差，确定所述用户对所述商品的兴趣度；

训练模块250，用于以所述商品的特征数据以及所述用户的特征数据为输入变量，以所述兴趣度为输出变量对设定模型进行训练，得到训练的商品推荐模型。

第一确定模块220，用于分别对各页面的历史停留时间取对数，并计算取对数的历史停留时间的平均值，并作为各页面对应的第一时间均值；

根据取对数的历史停留时间以及所述第一时间均值，确定所述第一方差；

相应的，第二确定模块230，用于对所述历史停留总时间取对数，并计算取对数的历史停留总时间的平均值，并作为第二时间均值；

根据取对数的历史停留总时间以及所述第二时间均值确定所述第二方差。

可选的，第三确定模块240，用于根据如下的公式确定所述用户对所述商品的兴趣度：

其中，pui为第u个用户对商品i的兴趣度；其中，j是商品页面的编号；

其中，tij＝exp(μi+σ×zcj)；μi为针对商品i，取对数的历史停留总时间的平均值，或者为是商品i对应的第二时间均值，σi为所述μi对应的第二方差；

可选的，第一确定模块220，用于根据各所述用户浏览各页面的历史停留时间，分别计算各页面的历史停留时间的平均值，并作为各页面对应的第一时间均值；

根据所述历史停留时间以及所述第一时间均值，确定所述第一方差；

相应的，第二确定模块230，用于根据各所述用户浏览所述商品的所述历史停留总时间，计算所述商品的历史停留总时间的平均值，并作为所述第二时间均值；

根据历史停留总时间以及所述第二时间均值确定所述第二方差。

可选的，第三确定模块240，用于根据如下的公式确定所述用户对所述商品的兴趣度：

其中，pui为第u个用户对商品i的兴趣度；其中，j是商品页面的编号；

其中，tij＝exp(μi+σ×zcj)；μi为商品i的历史停留总时间的平均值，或者所述商品i对应的第二时间均值，σi为所述μi对应的第二方差；

可选的，所述设定模型为梯度提升树回归模型。

可选的，所述用户的特征数据包括所述用户的年龄、或性别信息，商品特征数据包括商品分类信息。

上述装置可执行本发明任意实施例所提供的方法，具备执行方法相应的功能模块和有益效果。

图3是本发明实施例提供的一种设备结构示意图，如图3所示，该设备包括：

一个或多个处理器310，图3中以一个处理器310为例；

存储器320；

所述设备还可以包括：输入装置330和输出装置340。

所述设备中的处理器310、存储器320、输入装置330和输出装置340可以通过总线或者其他方式连接，图3中以通过总线连接为例。

存储器320作为一种非暂态计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本发明实施例中的一种商品推荐模型训练方法对应的程序指令/模块(例如，附图2所示的获取模块210、第一确定模块220、第二确定模块230、第三确定模块240和训练模块250)。处理器310通过运行存储在存储器320中的软件程序、指令以及模块，从而执行计算机设备的各种功能应用以及数据处理，即实现上述方法实施例的一种商品推荐模型训练方法，即：

获取各用户分别浏览商品的首页、详情页以及评价页的历史停留时间，以及获取各用户浏览所述商品的历史停留总时间；

根据各所述用户浏览各页面的历史停留时间，分别确定各页面对应的第一时间均值，并分别确定所述第一时间均值对应的第一方差；

根据各所述用户浏览所述商品的所述历史停留总时间，确定所述商品对应的第二时间均值，并确定所述第二时间均值对应的第二方差；

根据所述第一时间均值、所述第一方差、所述第二时间均值以及所述第二方差，确定所述用户对所述商品的兴趣度；

以所述商品的特征数据以及所述用户的特征数据为输入变量，以所述兴趣度为输出变量对设定模型进行训练，得到训练的商品推荐模型。

存储器320可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据计算机设备的使用所创建的数据等。此外，存储器320可以包括高速随机存取存储器，还可以包括非暂态性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态性固态存储器件。在一些实施例中，存储器320可选包括相对于处理器310远程设置的存储器，这些远程存储器可以通过网络连接至终端设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置330可用于接收输入的数字或字符信息，以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。输出装置340可包括显示屏等显示设备。

本发明实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例提供的商品推荐模型训练方法：

获取各用户分别浏览商品的首页、详情页以及评价页的历史停留时间，以及获取各用户浏览所述商品的历史停留总时间；

根据各所述用户浏览各页面的历史停留时间，分别确定各页面对应的第一时间均值，并分别确定所述第一时间均值对应的第一方差；

根据各所述用户浏览所述商品的所述历史停留总时间，确定所述商品对应的第二时间均值，并确定所述第二时间均值对应的第二方差；

根据所述第一时间均值、所述第一方差、所述第二时间均值以及所述第二方差，确定所述用户对所述商品的兴趣度；

以所述商品的特征数据以及所述用户的特征数据为输入变量，以所述兴趣度为输出变量对设定模型进行训练，得到训练的商品推荐模型。

可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于——无线、电线、光缆、rf等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++，还包括常规的过程式程序设计语言—诸如”c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴佳东
技术所有人：深圳乐信软件技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。