数据处理方法、装置和计算机可读存储介质与流程

文档序号：13072812阅读：167来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本发明涉及数据处理领域，特别涉及一种数据处理方法、装置和计算机可读存储介质。

背景技术：

目前的互联网应用广泛采用推荐技术将用户感兴趣的条目推荐给用户，以提高用户对互联网应用或网站的兴趣，增加用户黏性。

以电子商务网站为例，商品推荐能够给用户提供可能感兴趣的商品，是激发用户购买兴趣的主要手段，其中，如何通过对待推荐的商品进行排序、以优先推荐更贴合用户的兴趣的商品也是至关重要的。

现有的推荐系统中主要包括两个部分。第一部分为触发模型，即用于产生一个用户可能感兴趣的条目集合。第二部分为排序模型，该模型用于对商品集合中的条目进行排序。

排序模型对条目进行排序的过程可以是实时的，也可以是非实时的。在实时的排序过程中，可以随着用户的行为变化而实时调整条目的排序。

在现有技术中，采用以下方法实时调整商品排序：采集用户的行为数据，并将采集的数据转换为用户的行为特征输入到行为预测模型中，通过模型的输出结果来调整条目的排序结果。

技术实现要素：

发明人发现，在现有的实时的排序方法中，需要依赖行为预测模型的输出结果调整条目的排序结果。然而，这种方式非常依赖模型的训练程度。如果模型的训练程度较差，会影响推荐的准确性。

基于上述问题，本发明提供了一种提高条目排序的准确性的方法。

根据本发明实施例的第一个方面，提供一种数据处理方法，包括：获得推荐条目中每个条目的排序预估值、以及推荐条目涉及的每个类别对应的β分布参数，其中，β分布参数包括正反馈参数和负反馈参数；根据推荐条目涉及的每个类别中用户的已浏览条目和已点击条目的数量调整相应类别对应的β分布参数，使调整后的正反馈参数与已点击条目的数量成正相关关系、调整后的负反馈参数与已浏览条目的数量成正相关关系；基于调整后的β分布参数对应的β分布调整相应类别的推荐条目的排序预估值，以便采用调整后的排序预估值对推荐条目进行排序。

在一个实施例中，根据推荐条目的每个类别中用户的已浏览条目和已点击条目的数量，调整每个类别对应的β分布参数包括：根据每个类别中用户的已点击条目的数量和已浏览条目的数量之比调整相应类别对应的正反馈参数，其中，每个类别的调整后的正反馈参数与该类别的已点击条目的数量和已浏览条目的数量之比成正相关关系。

在一个实施例中，根据推荐条目的每个类别中用户的已浏览条目和已点击条目的数量，调整每个类别对应的β分布参数包括：根据每个类别的条目的排序预估值的平均值调整相应类别对应的正反馈参数，其中，每个类别的调整后的正反馈参数与相应类别的推荐条目的排序预估值的平均值成正相关关系。

在一个实施例中，根据推荐条目的每个类别中用户的已浏览条目和已点击条目的数量，调整每个类别对应的β分布参数包括采用以下公式，调整β分布参数中的正反馈参数：

c为类别标识，αc为调整前的正反馈参数，α′c为调整后的正反馈参数，avec为条目的排序预估值的平均值，ncc为已点击条目的数量，nec为已浏览条目的数量，p1为正反馈调整系数、并且p1大于0。

在一个实施例中，根据推荐条目的每个类别中用户的已浏览条目和已点击条目的数量，调整每个类别对应的β分布参数包括：根据每个类别中用户的已浏览条目的数量、以及每个类别的条目的排序预估值的平均值调整相应类别对应的负反馈参数，其中，每个类别的调整后的负反馈参数与相应类别的推荐条目的排序预估值的平均值成负相关关系。

在一个实施例中，根据每个类别的已浏览条目的数量、以及已浏览条目中已点击条目的数量，调整该类别的条目的β分布参数包括采用以下公式，调整β分布参数中的负反馈参数：

c为类别标识，βc为调整前的负反馈参数，β′c为调整后的负反馈参数，avec为条目的排序预估值的平均值，nec为已浏览条目的数量，s为缩放系数，p2为负反馈调整系数，并且s和p2大于0。

在一个实施例中，基于调整后的β分布参数对应的β分布为每个类别生成随机数，并采用随机数调整相应类别的推荐条目的排序预估值。

在一个实施例中，基于调整后的β分布参数对应的β分布为每个类别生成随机数，根据推荐条目的调整前的排序预估值与相应类别的随机数的乘积确定调整后的排序预估值。

在一个实施例中，基于调整后的β分布参数对应的β分布为每个类别中的每个推荐条目均生成一个随机数，并采用每个随机数调整相应推荐条目的排序预估值。

在一个实施例中，在上一次调整条目的排序预估值后，当达到预设条件时，根据推荐条目的每个类别中用户的已浏览条目和已点击条目的数量，调整每个类别对应的β分布参数；预设条件包括以下一种或多种：用户已浏览条目的数量增加预设数量、用户已点击条目的数量增加预设数量、用户的浏览时长达到预设时长。

在一个实施例中，采用调整后的排序预估值对用户未浏览的条目进行排序。

在一个实施例中，条目为商品条目、新闻条目、书籍条目、音乐条目、电影条目中的任意一种。

在一个实施例中，条目为商品条目，条目的排序预估值表示商品的销量、订单量、销售额、点击率中的任意一种。

根据本发明实施例的第二个方面，提供一种数据处理装置，包括：数据获取模块，被配置为获得推荐条目中每个条目的排序预估值、以及推荐条目涉及的每个类别对应的β分布参数，其中，β分布参数包括正反馈参数和负反馈参数；参数调整模块，被配置为根据推荐条目涉及的每个类别中用户的已浏览条目和已点击条目的数量调整相应类别对应的β分布参数，使调整后的正反馈参数与已点击条目的数量成正相关关系、调整后的负反馈参数与已浏览条目的数量成正相关关系；排序预估值调整模块，被配置为基于调整后的β分布参数对应的β分布调整相应类别的推荐条目的排序预估值，以便采用调整后的排序预估值对推荐条目进行排序。

在一个实施例中，参数调整模块进一步被配置为根据每个类别中用户的已点击条目的数量和已浏览条目的数量之比调整相应类别对应的正反馈参数，其中，每个类别的调整后的正反馈参数与该类别的已点击条目的数量和已浏览条目的数量之比成正相关关系。

在一个实施例中，参数调整模块进一步被配置为根据每个类别的条目的排序预估值的平均值调整相应类别对应的正反馈参数，其中，每个类别的调整后的正反馈参数与相应类别的推荐条目的排序预估值的平均值成正相关关系。

在一个实施例中，参数调整模块进一步被配置为采用以下公式，调整β分布参数中的正反馈参数：

在一个实施例中，参数调整模块进一步被配置为根据每个类别中用户的已浏览条目的数量、以及每个类别的条目的排序预估值的平均值调整相应类别对应的负反馈参数，其中，每个类别的调整后的负反馈参数与相应类别的推荐条目的排序预估值的平均值成负相关关系。

在一个实施例中，参数调整模块进一步被配置为采用以下公式，调整β分布参数中的负反馈参数：

在一个实施例中，排序预估值调整模块进一步被配置为基于调整后的β分布参数对应的β分布为每个类别生成随机数，并采用随机数调整相应类别的推荐条目的排序预估值。

在一个实施例中，排序预估值调整模块进一步被配置为基于每个类别的调整后的β分布参数所形成的β分布为相应类别中的每个推荐条目均生成一个随机数，并采用每个随机数调整相应推荐条目的排序预估值。

在一个实施例中，排序预估值调整模块进一步被配置为基于调整后的β分布参数所形成的β分布为每个类别生成随机数，根据推荐条目的调整前的排序预估值与相应类别的随机数的乘积确定调整后的排序预估值。

在一个实施例中，参数调整模块进一步被配置为在上一次调整条目的排序预估值后，当达到预设条件时，根据推荐条目的每个类别中用户的已浏览条目和已点击条目的数量，调整每个类别对应的β分布参数；预设条件包括以下一种或多种：用户已浏览条目的数量增加预设数量、用户已点击条目的数量增加预设数量、用户的浏览时长达到预设时长。

在一个实施例中，排序模块进一步被配置为采用调整后的排序预估值对用户未浏览的条目进行排序。

在一个实施例中，条目为商品条目、新闻条目、书籍条目、音乐条目、电影条目中的任意一种。

在一个实施例中，条目为商品条目，条目的排序预估值表示商品的销量、订单量、销售额、点击率中的任意一种。

根据本发明实施例的第三个方面，提供一种数据处理装置，包括：存储器；以及耦接至所述存储器的处理器，所述处理器被配置为基于存储在所述存储器中的指令，执行前述任意一种数据处理方法。

根据本发明实施例的第四个方面，提供一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现前述任意一种数据处理方法。

上述发明中的一个实施例具有如下优点或有益效果：本发明能够根据用户对每个类别的条目的浏览情况和点击情况调整各个类别的β分布参数，使得已点击条目的数量与正反馈参数成正相关关系、已浏览条目的数量与负反馈参数成正相关关系，并基于调整后的β分布参数对应的β分布调整相应类别的推荐条目的排序预估值，从而优先为用户推荐用户感兴趣的条目，提高了排序的准确性。

通过以下参照附图对本发明的示例性实施例的详细描述，本发明的其它特征及其优点将会变得清楚。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为β分布的示意图。

图2为本发明数据处理方法的一个实施例的流程图。

图3为本发明数据处理方法的另一个实施例的流程图。

图4为本发明数据处理装置的一个实施例的结构图。

图5为本发明数据处理装置的另一个实施例的结构图。

图6为本发明数据处理装置的又一个实施例的结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为授权说明书的一部分。

在这里示出和讨论的所有示例中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它示例可以具有不同的值。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

在实时调整推荐给用户的条目的排序时，用户的反馈是十分重要的参考因素。通过用户的浏览和点击情况，可以反映出用户当前的偏好或关注点。

本发明的数据处理方法可以应用于电子商务网站中的商品排序、新闻网站中的新闻排序、阅读类网站中的书籍排序、多媒体类网站中的音视频排序等等。为了便于说明，以下实施例中主要以商品排序为例进行阐述，然而，本领域技术人员应当清楚，本发明可以适用于多种需要对条目进行排序的场景，本发明提供的示例性实施例不对本发明的保护范围起限制性作用。

发明人通过分析用户的浏览和点击情况，得出以下结论。

以电子商务网站或应用中的用户行为为例，用户浏览和点击的商品越多，则说明可供参考的样本越多；当样本足够多时，用户的偏好会表现得较为明显，从而可以对商品的排序做出比较明确的调整。

例如，对于某个类别的商品，如果用户的浏览量很大、而点击的商品很少，则可以说明用户对此类商品不感兴趣，可以考虑将此类商品的排序向后调整；反之，对于某个类别的商品，如果用户的浏览量很大，同时点击的商品也很多，则可以考虑将这类商品的排序向前调整以进行优先展示。

反之，当用户浏览和点击的商品很少时，则用户的行为暂时还无法反映用户的意图。此时，调整的余地可以宽泛一些，例如可以向前或向后微调、或进行随机调整。

发明人经过研究发现，上述结论和规律可以与概率分布函数β(beta，或称贝塔)分布联系起来。

β分布可以采用beta(α,β)表示，具有参数α和β，其数学形式可以如公式(1)所示。

β分布的示例可以如图1所示。图1中的三条曲线分别表示beta(30,30)、beta(110,110)、beta(80,200)。

β分布的峰值所对应的横坐标值x为α和(α+β)的比值。

对比beta(30,30)、beta(110,110)。beta(30,30)、beta(110,110)的峰值所对应的横坐标值是相同的，均为0.5，即α和(α+β)的比值均为0.5。beta(30,30)中的参数α和β比beta(110,110)中的参数α和β均要小，从图中可以看出，beta(30,30)的峰值区间主要分布在0.3～0.7的区间，beta(110,110)的峰值区间主要分布在0.4～0.6的区间，即beta(110,110)的峰值区间更窄。

对比beta(30,30)和beta(80,200)。beta(30,30)中峰值对应的横坐标是0.5，而beta(80,200)中的β分布虽然具有较大的参数α和β，但是由于beta(80,200)对应的α和(α+β)的比值约等于0.29，小于0.5，因此beta(80,200)的峰值区间相较于beta(30,30)左移。并且，当beta(80,200)所示的β分布的峰值区间大约在0.2～0.4之间，要窄于beta(30,30)的峰值区间。

如图1所示，α和β的取值越大，β分布的峰值区间越狭窄，横坐标的可取值范围越固定。

在β值一定的前提下，α参数的取值越大，峰值越远离原点，峰值区间所覆盖的横坐标的数值越大；反之，α参数的取值越小，峰值区间所覆盖的横坐标的数值越小。

当α和β的取值均较小时，β分布的峰值区间较宽，此时，峰值区间所覆盖的横坐标的范围非常宽泛。

发明人将用户的浏览和点击行为与β分布联系起来，发现将β分布中的α参数和用户点击的某类商品数量对应、将β参数和用户浏览的某类商品数量对应，则β分布的峰值区间对应的x的取值大小与该类商品的推荐程度相对应；而峰值区间越窄，则是否进行推荐的确定性越强。

基于上述分析，发明人提出了本发明的数据处理方法。

图2为本发明数据处理方法一个实施例的流程图。如图2所示，该实施例的数据处理方法包括步骤s202～s206。

在步骤s202中，获得推荐条目中每个条目的排序预估值、以及推荐条目涉及的每个类别对应的β分布参数。

β分布参数包括正反馈参数和负反馈参数。若采用beta(α,β)表示β分布，则α参数表示能够反映用户对条目的点击情况的正反馈参数，β参数表示能够反映用户对条目的浏览情况的负反馈参数。

推荐条目是预备推荐给用户的条目的集合。在一个实施例中，可以对用户的历史数据进行挖掘，例如浏览数据、购买数据、收藏数据等等，并将与这些数据中的条目关联或相似的条目作为推荐条目；此外，还可以将优惠条目、活动条目等添加到推荐条目中。

根据需要，本领域技术人员还可以采用其他方式获得推荐条目，这里不再赘述。

排序预估值是推荐条目用于排序的依据。例如，排序预估值大的条目可以位于排序预估值小的条目之前。

在一个实施例中，可以将推荐条目的特征数据输入排序预估值预测模型中，并将模型的输出值作为排序预估值。

排序预估值预测模型例如可以为训练完成的深度神经网络模型，或者其他类型的预测模型。在该模型的训练阶段，可以将用于训练的条目数据输入到模型中，并将模型的输出值与条目数据的标记值进行比较，根据比较结果不断调整模型，直到输出值和标记值的差距符合预设条件。条目数据的标记值可以是反映条目排序依据的指标，例如商品的订单额总量、点击率、下单数量等等，或者例如电影的下载量、观影量、点赞数量等等。

推荐条目中包括一个或多个类别的条目，条目的类别可以是按照条目属性分类的。例如对于商品条目，可以分为数码产品、图书、服饰、鞋包、化妆品等类别，或者按照价格、促销力度、发货地点等参考因素进行分类；又例如，对于新闻条目，可以分为要闻、社会、军事、体育和娱乐等类别。

每个类别对应一个β分布。在初始阶段，各个类别的β分布参数可以是一致的，例如可以均为beta(10,10)；如果推荐条目已经进行过一次调整，则每个类别对应的β分布参数可以是上一次调整后所确定的β分布参数。

在步骤s202之后，可以将推荐条目按照排序预估值进行排序，并将排序后的条目展示给用户，以便用户进行浏览，并获取用户的浏览数据。

在步骤s204中，根据推荐条目涉及的每个类别中用户的已浏览条目和已点击条目的数量调整相应类别对应的β分布参数，使调整后的正反馈参数与已点击条目的数量成正相关关系、调整后的负反馈参数与已浏览条目的数量成正相关关系。

在一个实施例中，可以根据用户的浏览数据获得每个类别中用户的已浏览条目和已点击条目的数量。

此外，还可以令已浏览条目的数据与正反馈参数成负相关关系，从而在调整正反馈参数时，不仅考虑已点击条目的数量，还会考虑已点击条目与已浏览条目的数量差距或比值。

在一个实施例中，可以根据每个类别中用户的已点击条目的数量和已浏览条目的数量之比调整相应类别对应的正反馈参数，令每个类别的调整后的正反馈参数与该类别的已点击条目的数量和已浏览条目的数量之比成正相关关系。

在步骤s206中，基于调整后的β分布参数对应的β分布调整相应类别的推荐条目的排序预估值。

可以基于调整后的β分布参数对应的横坐标x值进行调整。

在一个实施例中，由于峰值的大小代表了对条目的推荐程度大小，因此可以将β分布的峰值所对应的x值作为排序预估值的调整依据。

在一个实施例中，可以选择β分布的峰值区间所覆盖的x值的范围中的某个分位数作为排序预估值的调整依据。例如，可以选择峰值区间所覆盖的x值的范围的第一四分位数对应的数值作为调整依据。由于样本数量越多，峰值区间越窄，因此例如对于峰值相同、而样本数量不同的两个类别，样本数量大的类别所对应的第一四分位数的数值更大，因此可以优先推荐。

在一个实施例中，还可以基于调整后的β分布参数对应的β分布为每个类别生成随机数，该随机数对应x轴的值，并采用随机数调整相应类别的推荐条目的排序预估值。即，将随机数作为排序预估值的调整依据。

在生成随机数时，可以采用现有的随机数生成器、随机数生成程序或随机数生成函数，基于特定的β分布参数生成随机数，这里不再赘述。

当以排序预估值由大到小的顺序排列条目时，可以使调整后的排序预估值与排序预估值的调整依据成正相关关系。例如，排序预估值的调整依据和调整前的排序预估值可以通过相加或相乘计算获得调整后的排序预估值。

由于排序预估值主要反映正面因素，例如销售额、订单量、点击率等指标，因此大部分应用场景中采用的是这种方法。当然，当以排序预估值由小到大的顺序排列条目时，可以使调整后的排序预估值与随机数成负相关关系。

本发明主要阐述以排序预估值由大到小的顺序排列条目的情况，但是，并不对本发明的保护范围起限制性作用。

从而，可以采用调整后的排序预估值对推荐条目进行排序。

在对条目的排序预估值进行调整以后，可以仅对多个推荐条目中用户未浏览的条目进行重新排序并进行展示，即只调整用户未浏览的条目的排列顺序。

在部分场景下，当排序预估值进行调整后，也可能出现需要再次为用户展示所有的待推荐条目的情况。例如，用户离开了推荐页面，而推荐条目还未更新，此时，可以将全部推荐条目进行重新排序，并在下一次用户进入推荐页面时或触发推荐操作时展示给用户。

通过上述实施例的方法，本发明能够根据用户对每个类别的条目的浏览情况和点击情况调整各个类别的β分布参数，使得已点击条目的数量与正反馈参数成正相关关系、已浏览条目的数量与负反馈参数成正相关关系，并基于调整后的β分布参数对应的β分布调整相应类别的推荐条目的排序预估值，从而优先为用户推荐用户感兴趣的条目，提高了排序的准确性。

用户会对某些类别的条目有偏好，因此在根据用户的浏览数据挖掘出用户的偏好后，可以将用户喜好的条目靠前排序。

然而，用户在实时浏览的短暂过程中，其当前的购买目标、购买兴趣也有可能会出现变化。

为了应对这种情况，在步骤s206中可以采用基于调整后的β分布参数对应的β分布为每个类别生成随机数、并采用随机数调整相应类别的推荐条目的排序预估值的方式。

当某个类别的条目中已浏览条目数量很大、已点击条目的数量很小时，β分布的峰值区间较窄、β分布的峰值对应的横坐标较小，随机数取值较为集中、并且取到较小数值的概率很高，因此对于这类用户浏览较多、但是不太感兴趣的条目，可以在大多数情况下将其向后排列。

当某个类别的条目中已浏览条目和已点击条目的数量都很小时，β分布的峰值区间较宽、β分布的峰值对应的横坐标很小，随机数取值较为分散，因此对于这类用户浏览和点击的样本较少的条目，可以在较为宽泛地范围内生成随机数并调整预估值，使部分条目依然有一定概率在靠前的位置推荐给用户。

当某个类别的条目中已浏览条目和已点击条目的数量都很大时，β分布的峰值区间很窄、β分布的峰值对应的横坐标较大，随机数取值较为集中、并且取到较大数值的概率很高，因此对于这类用户浏览较多、也比较感兴趣的条目，可以在大多数情况下大幅度地将其向前排列。

在生成随机数时，可以令每个推荐条目都分别对应一个基于该类的β分布生成的随机数。

例如，服饰类对应β分布beta(80,200)，欲进行调整的服饰类商品有3个，分别为商品a、b和c。基于beta(80,200)分别为3个条目生成随机数0.2843、0.2851、0.2862，则可以分别采用0.2843、0.2851、0.2862对商品a、b和c的排序预估值进行调整。

从而，大部分条目的调整幅度都在一个预设的范围内，即在β分布的峰值区间，使同一类别条目的调整幅度总体相近。然而，由于每个条目对应的随机数又不尽相同，从而使该调整幅度在基本稳定的前提下又具有小幅度的波动，使部分条目能够有机会突破调整前的排序顺序而先一步呈现给用户。

此外，也可以令同一类别中的每个推荐条目可以共同对应一个基于该类的β分布生成的随机数。例如，基于数码类商品对应的β分布生成了随机数0.81，则数码类的所有商品均可以基于0.81来调整排序预估值。

这种方式的计算量较小，当希望维持同类条目内部的先后顺序时可以采用这种方法。

上述实施例在调整时采用了随机数的方式，即对于通过分析当前的浏览数据和历史数据而得出的用户并不是非常感兴趣的品类、或偏好不明确的品类，也给予其优先展示的机会，从而，用户可以在短时间内接触到大量偏好类别的条目、以及少量其他类别的条目，从而可以探索用户对其他类别条目的喜好，以进行后续的再次调整。

根据需要，本发明实施例的方法可以多次执行。即，可以多次对推荐条目的排序进行调整。

下面参考图3描述本发明另一个实施例的数据处理方法。

图3为本发明数据处理方法另一个实施例的流程图。如图3所示，该实施例的数据处理方法包括步骤s302～s310。

在步骤s302中，获得推荐条目中每个条目的排序预估值、以及推荐条目涉及的每个类别对应的β分布参数。

在步骤s303中，获取推荐条目涉及的每个类别中用户的已浏览条目和已点击条目的数量。

在步骤s304中，根据推荐条目涉及的每个类别中用户的已浏览条目和已点击条目的数量调整相应类别对应的β分布参数。

在步骤s306中，基于调整后的β分布参数对应的β分布调整相应类别的推荐条目的排序预估值。

在步骤s308中，采用调整后的排序与估值调整推荐条目的排序。

在步骤s310中，响应于用户行为触发预设条件，获取调整后的β分布参数。

然后，可以回到步骤s303，根据推荐条目的每个类别中用户的已浏览条目和已点击条目的数量，调整每个类别对应的β分布参数。通过多次循环，达到实时调整的效果。

预设条件可以包括以下一种或多种：用户已浏览条目的数量增加预设数量、用户已点击条目的数量增加预设数量、用户的浏览时长达到预设时长。

例如，可以在每次用户的浏览数据发生改变时调整一次β分布参数，并进行而调整推荐条目的排序，以根据用户的反馈实时地对排序结果进行调整。

从而，可以根据用户实时的浏览和点击情况进行多次调整，使多次调整后的结果逐渐逼近用户的当前意图。

下面对β分布beta(α,β)的参数α和β的调整方法进行介绍。

本领域技术人员应当清楚，在本发明中，α参数和β参数仅为两个代表符号，不对本发明起任何限制性的作用。根据需要，也可以采用其他符号表示参数，例如采用beta(p,q)表示β分布、采用p表示正反馈参数、采用q表示负反馈参数等等，这里不再赘述。

此外，在后文的描述中，采用ncc表示已点击条目中属于类别c的数量，采用nec表示已浏览条目中属于类别c的数量。

下面示例性地介绍正反馈参数的调整方法。

在一个实施例中，可以仅根据某个类别中用户的已点击条目的数量调整相应类别对应的正反馈参数，使调整后的正反馈参数与已点击条目的数量成正相关关系。

例如，可以直接将已点击条目的数量作为调整后的正反馈参数，或者将已点击条目的数量与固定系数、调整前的正反馈参数进行运算后作为调整后的正反馈参数。

在一个实施例中，可以根据每个类别中用户的已点击条目的数量和已浏览条目的数量之比调整相应类别对应的正反馈参数，其中，每个类别的调整后的正反馈参数与该类别的已点击条目的数量和已浏览条目的数量之比成正相关关系。

即，随着的值的增加，正反馈参数也会增加，即α参数也会增加。

该正相关关系可以是加性关系、乘性关系、指数关系或者多种计算方式结合的正相关关系。下面示例性地介绍几种调整方法。设αc为调整前的正反馈参数，α′c为调整后的正反馈参数。

在一个实施例中，可以将αc直接与相加或相乘，获得α′c。根据需要，还可以在计算过程中添加加性系数或乘性系数，一个示例性的实施例可以如公式(2)所示。

根据需要，可以更改系数a1和a2的计算位置，这里不再赘述。

此外，在计算过程中，还可以引入同一类中的推荐条目的排序预估值的平均值，在本申请中以avec表示该平均值。

在一个实施例中，可以根据每个类别中用户的已点击条目的数量、以及每个类别的条目的排序预估值的平均值调整相应类别对应的正反馈参数，其中，每个类别的调整后的正反馈参数与相应类别的推荐条目的排序预估值的平均值成正相关关系。

例如，可以首先确定avec与的计算结果，再将该计算结果与αc进行运算，获得α′c。avec与之间可以进行相加计算，也可以进行相乘计算。一种示例性的计算方式可以如公式(3)所示。

在公式(3)中，p1为调整系数，p1的值大于0。

当条目的排序预估值与之间的数量级相差过大时，如果将avec与进行相加运算，会使对调整结果的影响过小、从而失去调整作用。因此，采用公式(3)所示的方式计算，可以适用于各种情况。

公式(3)通过调整系数p1，能够将的计算结果与排序预估值保持在接近的数量级，从而使调整结果更合理，不会产生多次调整后排序预估值越来越大或越来越小的情况。当然，本领域技术人员也可以选择不使用调整系数p1。

公式(3)通过引入同一类别条目的排序预估值的均值参与计算，能够基于用户的浏览点击情况和条目的排序预估值共同对正反馈系数进行调整，使调整结果更准确。

下面示例性地介绍负反馈参数的调整方法。

在一个实施例中，可以根据每个类别中用户的已浏览条目的数量，调整该类别的条目的负反馈参数，其中，每个类别的调整后的负反馈参数与已浏览条目的数量成正相关关系。

即，在其他条件不变的情况下，用户的已浏览量条目的数量越多，则β分布的峰值区间越狭窄，随机数可能的取值越集中，调整方向更确定。

例如，可以直接将已浏览条目的数量作为调整后的负反馈参数，或者将已浏览条目的数量与固定系数、调整前的负反馈参数进行运算后作为调整后的负反馈参数。

与调整正反馈参数类似，该正相关关系也可以是加性关系、乘性关系、指数关系或者多种计算方式结合的正相关关系。下面示例性地介绍几种调整方法。设βc为调整前的正反馈参数，β′c为调整后的正反馈参数。

在一个实施例中，可以将βc直接与nec相加或相乘，获得β′c。

在一个实施例中，还可以将βc与相加或相乘，获得β′c。由于在用户的实际浏览过程中，已点击条目的数量可能较少，而已浏览条目的数量很可能是比较大的，因此可以将nec设置在指数位置，采用将βc与进行相加或相乘计算的方式，以使负反馈系数的调整更平缓。

一个示例性的实施例可以如公式(4)所示。

此外，也可以在公式(4)中添加其他固定系数，以根据需要对公式(4)的形式进行变化，这里不再赘述。

在调整负反馈系数的过程中，同样可以引入同一类中的推荐条目的排序预估值的平均值avec参与计算。调整后的负反馈参数与排序预估值的平均值成负相关关系。

当负反馈参数减小时，随机数可能取到的数值会增大，即条目的排序会向前调整。因此，将排序预估值的平均值也参与调整，当排序预估值的平均值较大时，即，当某类别的条目在调整前就处于靠前的排序位置时，会减小负反馈参数的增加幅度，使原本处于靠前排序位置的条目不会大幅度地向后移动。

这种方式不仅考虑了用户的实时反馈，还会结合条目的固有属性或者在上一次调整后所确定的排序位置进行调整，使调整的过程更平滑、更准确。

在计算过程中，调整后的负反馈参数与排序预估值的平均值之间的负相关关系可以采用(1-avec)体现。其中，(1-avec)也可以扩展称为任意正数与avec之差。如果已经预先对avec进行了归一化处理，即条目的排序预估值均为位于[0,1]之间的数值，则可以直接采用(1-avec)。根据需要，本领域技术人员也可以采用其他负相关关系的表示形式，这里不再赘述。

一种示例性的计算方式可以如公式(5)所示。

在公式(5)中，s为缩放系数，p2为负反馈调整系数，并且s和p2大于0。

与公式(3)类似地，当条目的排序预估值与之间的数量级相差过大时，如果将(1-avec)与进行相加运算，会使nec对调整结果的影响过小、从而失去调整作用。因此，采用公式(5)所示的方式计算，适应性更好。

公式(5)通过调整系数p2，能够将的计算结果与排序预估值保持在接近的数量级，从而使调整结果更合理，不会产生多次调整后排序预估值越来越大或越来越小的情况。当然，本领域技术人员也可以选择不使用调整系数p2。

公式(5)通过引入同一类别条目的排序预估值的均值参与计算，能够基于用户的浏览点击情况和条目的排序预估值共同对负反馈系数进行调整，使调整结果更准确。

下面示例性地介绍基于随机数调整排序预估值的方法。

在一个实施例中，可以根据推荐条目的调整前的排序预估值与相应类别的随机数的乘积确定调整后的排序预估值。

设pvrc为某类中的某个条目调整前的排序预估值，pvr′c为该条目调整后的排序预估值，r为基于该类的β分布获得的随机数。则对排序预估值进行调整的示例性实施例可以如公式(6)所示：

pvr′c＝pvrc*(m+r)/p3(6)

在公式(6)中，p3为大于0的调整系数。其具体数值可以根据实际的排序预估值的大小情况或者后续的算法需要而设置。当然，也可以不设置p3，即，公式(6)例如也可以采用pvri+1＝pvri*(m+r)的形式。

m为固定参数，由于r是取值范围为[0,1]的数，因此m需要大于0，以使调整后的排序预估值大于0。此外，如果m取值过大，在m于r相加以后，可能会使r对排序预估值的影响过小。例如当m为100时，r值不论是0.1还是0.9，在与m相加后再与pvri相乘获得的结果可能是较为接近的。因此，m可优选地可以取10以内的数值。

在一个实施例中，m例如可以等于1，即有公式(7)：

pvr′c＝pvrc*(1+r)/p3(7)

下面参考图4描述本发明一个实施例的数据处理装置。

图4为本发明数据处理装置的一个实施例的结构图。如图4所示，该实施例的数据处理装置包括：数据获取模块41，被配置为获得推荐条目中每个条目的排序预估值、以及推荐条目涉及的每个类别对应的β分布参数，其中，β分布参数包括正反馈参数和负反馈参数；参数调整模块42，被配置为根据推荐条目涉及的每个类别中用户的已浏览条目和已点击条目的数量调整相应类别对应的β分布参数，使调整后的正反馈参数与已点击条目的数量成正相关关系、调整后的负反馈参数与已浏览条目的数量成正相关关系；排序预估值调整模块43，被配置为基于调整后的β分布参数对应的β分布调整相应类别的推荐条目的排序预估值，以便采用调整后的排序预估值对推荐条目进行排序。

参数调整模块42可以参考以下实施例对正反馈参数进行调整。

在一个实施例中，参数调整模块42可以进一步被配置为根据每个类别中用户的已点击条目的数量和已浏览条目的数量之比调整相应类别对应的正反馈参数，其中，每个类别的调整后的正反馈参数与该类别的已点击条目的数量和已浏览条目的数量之比成正相关关系。

在一个实施例中，参数调整模块42可以进一步被配置为根据每个类别中用户的已点击条目的数量、以及每个类别的条目的排序预估值的平均值调整相应类别对应的正反馈参数，其中，每个类别的调整后的正反馈参数与相应类别的推荐条目的排序预估值的平均值成正相关关系。

在一个实施例中，参数调整模块42可以进一步被配置为采用公式(3)调整β分布参数中的正反馈参数：

参数调整模块42可以参考以下实施例对负反馈参数进行调整。

在一个实施例中，参数调整模块42可以进一步被配置为根据每个类别中用户的已浏览条目的数量、以及每个类别的条目的排序预估值的平均值调整相应类别对应的负反馈参数，其中，每个类别的调整后的负反馈参数与相应类别的推荐条目的排序预估值的平均值成负相关关系。

在一个实施例中，参数调整模块42可以进一步被配置为采用公式(5)调整β分布参数中的负反馈参数：

参数调整模块42可以在用户的行为达到预设条件后被触发。

在一个实施例中，参数调整模块42可以进一步被配置为在上一次调整条目的排序预估值后，当达到预设条件时，根据推荐条目的每个类别中用户的已浏览条目和已点击条目的数量，调整每个类别对应的β分布参数；预设条件包括以下一种或多种：用户已浏览条目的数量增加预设数量、用户已点击条目的数量增加预设数量、用户的浏览时长达到预设时长。

在一个实施例中，排序预估值调整模块43可以进一步被配置为基于调整后的β分布参数对应的β分布为每个类别生成随机数，并采用随机数调整相应类别的推荐条目的排序预估值。

在一个实施例中，排序预估值调整模块43可以进一步被配置为基于每个类别的调整后的β分布参数所形成的β分布为相应类别中的每个推荐条目均生成一个随机数，并采用每个随机数调整相应推荐条目的排序预估值。

在一个实施例中，排序预估值调整模块43可以进一步被配置为基于调整后的β分布参数所形成的β分布为每个类别生成随机数，根据推荐条目的调整前的排序预估值与相应类别的随机数的乘积确定调整后的排序预估值。

在一个实施例中，数据处理装置还可以包括排序模块34，被配置为采用调整后的排序预估值对用户未浏览的条目进行排序。

在一个实施例中，条目可以为商品条目、新闻条目、书籍条目、音乐条目、电影条目中的任意一种。

当条目为商品条目时，条目的排序预估值可以表示商品的销量、订单量、销售额、点击率中的任意一种。

图5为本发明数据处理装置的一个实施例的结构图。如图5所示，该实施例的装置500包括：存储器510以及耦接至该存储器510的处理器520，处理器520被配置为基于存储在存储器510中的指令，执行前述任意一个实施例中的数据处理方法。

其中，存储器510例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(bootloader)以及其他程序等。

图6为本发明数据处理装置的又一个实施例的结构图。如图6所示，该实施例的装置600包括：存储器610以及处理器620，还可以包括输入输出接口630、网络接口640、存储接口650等。这些接口630，640，650以及存储器610和处理器620之间例如可以通过总线660连接。其中，输入输出接口630为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口640为各种联网设备提供连接接口。存储接口650为sd卡、u盘等外置存储设备提供连接接口。

本发明的实施例还提供一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现前述任意一种数据处理方法。

本领域内的技术人员应当明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵猛;严严;郭文涛
技术所有人：北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
我是此专利的发明人

上一篇：一种基于分布式文件系统的遥感数据存储方法及系统与流程
上一篇：一种广告营销类语言信息的识别装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。