用于计算排序分及建立模型的方法、装置及商品推荐系统的制作方法

文档序号：9810553阅读：197来源：国知局

用于计算排序分及建立模型的方法、装置及商品推荐系统的制作方法
【技术领域】
[0001] 本申请涉及排序技术，具体涉及一种用于计算待评价客体排序分的方法。本申请同时提供一种用于计算待评价客体排序分的装置，一种用于建立排序分计算模型的方法和装置，以及一种商品推荐系统。
【背景技术】
[0002] 随着互联网的普及和网站技术的发展，越来越多的用户选择在网上浏览、挑选、或者购买自己需要的商品。在这种情况下，很多网站都不同程度地采用各种形式的推荐技术向用户进行商品推荐，比较通用的做法是选取特定的排序因子，并按照预先设定的排序算法计算待推荐商品的排序分，然后按照排序分值的高低选择并推荐商品。
[0003] 在计算排序分的过程中所采用的排序因子是指，影响最终商品排序的因素，通常可以选择与商品相关的属性作为排序因子，例如：价格、销量、交易次数、买家数、热搜词次数等；依据上述排序因子计算排序分的算法也是多种多样的，通常根据应用场景是否需要引入新的排序因子，可以分为以下两种实现方案：
[0004] 1)在日常排序场景（比如搜索，聚划算等场景）下，影响最终排序结果的排序因子较为稳定，通常不会有新增排序因子融入进来，因此通常采用建立模型的方式，而且模型一般会设计的相对复杂，将每个特征（即：排序因子）与最终目标的各种可能关系都考虑进来，并利用机器学习的方式来确定模型中的各个排序因子的权重系数。如果要在这种场景下新增排序因子，通常需要修改已建立的模型，并重新求解模型中的所有排序因子的权重系数。
[0005] 2)在新增业务排序因子较多的场景（例如，大促活动专场的排行榜场景）下，影响最终排序结果的排序因子较多，并且需要根据业务场景的特点在原有的常规排序因子的基础上引入新的排序因子，例如，卖家的交易等级、卖家的VIP会员的胶易额等。因此通常采用比较简单的方法计算排序分，即：根据专家经验给定原有排序因子与新增排序因子之间的权重系数（该权重系数反映了排序因子对最终排序结果的影响力），再用各个排序因子的值与其权重系数相乘求和，得出最终的排序分，计算公式如下所示，其中Y为最终的排序分，Wi为专家经验给出的排序因子A的权重系数。
[0006] Y = ￥^!+. . . +wnfn
[0007] 通过上面的描述可以看出，采用现有技术的第1)种方式引入新的排序因子，因为模型的变化，需要重新采集大量的训练数据并采用机器学习算法进行训练，重新计算新模型的各个排序因子的权重系数值，然后才能依据该模型计算商品的排序分，整个过程比较复杂；采用第2)种方式引入新的排序因子时，人工干预的因素比较大，排序因子的权重系数完全依靠专家的主观经验进行设定，因此计算出来的排序分很可能不够准确，无法相对客观地反映商品实际的排序状况。

【发明内容】

[0008] 本申请提供一种用于计算待评价客体排序分的方法和装置，以解决现有技术无法方便地引入新的排序因子、以及单纯依赖专家经验设置权重系数导致排序分计算结果不准确的问题。本申请另外提供一种用于建立排序分计算模型的方法和装置，以及一种商品推荐系统。
[0009] 本申请提供一种用于计算待评价客体排序分的方法，包括：
[0010] 获取待评价客体的原始评分数据、新增排序因子的值、以及以实际交互行为系统中对应每个待评价客体的历史行为数据为根据，从中提取的对应特定排序目标的实际行为数据；
[0011] 以根据所述实际行为数据得到的实际排序分布、和根据预先设定的排序分计算模型得到的预测排序分布之间的差异最小化为优化目标，求解所述排序分计算模型中的新增排序因子的权重系数；
[0012] 以所述待评价客体的原始评分数据、所述新增排序因子的值以及计算得到的所述新增排序因子权重系数的值为输入，采用所述排序分计算模型计算所述待评价客体的排序分。
[0013] 可选的，在所述排序分计算模型中，针对每个新增排序因子采用幂次项求和的表示方式；
[0014] 相应的，所述新增排序因子的权重系数是指权重系数序列，所述序列中的每个权重系数都与所述新增排序因子的一个幂次项相对应。
[0015] 可选的，所述针对每个新增排序因子采用幂次项求和的表示方式具体是指，采用四幂次项求和的表示方式。
[0016] 可选的，当所述交互行为系统为在线交易系统时，所述特定排序目标为：点击数、交易量或者交易金额。
[0017] 可选的，所述实际排序分布和预测排序分布之间的差异具体是指，所述两个分布之间的KL距离。
[0018] 可选的，所述以根据所述实际行为数据得到的实际排序分布、和根据预先设定的排序分计算模型得到的预测排序分布之间的差异最小化为优化目标，求解所述排序分计算模型中的新增排序因子的权重系数，包括：
[0019] 通过计算待评价客体的所述实际行为数据与全部待评价客体的所述实际行为数据总和的比值，获取所述待评价客体的实际排序分布；
[0020] 以所述待评价客体的原始评分数据、所述新增排序因子的值和所述新增排序因子权重系数的当前值为输入，采用所述排序分计算模型计算所述待评价客体的预测排序分；所述新增排序因子权重系数的当前值是指，采用本方法上一次计算得到的所述权重系数的值；
[0021] 以所述新增排序因子的权重系数为未知数，将所述待评价客体的原始评分数据、所述新增排序因子的值代入所述排序分计算模型，并根据得到的表达式与待评价客体的所述预测排序分的总和，获取以所述新增排序因子的权重系数表示的预测排序分布；
[0022] 获取所述实际排序分布和所述预测排序分布之间的KL距离的表达式；
[0023] 以所述KL距离表达式的值最小化为优化目标，求解所述新增排序因子的权重系数的值。
[0024] 可选的，所述以所述KL距离表达式的值最小化为优化目标，求解所述新增排序因子的权重系数的值是指，采用随机梯度下降算法或者逻辑回归优化算法求解。
[0025] 可选的，在所述获取所述待评价客体的实际排序分布和所述计算所述待评价客体的预测排序分的步骤后，执行下述操作：
[0026] 通过计算所述待评价客体的预测排序分与全部待评价客体的预测排序分总和的比值，获取所述待评价客体的预测排序分布；
[0027] 计算所述实际排序分布和所述预测排序分布之间的KL距离值；
[0028] 判断所述KL距离值与上次采用本方法计算得到的KL距离值相比较，其数值减小的比例是否小于预先设定的阈值；
[0029] 若是，则在后续使用本方法计算待评价客体排序分的过程中，不再执行所述求解所述排序分计算模型中的新增排序因子的权重系数的步骤；相应的，所述以所述待评价客体的原始评分数据、所述新增排序因子的值以及计算得到的所述新增排序因子权重系数的值为输入，采用所述排序分计算模型计算所述待评价客体的排序分是指，以最近一次计算得到的所述新增排序因子权重系数的值为输入进行求解。
[0030] 可选的，在第一次执行所述采用所述排序分计算模型计算所述待评价客体的预测排序分的步骤时，将所述新增排序因子权重系数的当前值设置为预先设定的初始值。
[0031] 可选的，在执行所述求解所述排序分计算模型中的新增排序因子的权重系数的步骤之前，执行下述操作：
[0032] 判断所述待评价客体的数目是否大于求解新增排序因子权重系数所需待评价客体的预定数量；
[0033] 若是，按照所述待评价客体的原始评分数据从大到小的顺序，从中选择所述预定数量的待评价客体，作为后续使用本方法求解所述新增排序因子的权重系数所采用的待评价客体。
[0034] 相应的，本申请还提供一种用于计算待评价客体排序分的装置，包括：
[0035] 数据获取单元，用于获取待评价客体的原始评分数据、新增排序因子的值、以及以实际交互行为系统中对应每个待评价客体的历史行为数据为根据，从中提取的对应特定排序目标的实际行为数据；
[0036] 权重系数计算单元，用于以根据所述实际行为数据得到的实际排序分布、和根据预先设定的排序分计算模型得到的预测排序分布之间的差异最小化为优化目标，求解所述排序分计算模型中的新增排序因子的权重系数；
[0037] 排序分计算单元，用于以所述待评价客体的原始评分数据、所述新增排序因子的值以及计算得到的所述新增排序因子权重系数的值为输入，采用所述排序分计算模型计算所述待评价客体的排序分。
[0038] 可选的，所述权重系数计算单元和所述排序分计算单元采用的排序分计算模型中，针对每个新增排序因子采用幂次项求和的表示方式。
[0039] 可选的，所述权重系数计算单元具体用于，以根据所述实际行为数据得到的实际排序分布、和根据预先设定的排序分计算模型得到的预测排序分布之间的KL距离最小化为优化目标，求解所述排序分计算模型中的新增排序因子的权重系数。
[0040] 可选的，所述权重系数计算单元包括：
[0041] 实际排序分布获取子单元，用于通过计算待评价客体的所述实际行为数据与全部待评价客体的所述实际行为数据总和的比值，获取所述待评价客体的实际排序分布；
[0042] 预测排序分计算子单元，用于以所述待评价客体的原始评分数据、所述新增排序因子的值和所述新增排序因子权重系数的当前值为输入，采用所述排序分计算模型计算所述待评价客体的预测排序分；所述新增排序因子权重系数的当前值是指，采用本方法上一次计算得到的所述权重系数的值；
[0043] 预测排序分布表达式获取子单元，用于以所述新增排序因子的权重系数为未知数，将所述待评价客体的原始评分数据、所述新增排序因子的值代入所述排序分计算模型，并根据得到的表达式与待评价客体的所述预测排序分的总和，获取以所述新增排序因子的权重系数表示的预测排序分布；
[0044] KL距离表达式获取子单元，用于获取所述实际排序分布和所述预测排序分布之间的KL距离的表达式；
[0045] 权重系数求解子单元，用于以所述KL距离表达式的值最小化为优化目标，求解所述新增排序因子的权重系数的值。
[0046] 可选的，所述权重系数求解子单元具体用于，采用随机梯度下降算法或者逻辑回归优化算法求解所述新增排序因子的权重系数。
[0047] 可选的，所述权重系数计算单元还包括：
[0048] 预测排序分布获取子单元，用于在获取所述待评价客体的实际排序分布和计算所述待评价客体的预测排序分之后，通过计算所述待评价客体的预测排序分与全部待评价客体的预测排序分总和的比值，获取所述待评价客体的预测排序分布；
[0049] KL距离值计算子单元，用于计算所述实际排序分布和所述预测排序分布获取子单元输出的预测排序分布之间的KL距离值；
[0050] KL距离值判断子单元，用于判断所述KL距离值与上次采用本方法计算得到的KL 距离值相比较，其数值减小的比例是否小于预先设定的阈值；若是，则在后续使用本装置计算待评价客体排序分的过程中，不再触发所述权重系数计算单元及其子单元工作，相应的，所述排序分计算单元具体用于以所述待评价客体的原始评分数据、所述新增排序因子的值以及最近一次计算得到的所述新增排序因子权重系数的值为输入进行求解。
[0051] 可选的，第一次触发所述预测排序分计算子单元工作时，将所述新增排序因子权重系数的当前值设置为预先设定的初始值。
[0052] 可选的，所述装置还包括：
[0053] 客体数目判断子单元，用于在触发所述权重系数计算单元工作之前，判断所述待评价客体的数目是否大于求解新增排序因子权重系数所需待评价客体的预定数量；
[0054] 客体选择子单元，用于当所述客体数目判断子单元的输出为"是"时，按照所述待评价客体的原始评分数据从大到小的顺序，从中选择所述预定数量的待评价客体，作为后续使用本方法求解所述新增排序因子的权重系数所采用的待评价客体。
[0055] 此外，本申请还提供一种用于建立排序分计算模型的方法，包括：
[0056] 获取待评价客体的原始评分数据、新增排序因子的值、以及以实际交互行为系统中对应每个待评价客体的历史行为数据为根据，从中提取的对应特定排序目标的实际行为数据；
[0057] 计算根据所述实际行为数据得到的实际排序分布、和采用预先设定的排序分计算模型得到的预测排序分布之间的差

完整全部详细技术资料下载

当前第1页1 2 3 4 5 6

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘睿;吕韬;孙超;杨志雄;
技术所有人：阿里巴巴集团控股有限公司;
我是此专利的发明人

上一篇：非关系型数据库支持事务的方法及装置的制造方法
上一篇：非易失性数据存储方法及装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。