排序模型的训练方法和装置的制造方法

文档序号：9471946阅读：216来源：国知局

排序模型的训练方法和装置的制造方法
【技术领域】
[0001] 本发明设及网络技术领域，特别是设及一种排序模型的训练方法和装置。
【背景技术】
[0002] 随着互联网应用的发展，捜索处理技术已经成为互联网最主要的应用之一。例如，捜索引擎可W根据用户输入的关键词捜索得到符合该关键词特征的所有网页，再根据排序模型对捜索结果进行排序，最后W超级链接的方式向用户展示排序后的捜索结果，用户点击相应的链接就可W进入相应的网络资源网站，从而找到所需信息。然而，上述捜索到的结果通常数W百万计，通过排序模型将内容最相关的捜索结果排在前面，因此，如何对排序模型中的参数进行训练，W优化排序模型，从而得到更加符合用户需求的排序结果，一直是学术界和工业界的研究热点。
[0003] 目前，通常采用基于规则的方法或者基于机器学习的方法对排序模型进行训练。其中，基于规则的方法，即通过线上AB测试，人工调整模型参数，该方法需要耗费大量的人力、时间来确定模型参数，由于训练成本太高，使得获取的模型参数很难达到最优；此外，在用户行为发生变化时，需要重新训练模型参数，导致训练模型参数的效率较低。
[0004] 而基于机器学习的方法，可W不借助于人工调整模型参数，而是自动训练模型参数，该方法称为LTR(LearningToRank,学习排序）。具体地，LTR通过构建排序数据集，采用机器学习算法如支持向量机的排序学习算法RankSVM等自动训练模型参数，从而使得模型参数相对于数据集达到最优。然而，LTR的排序效果严重依赖于数据集的质量，而构建数据集又是一件耗时耗力的工作，而且在用户行为发生变化时，也需要重新构建数据集，从而导致训练模型参数的效率较低。

【发明内容】

[0005]本发明实施例提供一种排序模型的训练方法和装置，用W解决现有技术中训练模型参数效率较低的问题，W提高训练模型参数的效率。
[0006] 为了解决上述问题，本发明实施例公开了一种排序模型的训练方法，包括：
[0007] 根据排序模型，对用户捜索请求对应的捜索结果进行排序，得到对应的捜索排序结果；
[0008] 根据用户针对所述捜索排序结果的点击反馈，确定所述排序模型对应的捜索点击率.
[0009] 根据所述捜索点击率，按照预置的参数更新算法，对所述排序模型的模型参数进行更新。
[0010] 优选地，所述根据排序模型，对用户捜索请求对应的捜索结果进行排序，得到对应的捜索排序结果的步骤，包括：
[0011] 向具有相同模型和不同参数的多个排序模型中的任意一个，发送来自用户的用户捜索请求；
[0012] 接收来自所述排序模型的所述用户捜索请求对应的捜索排序结果。
[0013] 优选地，所述根据所述捜索点击率，按照预置的参数更新算法，对所述排序模型的模型参数进行更新的步骤，包括：
[0014] 根据所述捜索点击率，按照预置的参数更新算法，对所述排序模型的模型参数进行更新，直到各排序模型对应的捜索点击率达到稳定值。
[0015] 优选地，所述根据用户针对所述捜索排序结果的点击反馈，确定所述排序模型对应的捜索点击率的步骤，包括：
[0016] 收集所述捜索排序结果对应的用户捜索次数和用户点击次数；
[0017] 根据所述用户点击次数与所述用户捜索次数的比值，确定捜索点击率。
[0018] 优选地，所述预置的参数更新算法为梯度下降算法；
[0019] 所述根据所述捜索点击率，按照预置的参数更新算法，对所述排序模型的模型参数进行更新的步骤，包括：
[0020] 确定所述各排序模型的初始参数；
[0021] 确定所述各排序模型对应的捜索点击率；
[0022] 根据所述各排序模型对应的捜索点击率，按照梯度下降算法更新所述各排序模型的初始参数，直到所述初始参数达到稳定值。
[0023] 优选地，所述方法还包括：
[0024] 根据更新后的排序模型，对用户捜索请求对应的捜索结果进行排序，得到优化后的捜索排序结果。
[0025] 依据本发明的另一个方面，公开了一种排序模型的训练装置，包括：
[00%] 排序模块，用于根据排序模型，对用户捜索请求对应的捜索结果进行排序，得到对应的捜索排序结果；
[0027] 反馈模块，用于根据用户针对所述捜索排序结果的点击反馈，确定所述排序模型对应的捜索点击率；及
[0028] 更新模块，用于根据所述捜索点击率，按照预置的参数更新算法，对所述排序模型的模型参数进行更新。
[0029] 优选地，所述排序模块，包括：
[0030] 请求发送子模块，用于向具有相同模型和不同参数的多个排序模型中的任意一个，发送来自用户的用户捜索请求；
[0031] 结果接收子模块，用于接收来自所述排序模型的所述用户捜索请求对应的捜索排序结果。
[0032] 优选地，所述更新模块，包括：
[0033] 更新子模块，用于根据所述捜索点击率，按照预置的参数更新算法，对所述排序模型的模型参数进行更新，直到各排序模型对应的捜索点击率达到稳定值。
[0034] 优选地，所述反馈模块，包括：
[0035] 收集子模块，用于收集所述捜索排序结果对应的用户捜索次数和用户点击次数；
[0036]计算子模块，用于根据所述用户点击次数与所述用户捜索次数的比值，确定捜索点击率。
[0037] 优选地，所述预置的参数更新算法为梯度下降算法；
[0038] 所述更新模块，包括：
[0039] 初始化子模块，用于确定所述各排序模型的初始参数；
[0040] 点击率确定子模块，用于确定所述各排序模型对应的捜索点击率；
[0041] 迭代更新子模块，用于根据所述各排序模型对应的捜索点击率，按照梯度下降算法更新所述各排序模型的初始参数，直到所述初始参数达到稳定值。
[0042] 优选地，所述装置还包括：
[0043] 优化排序模块，用于根据更新后的排序模型，对用户捜索请求对应的捜索结果进行排序，得到优化后的捜索排序结果。
[0044] 本发明实施例包括W下优点： W45] 在本发明实施例中，根据用户针对捜索排序结果的点击反馈得到排序模型的捜索点击率，W及根据捜索点击率对排序模型的模型参数进行更新，可W在用户行为偏好发生变化时能够自动调整模型参数W适应用户的点击行为，相对于现有技术需要重新构建数据集，可W提高训练模型参数的效率。
【附图说明】
[0046] 图1示出了本发明的一种排序模型的训练方法实施例一的步骤流程图；
[0047] 图2示出了本发明的一种排序模型的训练系统的结构示意图； W48]图3示出了本发明的一种排序模型的训练方法实施例二的步骤流程图；
[0049] 图4示出了本发明的一种排序模型的训练装置实施例的结构框图。
【具体实施方式】
[0050] 为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。阳0川实施例一
[0052] 参照图1，示出了本发明的一种排序模型的训练方法实施例一的步骤流程图，具体可W包括：
[0053] 步骤101、根据排序模型，对用户捜索请求对应的捜索结果进行排序，得到对应的捜索排序结果；
[0054] 本发明实施例可适用于为用户提供捜索服务，并且将捜索得到的相关信息展示给用户的各种应用场景，比如百度、谷歌、雅虎等捜索引擎或者具有捜索功能的其他场景，本发明对于具体的捜索场景不加W限制。为了便于描述，W下均W捜索引擎为例进行说明，其它应用场景相互参照即可。
[0055] 在具体应用中，捜索引擎可W获取服务器中与用户捜索请求相应的内容；具体地，首先可W对用户捜索请求对应的捜索词进行分词，得到多个关键词，然后，通过释放大量的抓取程序，获取互联网上的网页，并按照网页相关性原理在每一个关键词和所有相关的网页之间建立一个对应关系，储存在服务器的数据库中。运样，在用户在捜索引擎中输入捜索词（例如"刘德华主演的电影"）进行捜索时，就可W在服务器中捜索找到与关键词"刘德华"W

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：胡军;陈英傑;王天畅;
技术所有人：北京奇艺世纪科技有限公司;
我是此专利的发明人

上一篇：基于聚类算法的玉米种子高光谱图像分类识别模型更新方法
上一篇：一种聚类方法和装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。