一种预测模型的训练方法、信息推荐的方法及装置与流程

文档序号：31404404发布日期：2022-09-03 05:54阅读：45来源：国知局

1.本说明书涉及计算机技术领域，尤其涉及一种预测模型的训练方法、信息推荐的方法及装置。

背景技术：

2.在现有的推荐业务中，向用户推送商家时，通常是基于预先训练的预测模型，通过用户的历史业务数据，学习用户的兴趣偏好，而后，确定用户的兴趣偏好与待推荐信息之间的匹配度，进而预测出用户针对每个待推荐信息的业务执行率，并将业务执行率高的待推荐信息优先推荐给用户。其中，该业务执行率越高，说明用户点击该待推荐信息后能够继续执行下单业务的概率越高。
3.然而，在上述预测模型进行为用户推荐信息时，该预测模型仅考虑了用户的兴趣偏好是否与历史推荐信息的内容是否相匹配，而未考虑到向用户推荐信息时用户所处的环境，对用户浏览并点击的推荐信息以及用户点击后继续执行业务的推荐信息的影响，如此，预测模型预测出的业务执行率存在较大的偏差，可能会出现最终向用户推荐的信息与用户实际的习惯不相符的情况。

技术实现要素：

4.本说明书提供一种预测模型的训练方法、信息推荐的方法及装置，以部分的解决现有技术存在的上述问题。
5.本说明书采用下述技术方案：
6.本说明书提供了一种预测模型的训练方法，包括：
7.获取训练样本，所述训练样本中包含有用户的历史业务数据和向所述用户推荐的候选信息；
8.将所述历史业务数据和所述候选信息输入到待训练的预测模型中，以通过所述预测模型，在所述用户执行所述历史业务数据对应业务时所处环境的基础上，确定假设所述用户点击所述候选信息且执行所述候选信息对应业务的概率，作为所述候选信息对应的业务执行率；
9.以最小化所述业务执行率与所述训练样本的标签信息之间的偏差为优化目标，对所述预测模型进行训练。
10.可选地，所述预测模型包括第一网络；
11.通过所述预测模型，在所述用户执行所述历史业务数据对应业务时所处环境的基础上，确定假设所述用户点击所述候选信息且执行所述候选信息对应业务的概率，作为所述候选信息对应的业务执行率，具体包括：
12.根据所述历史业务数据，确定在向所述用户推荐所述候选信息之前，所述用户点击过的历史推荐信息，作为第一历史推荐信息，以及所述用户执行过的业务所对应的历史推荐信息，作为第二历史推荐信息；
13.针对每个第一历史推荐信息，确定假设所述用户执行所述第一历史推荐信息对应的业务时的业务损耗特征，以及针对每个第二历史推荐信息，确定所述用户执行所述第二历史推荐信息对应的业务时的业务损耗特征；
14.将各第一历史推荐信息对应的业务损耗特征，各第二历史推荐信息对应的业务损耗特征，以及向所述用户推荐所述候选信息时所述用户所处环境的环境数据输入到所述第一网络中，以基于所述第一网络，确定在所述用户执行所述历史业务数据对应业务时所处环境的基础上，所述候选信息对应的业务执行率。
15.可选地，将各第一历史推荐信息对应的业务损耗特征，各第二历史推荐信息对应的业务损耗特征，以及向所述用户推荐所述候选信息时所述用户所处环境的环境数据输入到所述第一网络中，以基于所述第一网络，确定在所述用户执行所述历史业务数据对应业务时所处环境的基础上，所述候选信息对应的业务执行率，具体包括：
16.针对每个第一历史推荐信息，确定所述用户点击该第一历史推荐信息时所处的环境与所述环境数据对应环境之间的相似度，以及针对每个第二历史推荐信息，确定所述用户执行该第二历史推荐信息时所处的环境与所述环境数据对应环境之间的相似度；
17.根据相似度满足预设条件的第一历史推荐信息对应的业务损耗特征，以及相似度满足预设条件的第二历史推荐信息的业务损耗对应的业务损耗特征，确定在所述用户执行所述历史业务数据对应业务时所处环境的基础上，所述候选信息对应的业务执行率。
18.可选地，将各第一历史推荐信息对应的业务损耗特征，各第二历史推荐信息对应的业务损耗特征，以及向所述用户推荐所述候选信息时所述用户所处环境的环境数据输入到所述第一网络中，以基于所述第一网络，确定在所述用户执行所述历史业务数据对应业务时所处环境的基础上，所述候选信息对应的业务执行率，具体包括：
19.针对每个第二历史推荐信息，确定该第二历史推荐信息与每个第一历史推荐信息之间的相关性；
20.根据该第二历史推荐信息与每个第一历史推荐信息之间的相关性，调整该第二历史推荐信息对应的业务损耗特征；
21.根据每个第一历史推荐信息对应的业务损耗特征、每个第二历史推荐信息对应的调整后业务损耗特征，以及所述环境数据，确定在所述用户执行所述历史业务数据对应业务时所处环境的基础上，所述候选信息对应的业务执行率。
22.可选地，所述业务损耗特征包括用于表征用户在历史推荐信息所属商家消费的金额和/或向用户推荐历史推荐信息时，历史推荐信息所属商家与用户之间的距离。
23.可选地，所述预测网络还包括：第二网络；
24.将所述历史业务数据和所述候选信息输入到待训练的预测模型中，以通过所述预测模型，在所述用户执行所述历史业务数据对应业务时所处环境的基础上，确定假设所述用户点击所述候选信息且执行所述候选信息对应业务的概率，作为所述候选信息对应的业务执行率，具体包括：
25.根据所述历史业务数据，确定在向所述用户推荐所述候选信息之前，所述用户点击过的历史推荐信息，作为第一历史推荐信息，以及所述用户执行过的业务所对应的历史推荐信息，作为第二历史推荐信息；
26.针对每个第一历史推荐信息，确定假设所述用户执行所述第一历史推荐信息对应
的业务时，与所述第一历史推荐信息所属商家之间的距离，作为第一历史推荐信息对应的距离，以及针对每个第二历史推荐信息，确定假设所述用户执行所述第二历史推荐信息对应的业务时，与所述第二历史推荐信息所属商家之间的距离，作为第二历史推荐信息对应的距离；
27.根据每个第一历史推荐信息对应的距离，以及每个第二历史推荐信息对应的距离，确定所述用户点击所述候选信息且执行所述候选信息对应业务的概率，作为所述候选信息对应的业务执行率。
28.可选地，根据每个第一历史推荐信息对应的距离，以及每个第二历史推荐信息对应的距离，确定所述用户点击所述候选信息且执行所述候选信息对应业务的概率，作为所述候选信息对应的业务执行率，具体包括：
29.确定向所述用户推荐所述候选信息时，所述用户与所述候选信息所属商家之间的距离，作为目标距离；
30.根据所述目标距离与每个第一历史推荐信息对应的距离之间的相似度，以及所述目标距离与每个第二历史推荐信息对应的距离之间的相似度，确定所述用户点击所述候选信息且执行所述候选信息对应业务的概率，作为所述候选信息对应的业务执行率。
31.可选地，根据所述目标距离与每个第一历史推荐信息对应的距离之间的相似度，以及所述目标距离与每个第二历史推荐信息对应的距离之间的相似度，确定所述用户点击所述候选信息且执行所述候选信息对应业务的概率，作为所述候选信息对应的业务执行率，具体包括：
32.根据所述目标距离与每个第一历史推荐信息对应的距离之间的相似度，确定每个第一历史推荐信息对应的注意力权重，以及根据所述目标距离与每个第二历史推荐信息对应的距离之间的相似度，确定每个第二历史推荐信息对应的注意力权重；
33.根据每个第一历史推荐信息对应的注意力权重，对各第一历史推荐信息对应的距离进行加权，得到每个第一历史推荐信息对应的加权后距离，以及根据每个第二历史推荐信息对应的注意力权重，对各第二历史推荐信息对应的距离进行加权，得到每个第二历史推荐信息对应的加权后距离；
34.根据每个第一历史推荐信息对应的加权后距离，以及每个第二历史推荐信息对应的加权后距离，确定所述用户点击所述候选信息且执行所述候选信息对应业务的概率，作为所述候选信息对应的业务执行率。
35.可选地，根据所述目标距离与每个第一历史推荐信息对应的距离之间的相似度，以及所述目标距离与每个第二历史推荐信息对应的距离之间的相似度，确定所述用户点击所述候选信息且执行所述候选信息对应业务的概率，作为所述候选信息对应的业务执行率，具体包括：
36.通过预设的滑动窗口，从各第一历史推荐信息对应的距离所组成的第一距离序列中，确定各第一子距离序列，以及从各第二历史推荐信息对应的距离所组成的第二距离序列中，确定各第二子距离序列；
37.针对每个第一子距离序列，根据所述目标距离与该第一子距离序列中包含的每个第一历史推荐信息对应距离之间的相似度，确定所述目标距离与该第一子距离序列之间的距离特征，以及，针对每个第二子距离序列，根据所述目标距离与该第二子距离序列中包含
的每个第二历史推荐信息对应距离之间的相似度，确定所述目标距离与该第二子距离序列之间的距离特征；
38.根据每个第一子距离序列对应的距离特征，以及每个第二子距离序列对应的距离特征，确定所述用户点击所述候选信息且执行所述候选信息对应业务的概率，作为所述候选信息对应的业务执行率。
39.可选地，将所述历史业务数据和所述候选信息输入到待训练的预测模型中，以通过所述预测模型，在所述用户执行所述历史业务数据对应业务时所处环境的基础上，确定假设所述用户点击所述候选信息且执行所述候选信息对应业务的概率，作为所述候选信息对应的业务执行率，具体包括：
40.将所述历史业务数据和所述候选信息输入到待训练的预测模型中，以通过所述预测模型，确定在所述用户执行所述历史业务数据对应业务时所处环境的基础上，所述用户点击所述候选信息的概率，作为所述候选信息对应的预测点击率，以及，在假设所述用户点击所述候选信息后，所述用户执行所述候选信息的概率，作为所述候选信息对应的业务转化率；
41.根据所述预测点击率和所述业务转化率，确定所述候选信息对应的业务执行率。
42.可选地，以最小化所述业务执行率与所述训练样本的标签信息之间的偏差为优化目标，对所述预测模型进行训练之前，还包括：
43.通过所述预测模型，在所述用户执行所述历史业务数据对应业务时所处环境的基础上，预测所述用户点击所述候选信息的概率，作为所述历史推荐信息对应的预测点击率；
44.以最小化所述业务执行率与所述训练样本的标签信息之间的偏差为优化目标，对所述预测模型进行训练，具体包括：
45.以最小化所述预测点击率与点击率标签之间的偏差，以及最小化所述业务执行率与所述业务执行率标签之间的偏差为优化目标，对所述预测模型进行训练。
46.本说明书提供了一种信息推荐的方法，包括：
47.获取需要向用户推荐的各候选信息以及所述用户的历史业务数据；
48.针对每个候选信息，将该候选信息和所述历史业务数据输入到预先训练的预测模型中，以使所述预测模型在所述用户执行所述历史业务数据对应业务时所处环境的基础上，确定假设所述用户点击该候选信息且执行该候选信息对应业务的概率，作为该候选信息对应的业务执行率，所述预测模型是通过上述方法训练得到的；
49.根据各候选信息对应的业务执行率，向所述用户进行信息推荐。
50.本说明书提供了一种预测模型的训练装置，包括：
51.获取模块，用于获取训练样本，所述训练样本中包含有用户的历史业务数据和向所述用户推荐的候选信息；
52.业务执行率预测模块，用于将所述历史业务数据和所述候选信息输入到待训练的预测模型中，以通过所述预测模型，在所述用户执行所述历史业务数据对应业务时所处环境的基础上，确定假设所述用户点击所述候选信息且执行所述候选信息对应业务的概率，作为所述候选信息对应的业务执行率；
53.训练模块，用于以最小化所述业务执行率与所述训练样本的标签信息之间的偏差为优化目标，对所述预测模型进行训练。
54.本说明书提供了一种信息推荐的装置，包括：
55.获取模块，用于获取需要向用户推荐的各候选信息以及所述用户的历史业务数据；
56.业务执行率预测模块，用于针对每个候选信息，将该候选信息和所述历史业务数据输入到预先训练的预测模型中，以使所述预测模型在所述用户执行所述历史业务数据对应业务时所处环境的基础上，确定假设所述用户点击该候选信息且执行该候选信息对应业务的概率，作为该候选信息对应的业务执行率，所述预测模型是通过上述方法训练得到的；
57.推荐模块，用于根据各候选信息对应的业务执行率，向所述用户进行信息推荐。
58.本说明书提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述预测模型的训练方法以及信息推荐的方法。
59.本说明书提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述预测模型的训练方法以及信息推荐的方法。
60.本说明书采用的上述至少一个技术方案能够达到以下有益效果：
61.在本说明书提供的预测模型的训练方法以及信息推荐的方法中，获取训练样本，并将历史业务数据和候选信息输入到待训练的预测模型中，以通过预测模型，在用户执行历史业务数据对应业务时所处环境的基础上，确定假设用户点击候选信息且执行候选信息对应业务的概率，作为候选信息对应的业务执行率，进而最小化业务执行率与训练样本的标签信息之间的偏差为优化目标，对预测模型进行训练。而后，在向用户推荐信息时，针对需要向用户推荐的每个候选信息，将该候选信息和用户的历史业务数据输入到预先训练的预测模型中，以使预测模型在用户执行历史业务数据对应业务时所处环境的基础上，确定假设用户点击该候选信息且执行该候选信息对应业务的概率，作为该候选信息对应的业务执行率，并根据各候选信息对应的业务执行率，向用户进行信息推荐。
62.从上述方法中可以看出，本方法中在通过该预测模型预测出的业务执行率向用户推荐候选信息时，考虑到了用户所处环境下用户的偏好，以提升了预测模型的精度。
附图说明
63.此处所说明的附图用来提供对本说明书的进一步理解，构成本说明书的一部分，本说明书的示意性实施例及其说明用于解释本说明书，并不构成对本说明书的不当限定。在附图中：
64.图1为本说明书中涉及的预测模型的结构示意图；
65.图2为本说明书中一种预测模型的训练方法的流程示意图；
66.图3为本说明书中一种信息推荐的方法的流程示意图；
67.图4为本说明书提供的一种预测模型的训练装置的示意图；
68.图5为本说明书提供的一种信息推荐的装置的示意图；
69.图6为本说明书提供的对应于图1或图3的电子设备示意图。
具体实施方式
70.为使本说明书的目的、技术方案和优点更加清楚，下面将结合本说明书具体实施
例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本说明书保护的范围。
71.针对由于预测模型未考虑到向用户推荐信息时用户所处的环境，对用户浏览并点击的推荐信息以及用户点击后继续执行业务的推荐信息的影响，导致预测模型预测出的业务执行率存在较大的偏差的问题，本说明书中提供了一种预测模型，该预测模型包括兴趣子网络、第一网络以及第二网络以及预测子网络，参见图1。在训练该预测模型时，获取训练样本，该训练样本中包含有用户的历史业务数据和向用户推荐的候选信息，再将用户的历史业务数据和候选信息输入到待训练的预测模型中，以使预测模型在用户执行历史业务数据对应业务时所处环境的基础上，确定假设用户点击该候选信息且执行该候选信息对应业务的概率，作为该候选信息对应的业务执行率，最后，以最小化该业务执行率与训练样本的标签信息之间的偏差为优化目标，对该预测模型进行训练。
72.其中，在确定业务执行率时，预测模型将用户的历史业务数据、候选信息以及向用户推荐该候选信息时用户所处环境的环境数据，输入到兴趣子网络中，确定用户针对该候选信息的基础偏好特征，同时，将用户的历史业务数据、该候选信息以及该环境数据输入到第一网络中，确定假设用户执行第一历史推荐信息(即，历史业务数据中，在向用户推荐该候选信息之前该用户实际点击过的历史推荐信息)对应的业务时的业务损耗特征，以及用户执行第二历史推荐信息(即，历史业务数据中，在向用户推荐该候选信息之前该用户执行过的业务所对应的历史推荐信息)对应的业务时的业务损耗特征。此外，还将用户的历史业务数据输入到第二网络，确定每个第一历史推荐信息对应的距离，以及每个第二历史推荐信息对应的距离。最终，根据兴趣子网络、线上成本偏好网络以及线下成本偏好网络输出的结果，预测假设用户点击该候选信息且执行该候选信息对应业务的概率，作为该候选信息对应的业务执行率，并以最小化该业务执行率与训练样本的标签信息之间的偏差为优化目标，对预测模型进行训练。
73.如此，该预测模型不仅考量了用户的基础偏好与候选信息之间的匹配程度，同时考量了在向用户推荐候选信息时，该用户所处的环境对用户偏好的影响，提升了预测模型的精度。
74.其中，o2o业务是一种线上和线下相结合的商业模式，用户下单时，通常是在线上选中商品，并线下前往下单商家消费已购买的商品，完成订单。如此，用户所需承担的成本包括用户线上支付的成本和线下出行的成本。因此，由于上述预测模型在预测用户针对候选信息的业务执行率时，考虑到了向用户推荐候选信息时，用户与候选信息所属商家之间的距离，因而，该预测模型可以适用于在线上和线下相结合的o2o(online to offline)业务中，预测用户点击候选信息后并执行候选信息对应的业务的业务执行率，以向用户推荐信息。
75.下面将结合实施例详细阐述本说明书中提供的预测模型的训练方案以及信息推荐的方案。
76.图2为本说明书中一种预测模型的训练方法的流程示意图，具体包括以下步骤：
77.步骤s200，获取训练样本，所述训练样本中包含有用户的历史业务数据和向所述用户推荐的候选信息。
78.本说明书中提供的预测模型的训练方法以及信息推荐的方法的执行主体可以是诸如台式电脑等终端设备，也可以是为信息推荐业务提供业务支持的服务器或业务平台。为了便于描述，下面将仅以业务平台为执行主体，对本说明书提供的预测模型的训练方法以及信息推荐的方法进行说明。
79.具体实施中，业务平台首先获取训练样本，其中，该训练样本中包含有用户的历史业务数据和向用户推荐的候选信息。该候选信息可以是需要向用户推荐的广告、商家、商品、用户评论等多种数据。
80.用户的历史业务数据中记录了用户已执行过的各项业务的业务记录，该业务记录中包括历史上用户点击查看过的各第一历史推荐信息、每个第一历史推荐信息所属的商家与用户之间的距离、每个第一历史推荐信息所属的商家对应的人均消费金额、每个第一历史推荐信息所属的商家对应的团单金额、历史上用户点击并执行过业务的各第二历史推荐信息、用户在每个第二历史推荐信息所属的商家消费的金额、每个第二历史推荐信息所属的商家对应的人均消费金额、每个第二历史推荐信息所属的商家对应的人均消费金额、每个第二历史推荐信息所属的商家对应的团单金额等。
81.此外，该训练样本中还可以用户的属性信息，该属性信息包括能够体现出用户个人基本特性的信息，如，用户年龄、用户性别、用户所在的城市、用户籍贯等信息，在此就不详细说明了。
82.该训练样本中还将包括在向用户推荐信息时用户所处的环境的环境数据。该环境数据可以包括：用户所在位置的天气信息(包括当时的气温(如，35℃)，以及气象(如，雨、雪、大风等))、用户所在城市的城市编码、用户使用的终端设备的设备型号等。
83.还需要说明的是，该候选信息也是历史上向用户推荐的历史推荐信息，根据用户是否点击了该候选信息、用户点击该候选信息后是否执行了该候选信息对应的业务，可以确定出包含该候选信息的训练样本的标签信息。
84.步骤s202，将所述历史业务数据和所述候选信息输入到待训练的预测模型中，以通过所述预测模型，在所述用户执行所述历史业务数据对应业务时所处环境的基础上，确定假设所述用户点击所述候选信息且执行所述候选信息对应业务的概率，作为所述候选信息对应的业务执行率。
85.本说明书中，该预测模型共包括四个网络，分别为兴趣子网络、第一网络、第二网络，以及预测子网络。具体实施中，业务平台将用户的历史业务数据和该候选信息输入到待训练的预测模型中，以通过兴趣子网络确定用户针对该候选信息的基础偏好特征，通过第一网络确定用户执行历史推荐信息对应的业务时的业务损耗特征，以及通过第二网络，确定用户执行过业务的历史推荐信息对应的距离，最后，将该基础偏好特征、业务损耗特征以及用户执行过业务的历史推荐信息对应的距离，输入到该预测子网络中，预测假设用户点击该候选信息且执行该候选信息对应业务的概率，作为该候选信息对应的业务执行率。
86.下面将详细阐述，确定该候选信息对应的业务执行率的过程。
87.首先，业务平台需要通过兴趣子网络，确定用户的基础偏好特征。具体的，业务平台，将向用户推荐的候选信息、用户的历史业务数据、用户属性信息以及向用户推荐该候选信息时用户所处的环境的环境数据输入到兴趣子网络中，以使该兴趣子网络，对历史业务数据和用户属性信息进行编码，得到用户的用户画像特征u，对该候选信息进行编码，得到
该候选信息的推荐信息特征s，对环境数据进行编码，得到向用户该候选信息时用户所处的环境对应的环境特征c。而后，再由该兴趣子网络，将用户画像特征u、该候选信息的推荐信息特征s以及环境特征c拼接起来，并通过全连接层进行特征提取，得到用户针对该候选信息的兴趣偏好特征b
u,s
。其中，用户针对该候选信息的兴趣偏好特征b
u,s
可以表征为：b
u,s
＝elu(mlp(concat(u,s,c)))，其中，elu()为激活函数，mlp()表示采用多层感知器对输入数据进行处理。
88.需要说明的是，本说明书中在对连续数据进行编码时，需要先将连续数据离散化，而后，进行再进行编码，而，对于离散数据，则可以直接进行编码处理。
89.与此同时，业务平台还需要通过第一网络，确定在向用户推荐该候选信息之前用户点击过的历史推荐信息对应的业务损耗特征，和用户执行过的业务所对应的历史推荐信息对应的业务损耗特征。
90.具体实施中，业务平台首先根据历史业务数据，确定在向用户推荐候选信息之前，用户点击过的历史推荐信息，作为第一历史推荐信息，并针对每个第一历史推荐信息，确定假设用户执行该第一历史推荐信息对应的业务时的业务损耗特征。同时，业务平台确定在向用户推荐候选信息之前用户执行过的业务所对应的历史推荐信息，作为第二历史推荐信息，并针对每个第二历史推荐信息，确定用户执行第二历史推荐信息对应的业务时的业务损耗特征。而后，业务平台将确定出的各第一历史推荐信息对应的业务损耗特征，各第二历史推荐信息对应的业务损耗特征，以及向用户推荐候选信息时用户所处环境的环境数据输入到预测模型中的第一网络中，以基于该第一网络，确定在用户执行历史业务数据对应业务时所处环境的基础上，该候选信息对应的业务执行率。
91.其中，历史推荐信息的业务损耗特征包括用于表征用户在历史推荐信息所属商家消费的金额和/或向用户推荐历史推荐信息时，历史推荐信息所属商家与用户之间的距离。实际业务中，第一历史推荐信息的业务损耗中，用户在历史推荐信息所属商家消费的金额可以是统计出的客单价、假设用户执行业务时所需支付的费用等。第二历史推荐信息的业务损耗中，用户在历史推荐信息所属商家消费的金额则为用户实际消费的金额。
92.如此，可以将用户执行历史推荐信息对应的业务时的业务损耗特征可以表征为：
[0093][0094]
表示用户执行第i个历史推荐信息对应的业务时该第i个历史推荐信息所属的商家的商家标识；
[0095]
表示用户执行第i个历史推荐信息对应的业务时该第i个历史推荐信息所属的商家与用户之间的距离特；
[0096]
表征用户执行第i个历史推荐信息对应的业务时用户在该第i个历史推荐信息所属商家消费的金额的特征。
[0097]
这样，通过上述公式，可以确定出各第一历史推荐信息对应的业务损耗特征各第二历史推荐信息对应的业务损耗特征后，接着，将各第一历史推荐信息对应的业务损耗特征和各第二历史推荐信息对应的业务损耗特征输入
到第一网络中，以基于该第一网络，确定在用户执行历史业务数据对应业务时所处环境的基础上，该候选信息对应的业务执行率。
[0098]
其中，在基于第一网络，根据业务损耗特征确定该候选信息对应的业务执行率之前，业务平台可以进一步的分别对第一历史推荐信息，以及第二历史推荐信息进行筛选，确定出与向用户推荐候选信息时用户所处环境的环境数据相匹配的第一历史推荐信息，以及与向用户推荐候选信息时用户所处环境的环境数据相匹配的第二历史推荐信息，再根据筛选出的第一历史推荐信息和第二历史推荐信息，确定该候选信息对应的业务执行率。
[0099]
具体实施中，业务平台可以针对每个第一历史推荐信息，确定用户点击该第一历史推荐信息时所处的环境与该环境数据对应环境之间的相似度，而后，筛选出相似度满足预设条件的第一历史推荐信息对应的业务损耗特征，同时，针对每个第二历史推荐信息，确定用户执行该第二历史推荐信息时所处的环境与环境数据对应环境之间的相似度，再筛选出相似度满足预设条件的第二历史推荐信息对应的业务损耗特征。接着，根据相似度满足预设条件的第一历史推荐信息对应的业务损耗特征，以及相似度满足预设条件的第二历史推荐信息的业务损耗对应的业务损耗特征，确定在用户执行历史业务数据对应业务时所处环境的基础上，该候选信息对应的业务执行率。
[0100]
其中，确定用户点击该第一历史推荐信息时所处的环境与该环境数据对应环境之间的相似度，以及用户执行该第二历史推荐信息时所处的环境与环境数据对应环境之间的相似度，均可以通过稀疏自注意力机制实现。
[0101]
具体的，该稀疏自注意力机制的具体公式如下：
[0102][0103]
则在上述公式中，topk(
·
)表示取与向用户推荐该候选信息时该用户所处的环境的环境数据最相关的k个历史推荐信息；
[0104]
q可以用于表征查询特征；
[0105]kt
可以用于表征被查询的键的转置；
[0106]
v可以用于表征被查询的键的值；
[0107]
可以用于表征向量维度的开方。
[0108]
如此，相似度满足预设条件的第一历史推荐信息对应的业务损耗特征以表示为：
[0109][0110]
其中，qc＝σ(wc×
c+bc)表征查询条件为向用户推荐该候选信息时用户所处的环境的环境特征；
[0111]
表征由各第一历史推荐信息对应的业务损耗特征所构成的查询的键；
[0112]
表示由各第一历史推荐信息对应的业务损耗特征所构成的查询的键的值；
[0113]
wc,以及，bc,为可学习的参数矩阵；
[0114]
hc为假设用户执行历史上点击过的第一历史推荐信息对应业务时的业务损耗特征。
[0115]
如此可知，sparse attention的输出为与向用户推荐候选信息时用户所处的环境的环境特征相关性最高的若干个第一历史推荐信息对应的业务的业务损耗。
[0116]
同理，相似度满足预设条件的第一历史推荐信息对应的业务损耗特征以表示为：
[0117][0118]
其中，qc＝σ(wc×
c+bc)表征查询条件为向用户推荐该候选信息时用户所处的环境的环境特征；
[0119]
表征由各第二历史推荐信息对应的业务损耗特征所构成的查询的键；
[0120]
表示由各第二历史推荐信息对应的业务损耗特征所构成的查询的键的值；
[0121]
wc,以及，bc,为需要学习的参数矩阵；
[0122]ho
为用户历史上执行过业务的第二历史推荐信息对应业务时的业务损耗特征。
[0123]
如此可知，sparse attention的输出为与向用户推荐候选信息时用户所处的环境的环境特征相关性最高的若干个第二历史推荐信息对应的业务的业务损耗。
[0124]
这样，相似度满足预设条件的第一历史推荐信息对应的业务损耗特征可以表征为：其中，表征用户执行相似度满足预设条件的第一历史推荐信息中第i个第一历史推荐信息对应业务时的业务损耗特征。相似度满足预设条件的第二历史推荐信息对应的业务损耗特征可以表征为：表征其中，表征用户执行相似度满足预设条件的第一历史推荐信息中第i个第一历史推荐信息对应业务时的业务损耗特征。
[0125]
如此，仅利用相似度满足预设条件的第一历史推荐信息对应的业务损耗特征，和相似度第一历史推荐信息对应的业务损耗特征，来确定该候选信息对应的业务执行率，可以减少占用的资源量，同时，提取出来的业务损耗特征，与当前用户实际偏好的业务损耗更为相近，因而还可以提升预测模型的精度。
[0126]
进一步的，实际业务中用户点击过的第一历史推荐信息，与用户实际执行的业务的第二历史推荐信息之间是存在一定的转化规律，本说明书中，将通过第一网络来学习出用户点击过的第一历史推荐信息，与用户执行的业务的第二历史推荐信息之间的相关性，来辅助确定候选信息对应的业务执行率，以提升预测模型的精度。
[0127]
具体实施中，业务平台针对每个第二历史推荐信息，确定该第二历史推荐信息与每个第一历史推荐信息之间的相关性，而后，根据该第二历史推荐信息与每个第一历史推荐信息之间的相关性，调整该第二历史推荐信息对应的业务损耗特征，最后，根据每个第一历史推荐信息对应的业务损耗特征、每个第二历史推荐信息对应的调整后业务损耗特征，以及环境数据，确定在用户执行历史业务数据对应业务时所处环境的基础上，该候选信息对应的业务执行率。
[0128]
具体实施时，业务平台可以采用一下两种方式，对该第二历史推荐信息对应的业务损耗特征进行调整。
[0129]
方式一：将每个针对每个第二历史推荐信息，确定该第二历史推荐信息与每个第一历史推荐信息之间的相关性。
[0130]
具体实施中，业务平台针对每个第二历史推荐信息，根据该第二历史推荐信息对应的业务损耗特征，和每个第一历史推荐信息之间对应的业务损耗特征，确定该第二历史推荐信息与每个第一历史推荐信息之间的相关性。而后，根据该第二历史推荐信息与每个第一历史推荐信息之间的相关性，确定每个第一历史推荐信息针对该第二历史推荐信息的调整系数。最后，针对每个第一历史推荐信息，根据该第一历史推荐信息针对该第二历史推荐信息的调整系数，对该第一历史推荐信息对应的业务损耗进行加权，再根据得到的每个第一历史推荐信息对应的加权后的业务损耗特征，对该第二历史推荐信息对应的业务损耗特征进行调整，得到该第二历史推荐信息对应的调整后业务损耗特征。
[0131]
其中，第i个第一历史推荐信息针对第j个第二历史推荐信息的调整系数的公式如下所示：
[0132][0133]
其中，表示相似度满足预设条件的第一历史推荐信息中第i个第一历史推荐信息对应的业务损耗特征；
[0134]
表示相似度满足预设条件的第二历史推荐信息中第j个第二历史推荐信息对应的业务损耗特征；
[0135]
表示用户点击的第i个第一历史推荐信息对应的业务损耗特征，与用户执行第j个第二历史推荐信息对应的业务损耗特征之间的相关性；
[0136]
为待学习的权重矩阵。
[0137]
进一步的，第j个第二历史推荐信息对应的调整后业务损耗特征确定公式如下所示：
[0138][0139]
其中，表示相似度满足预设条件的第一历史推荐信息中第i个第一历史推荐信息对应的业务损耗特征；
[0140]
表示相似度满足预设条件的第二历史推荐信息中第j个第二历史推荐信息对应的业务损耗特征；
[0141]
表示用户点击的第i个第一历史推荐信息对应的业务损耗特征，与用户执行过的第j个第二历史推荐信息对应的业务损耗特征之间的相关性；
[0142]
表示用户点击的各第一历史推荐信息对应的业务损耗特征与用户执行各第二历史推荐信息对应的业务损耗特征之间的相关性之和；
[0143]
表示用户点击的第i个第一历史推荐信息对应的业务损耗特征，与用户执行第j个第二历史推荐信息对应的业务损耗特征之间的相关性，占用户点击的各第一历史推荐信息对应的业务损耗特征与用户执行各第二历史推荐信息对应的业务损耗特征之间的相关性之和的比重，称为第i个第一历史推荐信息针对第j个第二历史推荐信息的调整系数；
[0144]
表示采用第i个第一历史推荐信息针对第j个第二历史推荐信息的调整系数，对第i个第一历史推荐信息对应的业务损耗进行加权后，得到的第i个第一历史推荐信息对应的加权后的业务损耗特征；
[0145]
表示采用每个第一历史推荐信息对应的加权后的业务损耗特征，对用户执行过的第j个第二历史推荐信息对应的业务损耗特征进行调整，得到第j个第二历史推荐信息对应的调整后业务损耗特征。
[0146]
上述方法中，综合考虑了每个第一商家与每个第二商家整体上的相关性，下面还将给出针对交易成本特征内的每种商家信息对应的特征，来确定在该中种商家信息下第一商家与第二商家的相关性。
[0147]
方式二：将每个针对每个第二历史推荐信息对应的业务损耗中的每个第二特征，确定该第二特征与每个第一历史推荐信息对应的业务损耗中的每个第二特征之间的相关性。
[0148]
具体实施中，业务平台针对第二历史推荐信息对应的业务损耗特征中的每个第二子特征，确定该第二子特征，与每个第二历史推荐信息对应的业务损耗特征中的每个第一子特征之间的相关性，而后，根据该相关性，确定每个第一子特征针对每个第二子特征的调整系数。最后，针对每个第一子特征，根据该第一子特征针对该第二子特征的调整系数，对该第一子特征加权，再根据得到的每个加权后的第一子特征，对该第二子特征进行调整，得到调整后第二子特征。
[0149]
其中，第一历史推荐信息对应的业务损耗特征包括三个第一子特征，分别为：其中，表示各第一历史推荐信息对应业务损耗特征中商家标识特征，表示各第一历史推荐信息对应业务损耗特征中用于表征向用户推荐历史推荐信息时，历史推荐信息所属商家与用户之间的距离的特征，表示各第一历史推荐信息对应业务损耗特征中用于表征用户在历史推荐信息所属商家消费的金额的特征。
[0150]
第二历史推荐信息对应的业务损耗特征同样包括三个第二子特征，分别为其中，表示各第一历史推荐信息对应业务损耗特征中商家标识特征，表示各第一历史推荐信息对应业务损
耗特征中所对应的特征用于表征向用户推荐历史推荐信息时，历史推荐信息所属商家与用户之间的距离的特征，表示各第一历史推荐信息对应业务损耗特征中用于表征用户在历史推荐信息所属商家消费的金额的特征。
[0151]
如此，针对第二历史推荐信息对应的业务损耗特征中的第ctxi维第二子特征，确定该第ctxi维的特征，与第一历史推荐信息对应的业务损耗特征中第ctxj维的第一子特征之间的相关性的公式如下所示：
[0152][0153]
其中，表示第一历史推荐信息对应的业务损耗特征中的第ctxi维第一子特征；
[0154]
表示第二历史推荐信息对应的业务损耗特征中的第ctxi维第二子特征；
[0155]
表示第二历史推荐信息对应的业务损耗特征中的第ctxi维第二子特征，与第一历史推荐信息对应的业务损耗特征中的第ctxi维第一子特征之间的相关性；
[0156]
待学习的权重矩阵。
[0157]
进一步的，调整后的第二商家的交易成本特征的确定公式如下所示：
[0158][0159]
其中，表示第一历史推荐信息对应的业务损耗特征中的第ctxi维第一子特征；
[0160]
表示第二历史推荐信息对应的业务损耗特征中的第ctxj维第二子特征；
[0161]
表示第一历史推荐信息对应的业务损耗特征中的第ctxi维第一子特征，与第二历史推荐信息对应的业务损耗特征中的第ctxj维第二子特征之间的相关性；
[0162]
表示第一历史推荐信息对应的业务损耗特征中的每个维第一子特征，与第二历史推荐信息对应的业务损耗特征中的第ctxj维第二子特征之间的相关性之和；
[0163]
表示第一历史推荐信息对应的业务损耗特征中的第ctxi维第一子特征，与第二历史推荐信息对应的业务损耗特征中的第ctxj维第二子特征之间的相关性，占第一历史推荐信息对应的业务损耗特征中的每个维第一子特征，与第二历史推荐信息对应的业务损耗特征中的第ctxj维第二子特征之间的相关性之和的比重，称为第ctxi维第一子特征针对第ctxj维第二子特征的调整系数；
[0164]
表示采用第ctxi维第一子特征针对第ctxj维第二子特征的
调整系数，对第ctxi维第一子特征进行加权；
[0165]
表示采用每个加权后的第一子特征进行加权并求和，并对ctxj维第二子特征。
[0166]
例如，表示用户点击的历史推荐信息所属商家与用户之间的距离，与用户执行过业务的历史推荐信息所属商家与用户之间的距离的相关性。表示用户点击的历史推荐信息所属商家与用户之间的距离，与用户执行过业务的历史推荐信息所属商家消费的金额的相关性。
[0167]
其中，上述过程中所涉及到的第一历史推荐信息对应的业务损耗特征可以是业务平台从历史业务数据中确定出的每个第一历史推荐信息对应的业务损耗特征，也可以是选取出的相似度满足预设条件的第一历史推荐信息对应的业务损耗特征。同理，上述第二历史推荐信息对应的业务损耗特征可以是业务平台从历史业务数据中确定出的每个第二历史推荐信息对应的业务损耗特征，也可以是选取出的相似度满足预设条件的第二历史推荐信息对应的业务损耗特征。
[0168]
实际业务中，业务平台可以将通过上述两种调整方式调整后的第二历史推荐信息对应的调整后的业务损耗特征，与每个调整后的第二子特征进行拼接，得到每个第二历史推荐信息对应的调整后业务损耗特征。而后，对得到的特征，进行池化，已根据池化后的特征，确定在用户执行历史业务数据对应业务时所处环境的基础上，候选信息对应的业务执行率。
[0169]
此外，业务平台还将通过第二网络，提取出假设用户执行第一历史推荐信息对应的业务时，与第一历史推荐信息所属商家之间的距离，以及用户执行第二历史推荐信息对应的业务时，与第二历史推荐信息所属商家之间的距离，并根据提取出的距离，确定在用户执行历史业务数据对应业务时所处环境的基础上，候选信息对应的业务执行率。
[0170]
具体实施，业务平台根据历史业务数据，确定在向用户推荐候选信息之前，用户点击过的历史推荐信息，作为第一历史推荐信息，以及用户执行过的业务所对应的历史推荐信息，作为第二历史推荐信息，而后，针对每个第一历史推荐信息，确定假设用户执行第一历史推荐信息对应的业务时，与第一历史推荐信息所属商家之间的距离，作为第一历史推荐信息对应的距离，以及针对每个第二历史推荐信息，确定用户执行第二历史推荐信息对应的业务时，与第二历史推荐信息所属商家之间的距离，作为第二历史推荐信息对应的距离，最后，根据每个第一历史推荐信息对应的距离，以及每个第二历史推荐信息对应的距离，确定所述用户点击候选信息且执行候选信息对应业务的概率，作为候选信息对应的业务执行率。
[0171]
具体的，业务平台可以确定向用户推荐所述候选信息时，用户与候选信息所属商家之间的距离，作为目标距离，而后，根据目标距离与每个第一历史推荐信息对应的距离之间的相似度，以及目标距离与每个第二历史推荐信息对应的距离之间的相似度，确定用户点击候选信息且执行候选信息对应业务的概率。
[0172]
进一步地，业务平台可以根据目标距离与每个第一历史推荐信息对应的距离之间
的相似度，确定每个第一历史推荐信息对应的注意力权重，以及根据目标距离与每个第二历史推荐信息对应的距离之间的相似度，确定每个第二历史推荐信息对应的注意力权重。而后，根据每个第一历史推荐信息对应的注意力权重，对各第一历史推荐信息对应的距离进行加权，得到每个第一历史推荐信息对应的加权后距离，以及根据每个第二历史推荐信息对应的注意力权重，对各第二历史推荐信息对应的距离进行加权，得到每个第二历史推荐信息对应的加权后距离。最后，根据每个第一历史推荐信息对应的加权后距离，以及每个第二历史推荐信息对应的加权后距离，确定用户点击候选信息且执行候选信息对应业务的概率，作为候选信息对应的业务执行率。
[0173]
实际业务中，业务平台通过预设的滑动窗口，从各第一历史推荐信息对应的距离所组成的第一距离序列中，确定各第一子距离序列，以及从各第二历史推荐信息对应的距离所组成的第二距离序列中，确定各第二子距离序列，而后，针对每个第一子距离序列，根据目标距离与该第一子距离序列中包含的每个第一历史推荐信息对应距离之间的相似度，确定目标距离与该第一子距离序列之间的距离特征，以及，针对每个第二子距离序列，根据目标距离与该第二子距离序列中包含的每个第二历史推荐信息对应距离之间的相似度，确定目标距离与该第二子距离序列之间的距离特征，最后，根据每个第一子距离序列对应的距离特征，以及每个第二子距离序列对应的距离特征，确定用候选信息对应的业务执行率。
[0174]
历史推荐信息所属商家和用户之间的距离可以记为d＝embedding(s
dis
)，若设定滑动窗口的长度为ws，根据滑动窗口的长度对第一距离序列进行划分，得到若干第一子距离序列，记为以及对第二距离序列进行划分，得到若干第二子距离序列记为
[0175]
则，第i个第一子距离序列与目标距离之间的相似度可以表征为：
[0176][0177]
对应地，第一距离序列之间的距离特征可以表示为：
[0178]
第i个子第二子距离序列与目标距离之间的相似度可以表征为：
[0179][0180]
对应的，第二距离序列之间的距离特征可以表示为：
[0181]
最后，根据第一距离序列之间的距离特征和第二距离序列之间的距离特征，确定历史推荐信息对应的业务执行率。
[0182]
步骤s204，以最小化所述业务执行率与所述训练样本的标签信息之间的偏差为优化目标，对所述预测模型进行训练。
[0183]
具体实施中，业务平台得到将历史业务数据和候选信息输入到待训练的预测模型中，以通过预测模型，确定在用户执行历史业务数据对应业务时所处环境的基础上，用户点击候选信息的概率，作为候选信息对应的预测点击率，以及，在假设用户点击候选信息后，用户执行候选信息的概率，作为候选信息对应的业务转化率，再根据该预测点击率和该业务转化率进行乘积，确定该候选信息对应的业务执行率。而后，以最小化预测业务执行率与
训练样本的标签信息之间的偏差为优化目标，对所述预测模型进行训练。
[0184]
其中，用户点击了候选信息并执行了候选信息对应的业务时，训练样本针对业务执行率的标签信息为1，反之为0。
[0185]
实际业务中，除了根据业务执行率与训练样本的标签信息之间的偏差对预测模型进行训练外，还可以根据预测点击率与训练样本的标签信息之间的偏差对预测模型进行训练。此时，若用户未点击了候选信息，则训练样本针对预测点击率的标签信息为0，训练样本针对业务执行率的标签信息也为0。若用户点击了候选信息但未执行率候选信息对应的业务，则训练样本针对预测点击率的标签信息为1，训练样本针对业务执行率的标签信息也为0。若用户点击了候选信息并执行率候选信息对应的业务，则训练样本针对预测点击率的标签信息为1，训练样本针对业务执行率的标签信息也为1。
[0186]
通过上述步骤，在向用户推荐待推荐信息时，考虑到了用户所处环境下用户的偏好，以及用户实际执行的业务的推荐信息与用户点击的推荐信息之间的相关性，以提升了预测模型的精度。
[0187]
需要说明的是，上述第一历史推荐信息对应的业务损耗特、相似度满足预设条件的第二历史推荐信息对应的业务损耗特征等均是按照一定的顺序(如发生的先后时间)排序后得到的序列。例如，中，表示假设用户执行第1个第一历史推荐信息对应的业务时的业务损耗特征，表示假设用户执行第2个第一历史推荐信息对应的业务时的业务损耗特征，
……
，表示假设用户执行第j个第一历史推荐信息对应的业务时的业务损耗特征。
[0188]
基于通过上述训练方法训练出的预测模型，本说明书中还提供了该预测模型的使用方法，具体如下。
[0189]
图3为本说明书中一种信息推荐的方法的流程示意图，具体包括以下步骤：
[0190]
步骤s300，获取需要向用户推荐的各候选信息以及所述用户的历史业务数据。
[0191]
具体实施中，业务平台在需要向用户推荐信息时，首先获取需要向用户推荐的若干候选信息以及用户的历史业务数据。其中，向用户推荐的候选信息，以及历史推荐信息可以是广告、商家、商品、用户评论等。
[0192]
实际业务中，用户的历史业务数据中记录了用户已执行过的各项业务的业务记录，该业务记录中包括历史上用户点击查看过的各第一历史推荐信息、每个第一历史推荐信息所属的商家与用户之间的距离、每个第一历史推荐信息所属的商家对应的人均消费金额、每个第一历史推荐信息所属的商家对应的团单金额、历史上用户点击并执行过业务的各第二历史推荐信息、用户在每个第二历史推荐信息所属的商家消费的金额、每个第二历史推荐信息所属的商家对应的人均消费金额、每个第二历史推荐信息所属的商家对应的人均消费金额、每个第二历史推荐信息所属的商家对应的团单金额等。
[0193]
此外，输入预测模型的数据还可以用户的属性信息，该属性信息包括能够体现出用户个人基本特性的信息，如，用户的属性信息可以包括：用户年龄、用户性别、用户所在的城市、用户籍贯等等。
[0194]
另外，本说明书中，业务平台输入到预测模型中的数据，还将包括在向用户推荐信息时用户所处的环境的环境数据。该环境数据可以包括：用户所在位置的天气信息(包括当
时的气温(如，35℃)，以及气象(如，雨、雪、大风等))、用户所在城市的城市编码、用户使用的终端设备的设备型号等。
[0195]
步骤s302，针对每个候选信息，将该候选信息和所述历史业务数据输入到预先训练的预测模型中，以使所述预测模型在所述用户执行所述历史业务数据对应业务时所处环境的基础上，确定假设所述用户点击该候选信息且执行该候选信息对应业务的概率，作为该候选信息对应的业务执行率。
[0196]
其中，该预测模型是通过上文中所描述的预测模型的训练方法训练后得到的。
[0197]
具体实施中，业务平台针对每个候选信息，在将历史业务数据和该信息输入预测模型后，由预测模型确定用户的基础偏好特征、在向用户推荐候选信息之前用户点击过的第一历史推荐信息对应的业务损耗特征以及用户执行过的业务所对应的第二历史推荐信息对应的业务损耗特征，并根据各第一历史推荐信息对应的业务损耗特征以及各第二历史推荐信息对应的业务损耗特征，向用户推荐所述候选信息时用户所处环境的环境数据输入到第一网络中，以基于第一网络，确定在用户执行所述历史业务数据对应业务时所处环境的基础上，所述候选信息对应的业务执行率。
[0198]
具体的，用户根据该历史业务数据，确定在向用户推荐候选信息之前，用户点击过的历史推荐信息，作为第一历史推荐信息，以及用户执行过的业务所对应的历史推荐信息，作为第二历史推荐信息。而后，针对每个第一历史推荐信息，确定假设用户执行第一历史推荐信息对应的业务时的业务损耗特征，以及针对每个第二历史推荐信息，确定用户执行所述第二历史推荐信息对应的业务时的业务损耗特征，再针对每个第一历史推荐信息，确定用户点击该第一历史推荐信息时所处的环境与环境数据对应环境之间的相似度，以及针对每个第二历史推荐信息，确定用户执行该第二历史推荐信息时所处的环境与该环境数据对应环境之间的相似度，以筛选出相似度满足预设条件的第一历史推荐信息对应的业务损耗特征，以及相似度满足预设条件的第二历史推荐信息的业务损耗对应的业务损耗特征，
[0199]
随后，针对每个第二历史推荐信息，确定该第二历史推荐信息与每个第一历史推荐信息之间的相关性，而后，根据该第二历史推荐信息与每个第一历史推荐信息之间的相关性，调整该第二历史推荐信息对应的业务损耗特征，再根据每个第一历史推荐信息对应的业务损耗特征、每个第二历史推荐信息对应的调整后业务损耗特征，以及环境数据，确定在用户执行所述历史业务数据对应业务时环境的基础上，候选信息对应的业务执行率
[0200]
与此同时，业务平台针对每个第一历史推荐信息，确定假设用户执行所述第一历史推荐信息对应的业务时，与第一历史推荐信息所属商家之间的距离，作为第一历史推荐信息对应的距离，以及针对每个第二历史推荐信息，确定用户执行第二历史推荐信息对应的业务时，与第二历史推荐信息所属商家之间的距离，作为第二历史推荐信息对应的距离，并确定向用户推荐该候选信息时，用户与候选信息所属商家之间的距离，作为目标距离。
[0201]
而后，通过预设的滑动窗口，从各第一历史推荐信息对应的距离所组成的第一距离序列中，确定各第一子距离序列，以及从各第二历史推荐信息对应的距离所组成的第二距离序列中，确定各第二子距离序列，再针对每个第一子距离序列，根据目标距离与该第一子距离序列中包含的每个第一历史推荐信息对应距离之间的相似度，确定目标距离与该第一子距离序列之间的距离特征，以及，针对每个第二子距离序列，根据目标距离与该第二子距离序列中包含的每个第二历史推荐信息对应距离之间的相似度，确定所述目标距离与该
第二子距离序列之间的距离特征，以根据目标距离与该第一子距离序列之间的距离特征，和目标距离与该第二子距离序列之间的距离特征，确定候选信息对应的业务执行率。详细过程可以参见预测模型训练过程，此处不在一一赘述。
[0202]
步骤s304，根据各候选信息对应的业务执行率，向所述用户进行信息推荐。
[0203]
具体实施中，业务平台确定出各信息对应的业务执行率后，可以根据各信息对应的业务执行率的大小，按照从大到小的顺序对各信息进行排序，而后，根据排序结果从各信息中选取出需要向用户推荐的目标信息，再根据向用户展示信息的页面中各显示位置的排布情况，将该目标信息推荐给用户。
[0204]
此外，业务平台还可以根据各信息对应的预测访购率的大小，按照从大到小的顺序对各信息进行排序，而后，根据排序结果，将业务执行率大于设定访购率阈值的信息，作为需要向用户推荐的目标信息，再根据向用户展示信息的页面中各显示位置的排布情况，将该目标信息推荐给用户。当然还有其他的选取目标信息的方法，在此就不一一举例说明了。
[0205]
需要说明的是，本说明书中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下，并获得由相应装置所有者给予授权的情况下进行的。
[0206]
以上为本说明书的一个或多个实施例提供的预测模型的训练方法以及信息推荐的方法，基于同样的思路，本说明书还提供了相应的预测模型的训练装置以及信息推荐的装置，如图4和图5所示。
[0207]
图4为本说明书提供的一种预测模型的训练装置示意图，具体包括：
[0208]
获取模块400，用于获取训练样本，所述训练样本中包含有用户的历史业务数据和向所述用户推荐的候选信息；
[0209]
业务执行率预测模块401，用于将所述历史业务数据和所述候选信息输入到待训练的预测模型中，以通过所述预测模型，在所述用户执行所述历史业务数据对应业务时所处环境的基础上，确定假设所述用户点击所述候选信息且执行所述候选信息对应业务的概率，作为所述候选信息对应的业务执行率；
[0210]
训练模块402，用于以最小化所述业务执行率与所述训练样本的标签信息之间的偏差为优化目标，对所述预测模型进行训练。
[0211]
可选地，所述预测模型包括第一网络；
[0212]
所述业务执行率预测模块401，具体用于根据所述历史业务数据，确定在向所述用户推荐所述候选信息之前，所述用户点击过的历史推荐信息，作为第一历史推荐信息，以及所述用户执行过的业务所对应的历史推荐信息，作为第二历史推荐信息；针对每个第一历史推荐信息，确定假设所述用户执行所述第一历史推荐信息对应的业务时的业务损耗特征，以及针对每个第二历史推荐信息，确定所述用户执行所述第二历史推荐信息对应的业务时的业务损耗特征；将各第一历史推荐信息对应的业务损耗特征，各第二历史推荐信息对应的业务损耗特征，以及向所述用户推荐所述候选信息时所述用户所处环境的环境数据输入到所述第一网络中，以基于所述第一网络，确定在所述用户执行所述历史业务数据对应业务时所处环境的基础上，所述候选信息对应的业务执行率。
[0213]
可选地，所述业务执行率预测模块401，具体用于针对每个第一历史推荐信息，确
定所述用户点击该第一历史推荐信息时所处的环境与所述环境数据对应环境之间的相似度，以及针对每个第二历史推荐信息，确定所述用户执行该第二历史推荐信息时所处的环境与所述环境数据对应环境之间的相似度；根据相似度满足预设条件的第一历史推荐信息对应的业务损耗特征，以及相似度满足预设条件的第二历史推荐信息的业务损耗对应的业务损耗特征，确定在所述用户执行所述历史业务数据对应业务时所处环境的基础上，所述候选信息对应的业务执行率。
[0214]
可选地，所述业务执行率预测模块401，具体用于针对每个第二历史推荐信息，确定该第二历史推荐信息与每个第一历史推荐信息之间的相关性；根据该第二历史推荐信息与每个第一历史推荐信息之间的相关性，调整该第二历史推荐信息对应的业务损耗特征；根据每个第一历史推荐信息对应的业务损耗特征、每个第二历史推荐信息对应的调整后业务损耗特征，以及所述环境数据，确定在所述用户执行所述历史业务数据对应业务时所处环境的基础上，所述候选信息对应的业务执行率。
[0215]
可选地，所述业务损耗特征包括用于表征用户在历史推荐信息所属商家消费的金额和/或向用户推荐历史推荐信息时，历史推荐信息所属商家与用户之间的距离。
[0216]
可选地，所述预测网络还包括：第二网络；
[0217]
所述业务执行率预测模块401，具体用于根据所述历史业务数据，确定在向所述用户推荐所述候选信息之前，所述用户点击过的历史推荐信息，作为第一历史推荐信息，以及所述用户执行过的业务所对应的历史推荐信息，作为第二历史推荐信息；针对每个第一历史推荐信息，确定假设所述用户执行所述第一历史推荐信息对应的业务时，与所述第一历史推荐信息所属商家之间的距离，作为第一历史推荐信息对应的距离，以及针对每个第二历史推荐信息，确定假设所述用户执行所述第二历史推荐信息对应的业务时，与所述第二历史推荐信息所属商家之间的距离，作为第二历史推荐信息对应的距离；根据每个第一历史推荐信息对应的距离，以及每个第二历史推荐信息对应的距离，确定所述用户点击所述候选信息且执行所述候选信息对应业务的概率，作为所述候选信息对应的业务执行率。
[0218]
可选地，所述业务执行率预测模块401，具体用于确定向所述用户推荐所述候选信息时，所述用户与所述候选信息所属商家之间的距离，作为目标距离；根据所述目标距离与每个第一历史推荐信息对应的距离之间的相似度，以及所述目标距离与每个第二历史推荐信息对应的距离之间的相似度，确定所述用户点击所述候选信息且执行所述候选信息对应业务的概率，作为所述候选信息对应的业务执行率。
[0219]
可选地，所述业务执行率预测模块401，具体用于根据所述目标距离与每个第一历史推荐信息对应的距离之间的相似度，确定每个第一历史推荐信息对应的注意力权重，以及根据所述目标距离与每个第二历史推荐信息对应的距离之间的相似度，确定每个第二历史推荐信息对应的注意力权重；根据每个第一历史推荐信息对应的注意力权重，对各第一历史推荐信息对应的距离进行加权，得到每个第一历史推荐信息对应的加权后距离，以及根据每个第二历史推荐信息对应的注意力权重，对各第二历史推荐信息对应的距离进行加权，得到每个第二历史推荐信息对应的加权后距离；根据每个第一历史推荐信息对应的加权后距离，以及每个第二历史推荐信息对应的加权后距离，确定所述用户点击所述候选信息且执行所述候选信息对应业务的概率，作为所述候选信息对应的业务执行率。
[0220]
可选地，所述业务执行率预测模块401，具体用于通过预设的滑动窗口，从各第一
历史推荐信息对应的距离所组成的第一距离序列中，确定各第一子距离序列，以及从各第二历史推荐信息对应的距离所组成的第二距离序列中，确定各第二子距离序列；针对每个第一子距离序列，根据所述目标距离与该第一子距离序列中包含的每个第一历史推荐信息对应距离之间的相似度，确定所述目标距离与该第一子距离序列之间的距离特征，以及，针对每个第二子距离序列，根据所述目标距离与该第二子距离序列中包含的每个第二历史推荐信息对应距离之间的相似度，确定所述目标距离与该第二子距离序列之间的距离特征；根据每个第一子距离序列对应的距离特征，以及每个第二子距离序列对应的距离特征，确定所述用户点击所述候选信息且执行所述候选信息对应业务的概率，作为所述候选信息对应的业务执行率。
[0221]
可选地，所述业务执行率预测模块401，具体用于将所述历史业务数据和所述候选信息输入到待训练的预测模型中，以通过所述预测模型，确定在所述用户执行所述历史业务数据对应业务时所处环境的基础上，所述用户点击所述候选信息的概率，作为所述候选信息对应的预测点击率，以及，在假设所述用户点击所述候选信息后，所述用户执行所述候选信息的概率，作为所述候选信息对应的业务转化率；根据所述预测点击率和所述业务转化率，确定所述候选信息对应的业务执行率。
[0222]
可选地，所述装置还包括：
[0223]
点击率预测模块403，用于以最小化所述业务执行率与所述训练样本的标签信息之间的偏差为优化目标，对所述预测模型进行训练之前，通过所述预测模型，在所述用户执行所述历史业务数据对应业务时所处环境的基础上，预测所述用户点击所述候选信息的概率，作为所述历史推荐信息对应的预测点击率；
[0224]
所述训练模块402，具体用于以最小化所述预测点击率与点击率标签之间的偏差，以及最小化所述业务执行率与所述业务执行率标签之间的偏差为优化目标，对所述预测模型进行训练。
[0225]
图5为本说明书提供的一种信息推荐的装置示意图，具体包括：
[0226]
获取模块500，用于获取需要向用户推荐的各候选信息以及所述用户的历史业务数据；
[0227]
业务执行率预测模块501，用于对每个候选信息，将该候选信息和所述历史业务数据输入到预先训练的预测模型中，以使所述预测模型在所述用户执行所述历史业务数据对应业务时所处环境的基础上，确定假设所述用户点击该候选信息且执行该候选信息对应业务的概率，作为该候选信息对应的业务执行率，所述预测模型是通过上文中所述的预测模型的训练方法训练得到的；
[0228]
推荐模块502，用于根据各候选信息对应的业务执行率，向所述用户进行信息推荐。
[0229]
本说明书还提供了一种计算机可读存储介质，该存储介质存储有计算机程序，计算机程序可用于执行上述图2提供的预测模型的训练方法或上述图3提供的信息推荐的方法。
[0230]
本说明书还提供了图6所示的电子设备的示意结构图。如图6所述，在硬件层面，该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器，当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运
行，以实现上述图2所述的预测模型的训练方法或上述图3所述的信息推荐的方法。当然，除了软件实现方式之外，本说明书并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。
[0231]
在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(programmable logic device,pld)(例如现场可编程门阵列(field programmable gate array，fpga))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片pld上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(hardware description language，hdl)，而hdl也并非仅有一种，而是有许多种，如abel(advanced boolean expression language)、ahdl(altera hardware description language)、confluence、cupl(cornell university programming language)、hdcal、jhdl(java hardware description language)、lava、lola、myhdl、palasm、rhdl(ruby hardware description language)等，目前最普遍使用的是vhdl(very-high-speed integrated circuit hardware description language)与verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。
[0232]
控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(application specific integrated circuit，asic)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：arc 625d、atmel at91sam、microchip pic18f26k20以及silicone labs c8051f320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
[0233]
上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
[0234]
为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
[0235]
本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0236]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0237]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0238]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0239]
在一个典型的配置中，计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
[0240]
内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(ram)和/或非易失性内存等形式，如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
[0241]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。
[0242]
还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0243]
本领域技术人员应明白，本说明书的实施例可提供为方法、系统或计算机程序产品。因此，本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0244]
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
[0245]
本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。
[0246]
以上所述仅为本说明书的实施例而已，并不用于限制本说明书。对于本领域技术人员来说，本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书的权利要求范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张颖异
技术所有人：北京三快在线科技有限公司
我是此专利的发明人

上一篇：终端设备、基站设备和通信方法与流程
上一篇：一种能够输送定位的轨道平面打磨设备的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。