信息推荐的模型训练方法及装置与流程

文档序号：29961218发布日期：2022-05-11 09:10阅读：85来源：国知局

1.本公开涉及数据处理领域中的信息流领域，尤其涉及一种信息推荐的模型训练方法及装置。

背景技术：

2.随着智能手机的普及以及移动互联网的快速发展，目前智能手机中的信息流已经成为广大网民获取信息的一个重要途径了。
3.目前，现有技术中的信息流推荐系统，通常是预测用户在推荐内容的落地页中的停留时长，并将预测的停留时长进行排序，之后将排序靠前的多个推荐内容提供给用户。然而，用户在推荐内容的落地页中的停留时长长，并不代表用户真正的喜欢该推荐内容。
4.因此，现有技术中以对推荐内容的预测停留时长，作为内容推荐的依据，会导致向用户推荐的内容缺乏准确性。

技术实现要素：

5.本公开提供了一种信息推荐的模型训练方法及装置。
6.根据本公开的第一方面，提供了一种信息推荐的模型训练方法，包括：
7.获取所述用户浏览过的至少一个推荐内容；
8.根据所述用户对各所述推荐内容的浏览信息，确定各所述推荐内容各自对应的真实兴趣度，所述浏览信息包括如下中的至少一种：所述用户对所述推荐内容的交互行为、所述用户对第一类型的内容的平均浏览时长、所述用户对所述第一类型的内容的点击通过率，所述第一类型为所述推荐内容的类型；
9.根据预设模型对所述用户的用户特征以及各所述推荐内容的内容特征进行处理，得到各所述推荐内容各自对应的预测兴趣度；
10.根据所述真实兴趣度和所述预测兴趣度，对所述预设模型的模型参数进行更新。
11.根据本公开的第二方面，提供了一种信息推荐方法，包括：
12.获取目标用户的用户特征，以及获取多个待推荐内容各自的内容特征；
13.根据预设模型对所述用户特征和所述内容特征进行处理，得到各所述待推荐内容各自的预测兴趣度；
14.根据所述预测兴趣度，确定向用户推荐的目标推荐内容；
15.向所述目标用户对应的目标设备发送所述目标推荐内容。
16.根据本公开的第三方面，提供了一种信息推荐的模型训练装置，包括：
17.获取模块，用于获取所述用户浏览过的至少一个推荐内容；
18.确定模块，用于根据所述用户对各所述推荐内容的浏览信息，确定各所述推荐内容各自对应的真实兴趣度，所述浏览信息包括如下中的至少一种：所述用户对所述推荐内容的交互行为、所述用户对第一类型的内容的平均浏览时长、所述用户对所述第一类型的内容的点击通过率，所述第一类型为所述推荐内容的类型；
19.处理模块，用于根据预设模型对所述用户的用户特征以及各所述推荐内容的内容特征进行处理，得到各所述推荐内容各自对应的预测兴趣度；
20.更新模块，用于根据所述真实兴趣度和所述预测兴趣度，对所述预设模型的模型参数进行更新。
21.根据本公开的第四方面，提供了一种信息推荐装置，包括：
22.获取模块，用于获取目标用户的用户特征，以及获取多个待推荐内容各自的内容特征；
23.处理模块，用于根据预设模型对所述用户特征和所述内容特征进行处理，得到各所述待推荐内容各自的预测兴趣度；
24.确定模块，用于根据所述预测兴趣度，确定向用户推荐的目标推荐内容；
25.发送模块，用于向所述目标用户对应的目标设备发送所述目标推荐内容。
26.根据本公开的第五方面，提供了一种电子设备，包括：
27.至少一个处理器；以及
28.与所述至少一个处理器通信连接的存储器；其中，
29.所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行第一方面所述的方法。
30.根据本公开的第六方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行第一方面所述的方法。
31.根据本公开的第七方面，提供了一种计算机程序产品，所述计算机程序产品包括：计算机程序，所述计算机程序存储在可读存储介质中，电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序，所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面所述的方法。
32.根据本公开的技术解决了向用户推荐的内容缺乏准确性的问题。
33.应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
34.附图用于更好地理解本方案，不构成对本公开的限定。其中：
35.图1为本公开实施例提供的信息流的实现示意图；
36.图2为本公开实施例提供的信息推荐的模型训练方法的流程图；
37.图3为本公开实施例提供的信息推荐的模型训练方法的流程图二；
38.图4为本公开实施例提供的映射关系的实现示意图；
39.图5为本公开实施例提供的优化预设模型的实现示意图；
40.图6为本公开实施例提供的信息推荐方法的流程图；
41.图7为本公开实施例提供的信息推荐方法的执行流程示意图；
42.图8为本公开实施例的信息推荐的模型训练装置的结构示意图；
43.图9为本公开实施例的信息推荐装置的结构示意图；
44.图10是用来实现本公开实施例的信息推荐的模型训练方法以及信息推荐方法的电子设备的框图。
具体实施方式
45.以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。
46.为了更好的理解本公开的技术方案，下面对本公开所涉及的相关技术进行进一步的详细介绍。
47.随着智能手机的普及和移动互联网的快速发展，目前在智能手机中的资讯信息流已经成为广大网民获取信息的一个重要途径了。其中，信息流通常是在客户端中以流式呈现的信息，比如说当前的一些新闻应用的客户端中的新闻信息、短视频应用的客户端中的短视频信息等等。
48.可以结合图1对信息流进行理解，图1为本公开实施例提供的信息流的实现示意图。
49.通常信息流是在终端设备的客户端中呈现的，参照图1，在客户端中比如说可以依次显示内容1、内容2、内容3、内容4，以及用户还可以在客户端的界面中继续下滑，或者刷新当前界面，以在信息流中获取更多的信息。
50.其中，呈现的内容比如说可以包括图文内容、视频内容、广告内容等等，本实施例中对呈现在客户端中的具体内容不做限制，只要其是在信息流中呈现给用户的内容即可。
51.以及还需要说明的是，因为在信息流中需要向用户呈现大量的内容，那么针对每一个内容通常展示的具体信息都是比较少的，比如说在信息流中展示的可以是各个内容的缩略信息、缩略图等等，用户通过浏览信息流中各个内容的缩略信息，以在其中挑选自己感兴趣的内容进行详细了解。比如说在用户点击感兴趣的内容之后，再将该内容的详细信息展示给用户。
52.参照图1，比如说在10的示例中，当前在客户端中依次显示了内容1、内容2、内容3和内容4，以及假设当前检测到了针对内容2的点击操作，则例如可以参照20，在图形用户界面中呈现内容2的落地页，在内容2的落地页中就包括内容2的详细信息，比如说可以是新闻的完整内容、小说的完整内容、视频的完整内容等等。
53.以及可以理解的是,提供信息流的客户端通常运行在用户持有的终端设备上，其中终端设备例如可以是计算机设备、平板电脑或移动电话(或称为“蜂窝”电话)等，终端设备还可以是便携式、袖珍式、手持式、计算机内置的移动装置或设备，此处不做特别限制。
54.那么基于上述介绍可以确定的是，在信息流中为用户提供的具体内容就显得尤为重要，若提供的内容是用户感兴趣的，则可以有效的提升用户体验。
55.目前，现有技术中的信息流推荐系统，通常是采用多目标融合的方式，比如说可以将用户是否浏览指定内容，以及在指定内容的落地页中的停留时长进行融合，融合的目标通常是用户在落地页的停留时长。也就是说，现有技术中通常是预测用户在推荐内容的落地页中的停留时长，之后将停留时长进行排序，将排序靠前的多个推荐内容提供给用户。
56.但是，因为信息流是多场景、多资源、多目标的融合系统，因此仅仅通过预测的用户浏览时长来进行待推荐内容的选择会存在一定的问题。
57.首先，不同的资源结构天然存在时长差异，比如说用户观看视频的速度通常是比
较快的，然而浏览文字的速度就比较慢。因此浏览时长并不能直观的反应用户喜好。
58.以及，因为不同用户的浏览偏好、点击偏好不同，仅仅通过在落地页的预测浏览时长来决定推荐内容是不客观的。具体的讲，用户在推荐内容的落地页中的停留时长长，并不代表用户真正的喜欢该推荐内容。
59.比如说当前向用户推荐了一篇新闻，用户点开了这篇新闻，并且用户完整的浏览了这篇新闻，那么可以确定用户在这篇新闻中的落地页中的停留时长是比较长的，但是用户可能看完了，并不是很喜欢这篇新闻。然而现有技术仅仅根据停留时长较长作为目标，之后可能还会向用户推荐此类内容，这样就可能导致向用户推荐用户不感兴趣的内容。
60.因此，现有技术中仅仅以对推荐内容的预测停留时长，作为内容推荐的依据，会导致相用户推荐的内容缺乏准确性。
61.针对现有技术中的问题，本公开提出了如下技术构思：根据用户在内容的落地页中的交互行为，以及用户平时的浏览偏好、点击偏好，综合确定用户对推荐内容的真实兴趣度，并以此训练预设模型，之后根据预设模型预测用户对推荐内容的兴趣度，从而可以真正的从用户是否感兴趣的角度向用户推荐内容，进而可以有效的提升向用户推荐内容的准确性。
62.在上述介绍内容的基础上，下面首先结合具体的实施例对本公开提供的信息推荐的模型训练方法进行介绍。需要说明的是，本公开中的各个实施例的执行主体比如说可以是本地服务器、云端服务器等等具备数据获取和数据处理功能的设备，本实施例对具体的执行主体不做限制，只要其可以实现获取需要的数据，并进行相应的处理，以实现模型训练和内容推荐的目的即可。
63.首先结合图2进行介绍，图2为本公开实施例提供的信息推荐的模型训练方法的流程图。
64.如图2所示，该方法包括：
65.s201、获取用户浏览过的至少一个推荐内容。
66.基于上述介绍可以确定的是，用户通常会对推荐内容进行浏览，以及系统会对各个用户的浏览行为进行记录，将记录的信息存储为日志，则本实施例中比如说可以从日志数据中，获取用户浏览过的至少一个推荐内容。
67.需要说明的是，当前介绍的用户浏览过的推荐内容，是指用户点开推荐内容，在推荐内容的落地页中进行浏览。
68.以及，通常系统会对每个用户的行为都进行记录，那么本实施例中比如说可以针对多个用户，分别获取各个用户各自浏览过的至少一个推荐内容。
69.s202、根据用户对各推荐内容的浏览信息，确定各推荐内容各自对应的真实兴趣度，浏览信息包括如下中的至少一种：用户对推荐内容的交互行为、用户对第一类型的内容的平均浏览时长、用户对第一类型的内容的点击通过率，第一类型为推荐内容的类型。
70.以及，本实施例中还可以获取用户对各个推荐内容的浏览信息，在一种可能的实现方式中，本实施例中的浏览信息可以包括如下中的至少一种：用户对推荐内容的交互行为、用户对第一类型的内容的平均浏览时长、用户对第一类型的内容的点击通过率，其中，第一类型为推荐内容的类型。
71.需要说明，信息流中的内容可以存在多种预设类型，比如说可以存在图文类型、视
频类型、文字类型、图片类型等等，本实施例对内容的具体类型划分不做限制，其可以根据实际需求进行选择和设置。
72.其中，用户对推荐内容的交互行为，比如说可以包括如下中的至少一种：用户对推荐内容的点赞、收藏、评论、分享、等等，在实际实现过程中，凡是用户在推荐内容的界面所进行的交互操作，均可以作为本实施例中的交互行为。
73.以及，用户对第一类型的内容的平均浏览时长，实际上就是用户针对推荐内容所属的第一类型的内容的平均浏览时长。比如说当前存在一个推荐内容a，该推荐内容a的类型是图文类型，那么该推荐内容的浏览信息中就可以包括，用户对图文类型的内容的平均浏览时长。
74.以及，点击通过率(click-through-rate，ctr)是互联网中的常用术语，其是指内容的点击次数和内容的推荐次数的比值。比如说推荐信息中的用户对第一类型的内容的点击通过率，实际上就是用户针对推荐信息所属的类型的内容的点迹通过率。比如说当前存在一个推荐内容a，该推荐内容a的类型是图文类型，那么该推荐内容的浏览信息中就可以包括，用户对图文类型的内容的点击通过率。
75.更为具体的，比如说在历史时段，针对该用户推荐过100条图文类型的内容，并且用户点击了其中的20条，那么就可以确定该用户对图文类型的内容的点击通过率就是20％。
76.同时，此处还需要说明，上述的用户对第一类型的内容的平均浏览时长，以及用户对第一类型的内容的点击通过率，都是以用户在历史时段的浏览行为为基础进行统计得到的。其中的历史时段比如说可以是当前时刻之前的预设时长，比如说可以采用一周内的浏览行为来确定平均浏览时长、点击通过率。或者，其中的历史时段还可以是从用户开始使用客户端至今的全部时段，本实施例对统计平均浏览时长和点击通过率的具体时段不做限制，其可以根据实际需求进行选择和设置。
77.以及本实施例中的浏览信息还可以包括用户对推荐内容的浏览时长，在实际实现过程中，浏览信息的具体实现可以根据实际需求进行选择和设置，凡是与用户对推荐内容的浏览相关的信息，均可以作为本实施例中的浏览信息。
78.基于上述介绍可以确定的是，本实施例中的浏览信息可以反映出用户针对推荐内容的具体操作，以及用户平时的浏览偏好，那么本实施例中就可以根据用户对各个推荐内容的浏览信息，确定各个推荐内容各自对应的真实兴趣度，此处的真实兴趣度可以指示用户对推荐内容感兴趣的程度。
79.以及，本实施例中比如说可以获取多个用户浏览过的推荐内容，那么可以针对每个用户各自对应的各个推荐内容均确定真实兴趣度，从而确定各个推荐内容各自对应的真实兴趣度。
80.s203、根据预设模型对用户的用户特征以及各推荐内容的内容特征进行处理，得到各推荐内容各自对应的预测兴趣度。
81.在本实施例中，设置有预设模型，其中预设模型用于对用户特征和内容特征进行处理，从而输出用户对推荐内容的预测兴趣度，也就是说预设模型可以预测用户对某个推荐内容的兴趣度为多少。
82.因此本实施例中，可以根据预设模型对用户的用户特征以及各个推荐内容的内容
特征进行处理，从而得到各个推荐内容各自对应的预测兴趣度。
83.需要说明的是，当前的用户以及推荐内容，就和上述确定真实兴趣度的用户和推荐内容是一样的，也就是说针对同样的用户和推荐内容，既确定了真实兴趣度，又确定了预测兴趣度。
84.在一种可能的实现方式中，本实施例中的用户特征可以包括如下中的至少一种：用户关联的至少一个内容类型、用户对各内容类型的平均浏览时长、用户对各内容类型的点击次数、用户所关联的内容标签。
85.以及，内容特征可以包括如下中的至少一种：待推荐内容所属的内容类型、待推荐内容关联的内容标签。
86.其中，内容标签比如说可以是体育、文化、电竞、娱乐、美妆，等等的具体的内容的详细划分。
87.可以理解的是，用户特征就像是用户的画像，可以包括用户之前的浏览行为，用户的偏好等等，因此凡是与用户的浏览行为和偏好相关的，均可以作为本实施例中的用户特征。比如说用户特征还可以包括用户偏好的视频时长、用户偏好的图文字数、用户偏好的图文排版等等，其可以根据实际需求进行相应的扩展。
88.类似的，内容特征就是内容的具体特征，比如说内容特征还可以包括内容的时长、次数、排版方式、背景音乐，等等，因此可以反映内容的特征的信息均可以作为本实施例中的内容特征。本实施例对用户特征和内容特征的具体实现均不做限制，其可以根据实际需求进行选择和设置。
89.s204、根据真实兴趣度和预测兴趣度，对预设模型的模型参数进行更新。
90.可以理解的是，真实兴趣度可以反映用户对推荐内容的真实的感兴趣程度，而预测兴趣度则是预设模型所预测的用户对推荐内容的感兴趣程序，那么为了实现对
91.在确定针对各个推荐内容的真实兴趣度以及各个推荐内容的预测兴趣度之后，为了对预设模型进行训练，就可以根据真实兴趣度和预测兴趣度，对预设模型的模型参数进行更新，此处的实现就相当于对预设模型的反馈过程，以使得预设模型输出的预测兴趣度尽可能的贴近真实兴趣度，以有效的实现对模型的训练，以保证预设模型可以输出尽可能准确的预测兴趣度。
92.本公开实施例提供的信息推荐的模型训练方法，包括：获取用户浏览过的至少一个推荐内容。根据用户对各推荐内容的浏览信息，确定各推荐内容各自对应的真实兴趣度，浏览信息包括如下中的至少一种：用户对推荐内容的交互行为、用户对第一类型的内容的平均浏览时长、用户对第一类型的内容的点击通过率，第一类型为推荐内容的类型。根据预设模型对用户的用户特征以及各推荐内容的内容特征进行处理，得到各推荐内容各自对应的预测兴趣度。根据真实兴趣度和预测兴趣度，对预设模型的模型参数进行更新。通过用户对推荐内容的浏览信息，确定用户对推荐内容的真实兴趣度，并且以此作为训练目标，根据预设模型输出的预测兴趣度和真实兴趣度，对预设模型的模型参数进行更新，从而可以有效实现对预设模型的训练，以保证预设模型所预测的兴趣度尽可能的贴近用户真实的兴趣度，之后根据兴趣度向用户推荐用户感兴趣的内容，从而可以有效的提升向用户推荐内容的准确性。
93.在上述实施例的基础上，下面结合图3至图5对本公开提供的信息推荐的模型训练
方法进行进一步的详细介绍，图3为本公开实施例提供的信息推荐的模型训练方法的流程图二，图4为本公开实施例提供的映射关系的实现示意图，图5为本公开实施例提供的优化预设模型的实现示意图。
94.如图3所示，该方法包括：
95.s301、获取用户浏览过的至少一个推荐内容。
96.其中，s301的实现方式与上述s201的实现方式类似，此处不再赘述。
97.s302、针对任一个推荐内容，根据用户对推荐内容的交互行为，确定目标处理系数。
98.在本实施例中，需要对各个推荐内容确定各自对应的真实兴趣度，其中针对各个推荐内容确定真实兴趣度的实现方式均是类似的，下面以任一个推荐内容为例进行介绍，其余的推荐内容的实现方式类似，将不再进行赘述。
99.基于上述介绍可以确定的是，本实施例中推荐内容的浏览信息可以包括用户对推荐内容的交互行为，则在一种可能的实现方式中，可以根据用户对推荐内容的交互行为，确定目标处理系数，此处的目标处理系数是后续和浏览时长做处理的。
100.其中，用户对推荐内容的交互行为可以包括如下中的至少一种：点赞、收藏、评论、转发。在一种可能的实现方式中，本实施例中例如可以设置有交互行为和处理系数的映射关系，在所述映射关系中，可以针对每一种交互行为都设置各自对应的处理系数。
101.比如说可以参照图4进行理解，如图4所示，在映射关系中，例如可以设置点赞的处理系数为1.5，收藏的处理系数为2，评论的处理系数为3，转发的处理系数为4。
102.可以理解的是，不同的交互行为，对于用户来说操作成本是不同的，比如说点赞行为对于用户来说操作成本是比较低的，用户只需要点击预设位置的点赞控件即可。相应的，评论行为对于用户来说操作成本是比较高的，其操作就相对复杂了一些，因为用户需要点开评论区，编辑想要评论的内容，并且点击发送控件，才能够完成一次评论操作。
103.以及交互行为均可反映出用户对当前内容的感兴趣的信息，然而其反映出来的用户的感兴趣的程度是不同的。比如说用户点赞了当前内容，和用户分享了当前内容，其中用户分享内容的操作是能够更强烈的反映出用户对当前内容的感兴趣的信息的。
104.因此本实施例中针对不同的交互行为，设置有各自对应的处理系数，在上述介绍的交互行为和处理系数的关系的基础上，映射关系中的交互行为所具体对应的处理系数可以根据实际需求进行选择和设置，本实施例对此不做限制。
105.以及需要说明的是，交互行为是存在多种多样的，但是用户针对一个推荐内容所进行的交互行为，可能是一种，也可能是多种。因为每种交互行为都存在各自对应的处理权重，因此需要根据一种或多种交互行为各自的处理系数，确定目标处理系数。
106.则例如可以在交互行为和处理系数的映射关系中，确定用户对当前的推荐内容的交互行为所对应的第一处理系数，其中交互行为可能为一种，也可能为多种。
107.在一种可能的实现方式中，若交互行为的类型为一种，则可以将这一种交互行为所对应的第一处理系数确定为目标处理系数。
108.比如说当前仅存在单一的点赞行为，则基于上述图4的示例，点赞行为对应的第一处理系数为1.5，则例如可以确定目标处理系数为1.5。再比如说当前仅存在单一的收藏行为，则基于上述图4的示例，收藏行为对应的第一处理系数为3，则例如可以确定目标处理系
数为3。
109.在另一种可能的实现方式中，若交互行为的类型为多种，则可以将各种交互对应的第一处理系数做预设处理，从而得到目标处理系数。
110.其中的预设处理比如说可以包括相加、相乘、加权处理、按照一定的比例相加，等等，本实施例对预设处理的具体实现方式不做限制，只要其可以实现将各个交互行为的第一处理系数融合成一个统一的目标处理系数即可。
111.比如说当前用户针对推荐内容a的交互行为同时包括了点赞和收藏，则基于上述上述图4的示例，点赞行为对应的第一处理系数为1.5，以及收藏行为对应的第一处理系数为2，同时假设预设处理为相乘处理，则当前的情况可以确定目标处理系数为2
×
1.5，也就是说目标处理系数为3。
112.s303、将目标处理系数和用户对推荐内容的浏览时长相乘，得到推荐内容对应的用户行为参数。
113.在本实施例中，用户对推荐内容的浏览信息还可以包括用户对推荐内容的浏览时长，则在确定目标处理系数之后，例如可以将目标处理系数和用户对推荐内容的浏览时长相乘，从而得到推荐内容所对应的用户行为参数。
114.可以理解，当前所确定的用户行为参数，实际上反映的是用户的实际点击收益，其是根据用户在推荐内容的落地页中的浏览时长以及互动行为确定的。
115.s304、将用户对第一类型的推荐内容的平均浏览时长除以预设值，得到推荐内容的对应的用户偏好参数。
116.以及，本实施例中的浏览参数还包括用户对第一类型的推荐内容的评论浏览时长，本实施例中可以根据此确定用户的偏好参数。
117.在一种可能的实现方式中，例如可以将用户对第一类型的推荐内容的平均浏览时长除以预设值n，从而得到推荐内容所对应的用户偏好参数。其中，n为大于或等于1的整数。
118.可以理解，当前所确定的用户偏好参数，实际上反映的是用户的点击成本。该成本和用户的历史收益相关，历史收益月底，当前期望收益就越低
119.s305、将用户行为参数和用户偏好参数做差值，得到第一差值。
120.在确定用户的行为参数和用户的偏好参数之后，例如可以将用户行为参数和偏好参数做差值，从而得到第一差值。
121.s306、将第一差值和用户对第一类型的内容的点击通过率的比值，确定为推荐内容对应的真实兴趣度。
122.本实施例中的浏览信息还包括用户对第一类型的内容的点击通过率的比值，其中点击通过率反映了用户点击行为的谨慎程度，其还可以记做点击风险偏好，其中点击通过率越高，则表示用户对于引导点击资源的容忍度也就越高。
123.在确定真实兴趣度的时候，例如可以将第一差值和用户对第一类型的内容的点击通过率的比值，确定为推荐内容对应的真实兴趣度。
124.上述介绍的确定真实兴趣度的过程例如可以表示为如下公式：
125.真实兴趣度＝(用户行为参数-用户偏好参数)/点击通过率
126.可以理解，用户行为参数和兴趣度是成正比的，因为用户行为参数越高，就表示用户在当前推荐内容的落地页中的浏览时长越长，和/或，用户对当前的推荐内容的交互行为
越多、越重要，那么相应的就表示用户对该推荐内容的兴趣越高。
127.以及，用户偏好参数和兴趣度是成反比的，因为用户偏好参数越高，就表示用户对当前推荐内容所属的第一类别的内容的平均浏览时长越长，那么相应的就是说，用户平时对这一类别的内容的浏览时长是比较长的，那么用户点开这个推荐内容进行浏览的付出成本是较低的，因此不能很好的反应出来用户对该推荐内容是否感兴趣；相反的，若用户偏好参数越低，就表示用户对当前推荐内容所属的第一类别的内容的平均浏览时长越短，那么相应的就是说，用户平时对这一类别的内容的浏览时长是比较短的，那么用户点开这个推荐内容进行浏览的付出成本是较高的，那么就能够反映出用户对当前的推荐内容是感兴趣的。
128.以及，点击通过率和兴趣度也是成反比的，基于上述介绍可以确定的是，点击通过率可以理解为用户点开的第一类别的内容数量和向用户推荐过的第一类别的内容数量的比值。那么点击通过率高，就表示这个用户平时就喜欢点开第一类别的内容，那么用户当前点开可能也只是随便点一点；以及，点击通过率低，就表示这个用户平时不容易点开第一类别的内容，那么用户当前点开，就表示其有可能是感兴趣才点开的，因此就可以反映出用户对当前的推荐内容是比较感兴趣的。
129.基于上述的分析可以确定的是，上述基于用户行为参数、用户偏好参数、以及用户对第一类型的内容的点击通过率，来确定用户对推荐内容的真实兴趣度，是可以准确有效的实现用户对推荐内容的兴趣程度的刻画的。之后依次作为目标对预设模型进行训练，从而可以准确有效的实现对预设模型的训练。
130.s307、根据预设模型对用户的用户特征以及各推荐内容的内容特征进行处理，得到各推荐内容各自对应的预测兴趣度。
131.其中，s307的实现方式与上述s203的实现方式类似，此处对具体的实现不再赘述。
132.以及可以结合图5进行进一步的理解，参照图5，可以将用户的用户特征和推荐内容的内容特征输入至预设模型中，以使得预设模型输出推荐内容的预测兴趣度。
133.s308、根据真实兴趣度和预测兴趣度，确定损失函数值。
134.在确定真实兴趣度和预测兴趣度之后，可以根据真实兴趣度和预测兴趣度确定损失函数值。在一种可能的实现方式中，比如说可以采用预设损失函数对真实兴趣度和预测兴趣度进行处理，从而确定损失函数值，其中预设损失函数的具体实现可以根据实际需求进行选择和设置，只要损失函数值可以反映真实兴趣度和预测兴趣度之间的差距即可。
135.s309、根据损失函数值，对预设模型的模型参数进行更新。
136.在确定损失函数值之后，参照图5，就可以根据损失函数值对预设模型的模型参数进行更新，以实现根据损失函数值对预设模型进行优化，以拉近预设模型所输出的预测兴趣度和真实兴趣度之间的距离，进而有效保证预设模型所输出的预测兴趣度的正确性。
137.以及与上述实施例介绍的类似，本实施例中的模型训练过程可以针对多个推荐内容进行多次迭代处理，从而得到训练完成的预设模型的模型参数。同时可以理解的是，本实施例中的模型优化目标是为了使得预设模型输出的用户对推荐内容的预测兴趣度，和用户对推荐内容的真实兴趣度尽可能的接近，更为具体的，可以确定预设模型的模型参数的优化目标是损失函数值最小。那么例如可以在确定损失函数值为最小值的时候，确定预设模型训练结束，得到训练后的预设模型。或者，还可以在多个推荐内容的数据均处理完成之
后，确定预设模型训练结束，得到训练后的预设模型。
138.本公开实施例提供的信息推荐的模型训练方法，通过根据浏览信息首先确定推荐内容对应的用户行为参数以及推荐内容对应的用户偏好参数，之后根据上述介绍的处理过程，根据用户行为参数、用户偏好参数以及用户对第一类型的内容的点击通过率，确定用户对推荐内容的真实兴趣度，因为上述的用户行为参数、用户偏好参数以及点击通过率和真实兴趣度保持了合适的正反比关系，并且用户行为参数和用户偏好参数可以准确的反应用户的浏览偏好和操作偏好，从而可以保证确定的真实兴趣度可以准确的反应用户对推荐内容的兴趣。在确定真实兴趣度之后，根据真实兴趣度和预设模型输出的预测兴趣度之间的损失函数值，对预设模型的模型参数进行更新，从而可以有效的实现对预设模型的优化，以拉近真实兴趣度和预测兴趣度之间的距离，进而保证训练完成的预设模型所输出的预测兴趣度和真实兴趣度是比较接近的。
139.上述实施例介绍的是针对预设模型的训练过程，在预设模型训练完成之后，就可以根据预设模型来预测用户对推荐内容的兴趣度，并以此为依据向用户推荐合适的内容了。
140.因此本公开中还提供了一种信息推荐方法，下面结合具体的实施例对本公开中提供的信息推荐方法进行介绍。首先结合图6进行说明，图6为本公开实施例提供的信息推荐方法的流程图。
141.如图6所示，该方法包括：
142.s601、获取目标用户的用户特征，以及获取多个待推荐内容各自的内容特征。
143.在本实施例中，目标用户为当前待推荐内容的用户，为了针对性的向目标用户推荐合适的内容，则需要获取目标用户的用户特征。在一种可能的实现方式中，用户特征包括如下中的至少一种：目标用户关联的至少一个内容类型、目标用户对各内容类型的平均浏览时长、目标用户对各内容类型的点击次数、目标用户所关联的内容标签。以及与上述实施例介绍的类似，本实施例中的用户特征还可以根据实际需求进行选择和扩展，此处对用户特征的具体实现不做限制。
144.以及，在向用户进行内容推荐的时候，通常是首先确定多个待推荐内容，之后在多个待推荐内容中进行筛选，因此需要获取多个待推荐内容各自的内容特征。在一种可能的实现方式中，内容特征包括如下中的至少一种：待推荐内容所属的内容类型、待推荐内容关联的内容标签。以及与上述实施例介绍的类似，本实施例中的内容特征还可以根据实际需求进行选择和扩展，此处对内容特征的具体实现不做限制。
145.s602、根据预设模型对用户特征和内容特征进行处理，得到各待推荐内容各自的预测兴趣度。
146.基于上述介绍可以确定的是，本公开中的预设模型可以预测用户对于推荐内容的兴趣度，因此本实施例中可以根据预设模型对上述获取的用户特征以及内容特征进行处理，从而得到各个待推荐内容各自的预测兴趣度。
147.可以理解的是，本实施例中的预设模型是经过了上述介绍的训练过程训练得到的，基于上述的训练过程，则可以有效的保证预设模型所输出的预测兴趣度的准确性，换句话说，也就是说可以有效保证预设模型所预测的用户对内容的兴趣度，是尽可能的贴近用户对内容的真实兴趣度的。
148.s603、根据预测兴趣度，确定向用户推荐的目标推荐内容。
149.在确定各个待推荐内容的预测兴趣度之后，就可以根据预测兴趣度，确定实际向用户推荐的目标推荐内容了。
150.可以理解的是，预测兴趣度越大，则表示用户对待推荐内容的感兴趣程度越高。则在一种可能的实现方式中，比如说可以对各个待推荐内容的预测兴趣度进行排序，之后将排序靠前的k个待推荐内容确定为目标推荐内容。
151.其中，k可以为大于等于1的整数，比如说k可以是一次向用户推荐的内容的数量，其可以根据实际需求进行选择和设置，本实施例对k的具体设置不做限定。
152.以及，在预测兴趣度排序之后，排序靠前的k个待推荐内容，实际上是就是在多个待推荐内容中，预测的用户最感兴趣的k个内容，同时因为当前的预测兴趣度是可以保证准确性的，因此将排序靠前的k个待推荐内容确定为目标推荐内容，则可以尽可能的保证目标推荐内容是用户感兴趣的。
153.s604、向目标用户对应的目标设备发送目标推荐内容。
154.在确定目标推荐内容之后，就可以将目标推荐内容推送给用户了，例如可以向目标用户对应的目标设备发送目标推荐内容。
155.本公开实施例提供的信息推荐方法，包括：获取目标用户的用户特征，以及获取多个待推荐内容各自的内容特征。根据预设模型对用户特征和内容特征进行处理，得到各待推荐内容各自的预测兴趣度。根据预测兴趣度，确定向用户推荐的目标推荐内容。向目标用户对应的目标设备发送目标推荐内容。通过预设模型对目标用户的用户特征以及多个待推荐内容的内容特征进行处理，以得到目标用户对各个待推荐内容的预测兴趣度，之后根据各个待推荐内容各自对应的预测兴趣度进行排序，并将排序靠前的多个待推荐内容确定为目标推荐内容，并且推送给用户。因为预设模型所输出的待推荐内容对应的预测兴趣度是可以有效保证的，因此推送给用户的目标推荐内容也可以尽可能的保证是用户感兴趣的，从而可以有效提升推荐给用户的内容的准确性。
156.下面再结合图7对本公开中的信息推荐方法的实现流程进行进一步的详细介绍。图7为本公开实施例提供的信息推荐方法的执行流程示意图。
157.如图7所示，假设当前确定了5个待推荐内容，分别是推荐内容1、推荐内容2、推荐内容3、推荐内容4、推荐内容5，以及当前需要向目标用户a进行内容的推荐。
158.则可以获取用户a的用户特征，以及推荐内容1的内容特征、推荐内容2的内容特征、推荐内容3的内容特征、推荐内容4的内容特征、推荐内容5的内容特征，之后将用户a的用户特征以及各个待推荐内容的内容特征输入至预设模型中，以使得预设模型输出各个推荐内容的预测兴趣度。
159.之后，可以对各个推荐内容的预测兴趣度进行排序，假设排序结果如图7所示，预测兴趣度从高到底依次值：推荐内容3的预测兴趣度、推荐内容1的预测兴趣度、推荐内容5的预测兴趣度、推荐内容2的预测兴趣度、推荐内容4的预测兴趣度。
160.之后将排序靠前的k个确定为目标推荐内容，假设当前k为3，则如图7所示，可以将推荐内容3、推荐内容1以及推荐内容5确定为目标推荐内容。同时在目标用户的目标设备中显示目标推荐内容的时候，比如说可以按照预测兴趣度从高到低的顺序，依次展示各个目标推荐内容。
161.因此，本公开请实施例提供的信息推荐方法，可以综合考虑用户的历史偏好以及针对不同类型的资源的点击偏好，进行预设模型的训练，以兴趣度作为模型训练的目标，从而可以综合刻画用户针对推荐内容的满意程度，之后尽可能的将用户感兴趣的内容推荐给用户，从而可以有效提升用户的信息浏览体验。
162.图8为本公开实施例的信息推荐的模型训练装置的结构示意图。如图8所示，本实施例的信息推荐的模型训练装置800可以包括：获取模块801、确定模块802、处理模块803、更新模块804。
163.获取模块801，用于获取所述用户浏览过的至少一个推荐内容；
164.确定模块802，用于根据所述用户对各所述推荐内容的浏览信息，确定各所述推荐内容各自对应的真实兴趣度，所述浏览信息包括如下中的至少一种：所述用户对所述推荐内容的交互行为、所述用户对第一类型的内容的平均浏览时长、所述用户对所述第一类型的内容的点击通过率，所述第一类型为所述推荐内容的类型；
165.处理模块803，用于根据预设模型对所述用户的用户特征以及各所述推荐内容的内容特征进行处理，得到各所述推荐内容各自对应的预测兴趣度；
166.更新模块804，用于根据所述真实兴趣度和所述预测兴趣度，对所述预设模型的模型参数进行更新。
167.一种可能的实现方式中，所述浏览信息还包括：所述用户对所述推荐内容的浏览时长；
168.所述确定模块802具体用于：
169.针对任一个所述推荐内容，根据所述用户对所述推荐内容的浏览时长以及所述用户对所述推荐内容的交互行为，确定所述推荐内容对应的用户行为参数；
170.将所述用户对所述第一类型的推荐内容的平均浏览时长除以预设值，得到所述推荐内容的对应的用户偏好参数；
171.根据所述用户行为参数、所述用户偏好参数以及所述用户对所述第一类型的内容的点击通过率，确定所述推荐内容对应的真实兴趣度。
172.一种可能的实现方式中，所述确定模块802具体用于：
173.根据所述用户对所述推荐内容的交互行为，确定目标处理系数；
174.将所述目标处理系数和所述用户对所述推荐内容的浏览时长相乘，得到所述推荐内容对应的用户行为参数。
175.一种可能的实现方式中，所述确定模块802具体用于：
176.在交互行为和处理系数的映射关系中，确定所述交互行为对应的第一处理系数；
177.若所述交互行为的类型为一种，则将所述交互行为对应的第一处理系数确定为所述目标处理系数；或者，
178.若所述交互行为的类型为多种，则将各所述交互行为对应的第一处理系数做预设处理，得到所述目标处理系数。
179.一种可能的实现方式中，所述确定模块802具体用于：
180.将所述用户行为参数和所述用户偏好参数做差值，得到第一差值；
181.将所述第一差值和所述用户对所述第一类型的内容的点击通过率的比值，确定为所述推荐内容对应的真实兴趣度。
182.一种可能的实现方式中，所述更新模块804具体用于：
183.根据所述真实兴趣度和所述预测兴趣度，确定损失函数值；
184.根据所述损失函数值，对所述预设模型的模型参数进行更新。
185.图9为本公开实施例的信息推荐装置的结构示意图。如图9所示，本实施例的信息推荐装置900可以包括：获取模块901、处理模块902、确定模块903、发送模块904。
186.获取模块901，用于获取目标用户的用户特征，以及获取多个待推荐内容各自的内容特征；
187.处理模块902，用于根据预设模型对所述用户特征和所述内容特征进行处理，得到各所述待推荐内容各自的预测兴趣度；
188.确定模块903，用于根据所述预测兴趣度，确定向用户推荐的目标推荐内容；
189.发送模块904，用于向所述目标用户对应的目标设备发送所述目标推荐内容。
190.一种可能的实现方式中，所述确定模块903具体用于：
191.对各所述待推荐内容的预测兴趣度进行排序，将排序靠前的k个待推荐内容确定为所述目标推荐内容，其中，所述k为大于等于的整数。
192.一种可能的实现方式中，所述用户特征包括如下中的至少一种：所述目标用户关联的至少一个内容类型、所述目标用户对各内容类型的平均浏览时长、所述目标用户对各内容类型的点击次数、所述目标用户所关联的内容标签；
193.所述内容特征包括如下中的至少一种：所述待推荐内容所属的内容类型、所述待推荐内容关联的内容标签。
194.本公开提供一种信息推荐的模型训练方法及装置，应用于数据处理领域中的信息流领域，以达到提升向用户推荐的内容的准确性的目的。
195.需要说明的是，本实施例中的人头模型并不是针对某一特定用户的人头模型，并不能反映出某一特定用户的个人信息。需要说明的是，本实施例中的二维人脸图像来自于公开数据集。
196.本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。
197.根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
198.根据本公开的实施例，本公开还提供了一种计算机程序产品，计算机程序产品包括：计算机程序，计算机程序存储在可读存储介质中，电子设备的至少一个处理器可以从可读存储介质读取计算机程序，至少一个处理器执行计算机程序使得电子设备执行上述任一实施例提供的方案。
199.图10示出了可以用来实施本公开的实施例的示例电子设备1000的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。
200.如图10所示，设备100包括计算单元1001，其可以根据存储在只读存储器(rom)
1002中的计算机程序或者从存储单元1008加载到随机访问存储器(ram)1003中的计算机程序，来执行各种适当的动作和处理。在ram 1003中，还可存储设备1000操作所需的各种程序和数据。计算单元1001、rom 1002以及ram 1003通过总线1004彼此相连。输入/输出(i/o)接口1005也连接至总线1004。
201.设备1000中的多个部件连接至i/o接口1005，包括：输入单元1006，例如键盘、鼠标等；输出单元1007，例如各种类型的显示器、扬声器等；存储单元1008，例如磁盘、光盘等；以及通信单元1009，例如网卡、调制解调器、无线通信收发机等。通信单元1009允许设备1000通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
202.计算单元1001可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1001的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元1001执行上文所描述的各个方法和处理，例如信息推荐的模型训练方法以及信息推荐方法。例如，在一些实施例中，信息推荐的模型训练方法以及信息推荐方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元1008。在一些实施例中，计算机程序的部分或者全部可以经由rom 1002和/或通信单元1009而被载入和/或安装到设备1000上。当计算机程序加载到ram1003并由计算单元1001执行时，可以执行上文描述的信息推荐的模型训练方法以及信息推荐方法的一个或多个步骤。备选地，在其他实施例中，计算单元1001可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行信息推荐的模型训练方法以及信息推荐方法。
203.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
204.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
205.在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或
上述内容的任何合适组合。
206.为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，crt(阴极射线管)或者lcd(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
207.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(lan)、广域网(wan)和互联网。
208.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与vps服务("virtual private server"，或简称"vps")中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器，或者是结合了区块链的服务器。
209.应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。
210.上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张博
技术所有人：北京百度网讯科技有限公司
我是此专利的发明人

上一篇：一种恒温杯和超声波细胞粉碎机的制作方法
上一篇：一种风力发电机组联轴器打滑预警方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。