信息推荐模型训练方法及装置、存储介质、计算机设备与流程

文档序号:29864161发布日期:2022-04-30 12:13阅读:59来源:国知局
信息推荐模型训练方法及装置、存储介质、计算机设备与流程

1.本发明涉及信息技术领域,特别是涉及一种信息推荐模型训练方法及装置、存储介质、计算机设备。


背景技术:

2.而现有的推荐用户阅读的文章的方法,是根据用户在计算机设备的阅读行为数据,将曝光中未点击的数据作为负样本,点击过的数据则作为正样本来训练模型,而通过此种方式会带来如下两个问题:一个是会导致严重的马太效应,即为热门的文章受到更多的关注,冷门的文章则会被忽略;另一个是被曝光的数据仅仅是通过模型及业务配置等方式筛选过后的一个子集,因此,依赖通过上述方式选择后的数据与反馈进行的模型训练,将产生选择性偏差。由于上述流行度的偏差与选择性偏差的不断累积,会导致推荐系统中的马太效应越来越严重,会导致对用户个性化的挖掘会产生较大的偏差,进而导致针对用户推荐的文章的准确率不高、以及造成线上运行长期来看效果不好的问题。


技术实现要素:

3.有鉴于此,本发明提供一种信息推荐模型训练方法及装置、存储介质、计算机设备,主要目的在于实现获得符合用户个性话需求的样本候选集合,以增加训练出的信息推荐模型的用户粘性。
4.依据本发明一个方面,提供了一种信息推荐模型训练方法,包括:
5.根据热门文章信息、以及用户的用户行为数据,筛选待推送的文章,获得初筛文章集合;
6.根据所述初筛文章集合中的各文章之间关系,构建文章的图数据网络;其中,所述图数据网络包括相互连接的文章节点;
7.通过在所述图数据网络上随机游走,获取样本候选集合;
8.将所述初筛文章集合和所述样本候选集合汇集成训练样本集合,并对待训练的信息推荐模型进行训练,获得信息推荐模型。
9.进一步的,所述根据热门文章信息、以及用户的用户行为数据,筛选待推送的文章,获得初筛文章集合,包括:
10.根据所述用户行为数据,确定所述用户感兴趣的偏好特征、以及用户历史点击文章的列表;
11.根据所述用户感兴趣的偏好特征,对所述待推送的文章进行召回,获得第一召回文章集合;
12.根据所述用户历史点击文章的列表,构建此列表中的文章的第一文章对,并计算各个所述第一文章对的相似度分值;
13.将所述第一文章对的相似度分值大于预设阈值的待推送的文章进行召回,获得第二召回文章集合;
14.根据所述热门文章信息,对所述待推送的文章进行召回,获得第三召回文章集合;
15.将所述第一召回文章集合、第二召回文章集合和第三召回文章集合汇集成所述初筛文章集合。
16.进一步的,所述根据所述用户历史点击文章的列表,构建此列表中的文章的第一文章对,并计算各个所述第一文章对的相似度分值,包括:
17.统计各个所述第一文章对在所述用户历史点击文章的列表中的共现次数、以及各个所述第一文章对中的文章出现次数,计算各个所述第一文章对的初始相似度分值;
18.通过所述第一文章对应的展示位置信息权重、点击时间权重、以及创建时间权重对所述初始相似度分值依次进行加权计算,获得加权相似度分值,并将所述加权相似度分值作为所述第一文章对的相似度分值。
19.进一步的,所述根据所述初筛文章集合中的各文章之间关系,构建文章的图数据网络,包括:
20.根据所述用户对所述初筛文章集合中的各文章的历史点击记录,构建所述初筛文章集合中的文章的第二文章对;
21.将所述第二文章对作为图数据网络的邻居边、以及将所述第二文章对中的文章作为所述邻居边的两端节点,构建所述图数据网络。
22.进一步的,所述将所述第二文章对作为图数据网络的邻居边、以及将所述第二文章对中的文章作为所述邻居边的两端节点,构建所述图数据网络,包括:
23.根据所述第二文章对的共现次数、所述第二文章对中的文章的出现次数、以及所述第二文章对中的文章所对应的流行度,计算所述第二文章对中的文章相似度分值;
24.将所述第二文章对中的文章相似度分值作为边权重对与此所述第二文章对应的图数据网络的邻居边进行加权计算,获得加权后的所述图数据网络的邻居边。
25.进一步的,所述通过在所述图数据网络上随机游走,生成文章节点序列,并将所述文章节点序列上的文章汇集成样本候选集合,包括:
26.将两个所述节点之间的邻居边对应的边权重作为跳转概率;
27.根据所述跳转概率在所述图数据网络上的节点连接结构,获取游走路径;
28.根据所述游走路径,生成文章节点序列,并确定样本候选集合,其中,所述样本候选集合包括所述游走路径所对应的至少一对第二文章对。
29.进一步的,所述根据所述游走路径,生成文章节点序列,并确定样本候选集合之后,包括:
30.根据所述用户对所述初筛文章集合中的各文章的历史点击记录,确定与所述样本候选集合中的各文章分别对应的待预测文章;
31.将获得的所有所述待预测文章加入所述样本候选集合中,获得更新后的样本候选集合。
32.依据本发明另一个方面,提供了一种信息推荐模型训练装置,包括:
33.召回模块,用于根据热门文章信息、以及用户的用户行为数据,筛选待推送的文章,获得初筛文章集合;
34.图数据网络构建模块,用于根据所述初筛文章集合中的各文章之间关系,构建文章的图数据网络;其中,所述图数据网络包括相互连接的文章节点;
35.候选样本获取模块,用于通过在所述图数据网络上随机游走,获取样本候选集合;
36.模型训练模块,用于将所述初筛文章集合和所述样本候选集合汇集成训练样本集合,并对待训练的信息推荐模型进行训练,获得信息推荐模型。
37.依据本发明再一个方面,提供了一种存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述任一项所述的信息推荐模型训练方法对应的操作。
38.依据本发明另又一个方面,提供了一种计算机设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
39.所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如上述所述的信息推荐模型训练方法对应的操作。
40.借由上述技术方案,本发明实施例提供的技术方案至少具有下列优点:
41.本发明提供了一种信息推荐模型训练方法及装置、存储介质、计算机设备,与现有技术相比,本发明通过根据热门文章信息、以及用户的用户行为数据,筛选待推送的文章,获得初筛文章集合;再根据初筛文章集合中的各文章之间关系,构建文章的图数据网络,并通过在图数据网络上随机游走,获取样本候选集合;最后将初筛文章集合和样本候选集合汇集成训练样本集合,并对待训练的信息推荐模型进行训练,获得可向计算机设备下发推荐文章的信息推荐模型。本发明通过将根据用户行为数据筛选出的初筛文章集合,并将初筛文章集合中的各文章构建文章的图数据网络,再通过在图数据网络上的随机游走获得符合用户个性话需求的样本候选集合,进而使通过初筛文章集合和样本候选集合汇集成的训练样本集合训练出的信息推荐模型增加了用户粘性。
42.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
43.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
44.图1示出了本发明实施例提供的一种信息推荐模型训练方法流程图;
45.图2示出了本发明实施例提供的另一种信息推荐模型训练方法流程图;
46.图3示出了本发明实施例提供的获得初筛文章集合的流程图;
47.图4示出了本发明实施例提供的图数据网络的局部示意图;
48.图5示出了本发明实施例提供的获取样本候选集合的流程图;
49.图6示出了本发明实施例提供的一种信息推荐模型训练装置的组成框图;
50.图7示出了本发明实施例提供的再一种信息推荐模型训练装置的组成框图;
51.图8示出了本发明实施例提供的一种计算机设备的实体结构示意图。
具体实施方式
52.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
53.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、装置、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
54.本技术提供的信息推荐模型训练方法,可应用在计算机设备和服务端通过网络进行通信的应用环境中,其中,服务端接收计算机设备的用户行为数据,然后根据热门文章信息、以及用户的用户行为数据,筛选待推送的文章,获得初筛文章集合,再根据所述初筛文章集合中的各文章之间关系,构建文章的图数据网络,再通过在所述图数据网络上随机游走,获取样本候选集合,最后将所述初筛文章集合和所述样本候选集合汇集成训练样本集合,并对待训练的信息推荐模型进行训练,获得向计算机设备推荐信息的信息推荐模型。其中,计算机设备可以但不限于是各种个人计算机、笔记本电脑、智能手机或平板电脑。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现,且本公开实施例所提供的信息推荐模型的训练方法的执行主体一般为具有一定计算能力的计算机设备,比如计算机设备对应的服务器。下面以执行主体为服务器为例对本公开实施例提供的信息推荐模型的训练方法加以说明。
55.图1为本说明书实施例提供的信息推荐模型的训练方法的流程示意图,具体包括以下步骤:
56.101、根据热门文章信息、以及用户的用户行为数据,筛选待推送的文章,获得初筛文章集合。
57.用户行为数据包括用户在计算机设备上对用户历史点击文章的列表中的文章产生的多种历史行为数据,这些历史行为数据可以作为分析用户在对用户历史点击文章的列表时的行为特征数据,基于此,服务器可以获取目标用户对包含有用户历史点击文章的列表中的各个文章进行浏览或点击时的历史行为数据。
58.需要说明的是,根据热门文章信息、以及用户的用户行为数据,可确定召回策略,再根据召回策略对待推送文章进行召回,并对召回的文章按照预设规则筛选,获得初筛文章集合;这里,由于热门文章信息、以及用户的用户行为数据在每日定时更新,因此,根据热门文章信息筛选待推送的文章是通过定时统计的方式实现召回筛选。在筛选待推送的文章进行筛选时,可将通过将召回的文章取top k篇文章,作为初筛文章集合中的文章。
59.102、根据所述初筛文章集合中的各文章之间关系,构建文章的图数据网络;其中,所述图数据网络包括相互连接的文章节点。
60.这里,根据用户历史点击文章的列表,确定初筛文章集合中的各文章之间关系,再
构建文章到文章的图数据网络,这样构建的图数据网络能够在下述步骤中挖掘更多根据用户个性化设计的无偏数据,从而达到缓解选择性偏差的目的。
61.103、通过在所述图数据网络上随机游走,获取样本候选集合。
62.需要说明的是,这里通过广度优先遍历和深度优先遍历两种方式在图数据网络上进行随机游走,以此来获得图数据网络的同构性和同质性,进而达到获得无偏的样本候选集合。
63.104、将所述初筛文章集合和所述样本候选集合汇集成训练样本集合,并对待训练的信息推荐模型进行训练,获得信息推荐模型。
64.这里待训练的信息推荐模型为deepfm模型,通过将初筛文章集合和样本候选集合汇集成训练样本集合并对待训练的信息推荐模型进行训练,可获得最终的最为精准的信息推荐模型,此信息推荐模型可将推荐的文章下发至各个计算机设备,完成对用户提供信息推荐的服务。
65.本发明提供了一种信息推荐模型训练方法,与现有技术相比,本发明实施例通过根据热门文章信息、以及用户的用户行为数据,筛选待推送的文章,获得初筛文章集合;再根据初筛文章集合中的各文章之间关系,构建文章的图数据网络,并通过在图数据网络上随机游走,获取样本候选集合;最后将初筛文章集合和样本候选集合汇集成训练样本集合,并对待训练的信息推荐模型进行训练,获得可向计算机设备下发推荐文章的信息推荐模型。本发明通过将根据用户行为数据筛选出的初筛文章集合,并将初筛文章集合中的各文章构建文章的图数据网络,再通过在图数据网络上的随机游走获得符合用户个性话需求的样本候选集合,进而使通过初筛文章集合和样本候选集合汇集成的训练样本集合训练出的信息推荐模型增加了用户粘性。
66.本发明实施例提供了另一种信息推荐模型训练方法,如图2所示,该方法包括:
67.201、根据热门文章信息、以及用户的用户行为数据,筛选待推送的文章,获得初筛文章集合。
68.需要说明的是,若用户为老用户,则直接获取老用户的用户行为数据;若用户为新用户,则需要通过新用户选填文章别类,例如,新用户选填的文章别类为“都市”、“菜谱”、“励志”,则根据上述文章别类筛选待推送的文章,获得包括“都市”、“菜谱”、“励志”的文章的初筛文章集合。
69.为了使初筛文章集合的文章更符合用户个性话需求,所述根据热门文章信息、以及用户的用户行为数据,筛选待推送的文章,获得初筛文章集合,参见图3,可以包括:
70.2011、根据所述用户行为数据,确定所述用户感兴趣的偏好特征、以及用户历史点击文章的列表。
71.其中,对于老用户可依据用户行为数据,获取老用户的自身阅读习惯,即为通过用户历史点击过文章的类别进行代权重抽样获取n篇文章,再通过对此n篇文章分析,确定用户感兴趣的偏好特征;对于新用户,则是通过具有选填的类别的用户行为数据,确定新用户感兴趣的偏好特征。
72.2012、根据所述用户感兴趣的偏好特征,对所述待推送的文章进行召回,获得第一召回文章集合。
73.由于对用户行为数据是每日定时统计,因此,根据用户行为数据确定的用户感兴
趣的偏好特征也是每日定时更新。这里,为了避免第一召回文章集合中的文章数量过多,因此,将第一召回文章集合的文章数量筛选至与预设阈值的数量相同。
74.2013、根据所述用户历史点击文章的列表,构建此列表中的文章的第一文章对,并计算各个所述第一文章对的相似度分值。
75.这里对第一文章对的相似度分值进行计算,可实现对待推荐的文章根据i2i协同过滤召回方式召回,以使通过此方式召回的文章更符合用户的个性化需求。
76.为了缓解通过i2i协同过滤召回方式召回的文章的展示位置偏差及时间偏差,所述根据所述用户历史点击文章的列表,构建此列表中的文章的第一文章对,并计算各所述文章对的相似度分值,可以包括:统计各个所述第一文章对在所述用户历史点击文章的列表中的共现次数、以及各个所述第一文章对中的文章出现次数,计算各个所述第一文章对的初始相似度分值;通过所述第一文章对应的展示位置信息权重、点击时间权重、以及创建时间权重对所述初始相似度分值依次进行加权计算,获得加权相似度分值,并将所述加权相似度分值作为所述第一文章对的相似度分值。
77.在计算各个所述第一文章对的初始相似度分值时,根据文章对在用户历史点击文章的列表中的共现次数、以及第一文章对中的文章出现次数,计算此第一文章对的文章相似度分值,例如,计算i和j的文章的相似度的公式为:wij=(共现次数/文章出现次数)。
78.在考虑第一文章对中的文章的展示位置信息、文章点击时间、以及文章创建时间这三个方面对初始相似度分值影响时,通过第一文章对应的展示位置信息权重、点击时间权重、以及创建时间权重对初始相似度分值进行加权计算,获得三种权重计算之后的文章的相似度分值;其中,计算文章的i和j的相似度的公式为:wij=(共现次数/文章出现次数)*loc_weight*click_time_weight*createtime_weight;其中,展示位置权重系数计算方式为loc_weight=0.93*(abs(loci-locj)-1),loc代表文章在展示列表中的位置;点击时间权重计算方式为:click_time_weight=e*(abs(click_timei-click_timej)),click_timei代表用户点击文章的时间;创建时间权重计算方式为:createtime_weight=e**(abs(createtimei-createtimej)),createtimei是文章i创建的时间。
79.这里,在计算各个所述第一文章对的初始相似度分值时,考虑多种因素的权重计算,主要的三种因素的权重分别是展示位置信息权重、点击时间权重、文章创建时间权重,并通过这三种权重对初始相似度分值进行加权计算,能够缓解文章展示位偏差及时间偏差。
80.2014、将所述第一文章对的相似度分值大于预设阈值的待推送的文章进行召回,获得第二召回文章集合。
81.例如,k1为预设阈值,这里将第一文章对的相似度分值大于在前k1的文章进行召回,并将获取到的前k1篇最相似的文章作为第二召回文章集合中的文章。
82.2015、根据所述热门文章信息,对所述待推送的文章进行召回,获得第三召回文章集合。
83.需要说明的是,对热门文章信息是每日定时统计,因此,根据热门文章信息召回的待推送的文章也是每日定时更新。这里,为了避免第三召回文章集合中的文章数量过多,因此,将第三召回文章集合的文章数量筛选至与预设阈值的数量相同。
84.2016、将所述第一召回文章集合、第二召回文章集合和第三召回文章集合汇集成
所述初筛文章集合。
85.基于热门文章信息、用户感兴趣的偏好特征、以及用户历史点击文章,获得的召回文章更符合用户个性话需求。
86.202、根据所述用户对所述初筛文章集合中的各文章的历史点击记录,构建所述初筛文章集合中的文章的第二文章对。
87.例如:根据用户对初筛文章集合中的各文章的历史点击记录,确定用户按时间顺序排列依次看过[1,2,3,4]篇文章,则获得的第二文章对为:[[1,2],[2,3][3,4]]。
[0088]
203、将所述第二文章对作为图数据网络的邻居边、以及将所述第二文章对中的文章作为所述邻居边的两端节点,构建所述图数据网络。
[0089]
为了通过图数据网络挖掘更多无偏数据来扩充样本集合,从而达到缓解选择性偏差的目的,所述将所述第二文章对作为图数据网络的邻居边、以及将所述第二文章对中的文章作为所述邻居边的两端节点,构建所述图数据网络,可以包括:根据所述第二文章对的共现次数、所述第二文章对中的文章的出现次数、以及所述第二文章对中的文章所对应的流行度,计算所述第二文章对中的文章相似度分值;将所述第二文章对中的文章相似度分值作为边权重对与此所述第二文章对应的图数据网络的邻居边进行加权计算,获得加权后的所述图数据网络的邻居边。
[0090]
在构建图数据网络的过程中,在计算第二文章对中的文章相似度分值时引入流行度惩罚,使图数据网络的边权重的时候引入流行度惩罚,可使在随机游走的过程中更有可能触达到低流行度的文章,进而达到缓解马太效应,准确挖掘用户兴趣同时优化推荐后续生态。
[0091]
其中,第二文章对中的文章相似度分值的计算公式为:wij=cij/ci,wij为文章相似度分值,cij:ij两篇文章对共现频率数,ci:第i篇文章的点击出现次数;由于,本实施例文章所对应的流行度对第二文章对中的文章相似度分值进行了修正,因此,本实施例的第二文章对中的文章相似度分值的计算公式为:wij=wij/log(1+pipj),pi代表第i篇文章的流行度。
[0092]
需要说明的是,本实施方式通过word2vector学习到的各第二文章对中的两篇文章的文本内容相似度向量,根据相似度向量计算相似度最近邻的k篇文章,并对这k偏最近邻的文章构建k条边,其中,k条边的边权重分别是就是两篇文章对应的第二文章对中的文章相似度分值。
[0093]
此外,在图数据网络构建过程中,为满足bfs和dfs随机游走的需求,还包括构建文章和文章之间的概率转移矩阵,再通过概率转移矩阵对边权重进行修改,以调整游走的策略从而满足dfs或者bfs随机游走的需求。下面通过举例进行说明,参见图4,x1为节点v和节点t的共同邻居,设置边v-》x1的权重为1;t为前序节点,设置边v-》t的权重为返回参数p:若p》1,则下一步倾向于访问共同邻居;若p《1,则下一步倾向于回到前序节点。x2和x3是节点v的其他一阶邻居节点,设置边的权重为进出参数q:q》1,则下一步倾向于访问共同邻居;q《1,则下一步倾向于访问其他一阶邻居节点。进而实现通过p和q这两个参数,就可以调整游走的策略,从而实现dfs或者bfs。
[0094]
其中,dfs随机游走时,设p=1,q=0.5,使得其更有可能访问其邻居,此时:p(访问其他一阶邻居节点)》p(返回前序节点)=p(访问共同邻居);bfs随机游走时,设p=1,q=
2.0,使得其更有可能访问其前续节点和共同邻居。此时:p(访问其他一阶邻居节点)《p(返回前序节点)=p(访问共同邻居)。
[0095]
204、通过在所述图数据网络上随机游走,获取样本候选集合。
[0096]
为了构建无偏的样本候选集合,所述通过在所述图数据网络上随机游走,生成文章节点序列,并将所述文章节点序列上的文章汇集成样本候选集合,参见图5,可以包括:
[0097]
2041、将两个所述节点之间的邻居边对应的边权重作为跳转概率。
[0098]
2042、根据所述跳转概率在所述图数据网络上的节点连接结构,获取游走路径。
[0099]
需要说明的是,可以将节点之间的邻居边对应的边权重理解为下一步跳转的概率值,比如:一篇文章在图中有另外5篇文章与之相连接,所以这里有5条边,6个节点,比如说5条边的权重分别是0.23,0.56,0.67,0.12,0.45,那么随机游走下一跳的文章会依据这个权重作为一个跳转的概率进行跳转,比如说边权重是0.67的就比0.12的可能性要大。
[0100]
2043、根据所述游走路径生成文章节点序列,并确定样本候选集合,其中,所述样本候选集合包括所述游走路径所对应的至少一对第二文章对。
[0101]
这里,在进行bfs和dfs随机游走的时候,分别依据步骤2041和2042对应的概率转移矩阵进行随机游走,生成n篇候选集合。
[0102]
为了消除样本候选集合中的文章的选择性偏差的问题,所述根据所述游走路径生成文章节点序列,并确定样本候选集合之后,包括:根据所述用户对所述初筛文章集合中的各文章的历史点击记录,确定与所述样本候选集合中的各文章分别对应的待预测文章;将获得的所有所述待预测文章加入所述样本候选集合中,获得更新后的样本候选集合。
[0103]
需要说明的是:根据所述用户对初筛文章集合中的各文章的历史点击记录,确定与所述样本候选集合中的各文章分别对应的待预测文章,可以理解为:用户点击了5篇文章,按照顺序分别是a-》b-》c-》d-》e,在点击完d这个时间点预测下一篇用户可能喜欢阅读的文章,就可以依据d这个时间点,通过随机游获取其可能阅读的文章作为样本集,比如说e,h,g,k.其中e为正样本,h,g,k则为其负样本;本实施方式能够取代一般的直接用点击和曝光数据构建正负样本的方式构建样本正负样本集合的方法。
[0104]
205、将所述初筛文章集合和所述样本候选集合汇集成训练样本集合,并对待训练的信息推荐模型进行训练,获得信息推荐模型。
[0105]
此外,在获取训练样本集合时,还将训练样本集合与客户的生命周期相结合,以挖掘客户不同时期的阅读兴趣。
[0106]
例如,将客户的生命周期分为初期赠险转付费、中期家庭化保障转化期、向上销售期、晚期、流失预警期以及脱保挽回期,通过将客户生命周期的引入,从而能够更加准确的挖掘客户额不同阶段的阅读兴趣与需求。
[0107]
这里,依据用户信息、用户的行为数据、以及文章内容信息构建样本的训练特征数据,除了使用用户的基本信息,比如年龄,性别等,文章的基本信息,如字数,类别等,以及用户的行为数据,例如阅读数等,还结合用户在健康险的营销生命周期阶段来挖掘用户不同阶段阅读的差异化需求。总体上来说,分成5个阶段,分别是赠险转付费,家庭保障转化期,向上销售期,流失预警期及拓宽挽回期,5个阶段,这5个阶段会有5有5个模型给用户打分,将分数最高的模型作为样本特征入模,以反应用户的营销生命周期阶段情况。
[0108]
本发明实施例提供了另一种信息推荐模型训练方法,与现有技术相比,本发明实
施例通过根据用户对所述初筛文章集合中的各文章的历史点击记录,构建初筛文章集合中的文章的第二文章对,再将第二文章对作为图数据网络的邻居边、以及将第二文章对中的文章作为邻居边的两端节点,构建图数据网络;最后通过在图数据网络上随机游走,挖掘更多无偏数据来扩充样本集合,从而达到缓解选择性偏差的目的。
[0109]
进一步的,作为对上述图1所示方法的实现,本发明实施例提供了一种信息推荐模型训练装置,如图6所示,该装置包括:
[0110]
召回模块61,用于根据热门文章信息、以及用户的用户行为数据,筛选待推送的文章,获得初筛文章集合;
[0111]
图数据网络构建模块62,用于根据所述初筛文章集合中的各文章之间关系,构建文章的图数据网络;
[0112]
候选样本获取模块63,用于通过在所述图数据网络上随机游走,获取样本候选集合;
[0113]
模型训练模块64,用于将所述初筛文章集合和所述样本候选集合汇集成训练样本集合,并对待训练的信息推荐模型进行训练,获得信息推荐模型。
[0114]
本发明实施例提供了一种信息推荐模型训练装置,与现有技术相比,本发明实施例通过根据热门文章信息、以及用户的用户行为数据,筛选待推送的文章,获得初筛文章集合;再根据初筛文章集合中的各文章之间关系,构建文章的图数据网络,并通过在图数据网络上随机游走,获取样本候选集合;最后将初筛文章集合和样本候选集合汇集成训练样本集合,并对待训练的信息推荐模型进行训练,获得可向计算机设备下发推荐文章的信息推荐模型。本发明通过将根据用户行为数据筛选出的初筛文章集合,并将初筛文章集合中的各文章构建文章的图数据网络,再通过在图数据网络上的随机游走获得符合用户个性话需求的样本候选集合,进而使通过初筛文章集合和样本候选集合汇集成的训练样本集合训练出的信息推荐模型增加了用户粘性。
[0115]
作为对上述图2所示方法的实现,本发明实施例提供了另一种信息推荐模型训练装置,如图7所示,该装置包括:
[0116]
召回模块71,用于根据热门文章信息、以及用户的用户行为数据,筛选待推送的文章,获得初筛文章集合;
[0117]
第二文章对构建单元721,用于根据所述用户对所述初筛文章集合中的各文章的历史点击记录,构建所述初筛文章集合中的文章的第二文章对;
[0118]
图数据网络构建单元722,用于将所述第二文章对作为图数据网络的邻居边、以及将所述第二文章对中的文章作为所述邻居边的两端节点,构建所述图数据网络;
[0119]
候选样本获取模块73,用于通过在所述图数据网络上随机游走,获取样本候选集合;
[0120]
模型训练模块74,用于将所述初筛文章集合和所述样本候选集合汇集成训练样本集合,并对待训练的信息推荐模型进行训练,获得信息推荐模型。
[0121]
进一步的,所述召回模块71包括:
[0122]
用户信息确定单元,用于根据所述用户行为数据,确定所述用户感兴趣的偏好特征、以及用户历史点击文章的列表;
[0123]
兴趣召回单元,用于根据所述用户感兴趣的偏好特征,对所述待推送的文章进行
召回,获得第一召回文章集合;
[0124]
第一文章对构建单元,用于根据所述用户历史点击文章的列表,构建此列表中的文章的第一文章对,并计算各个所述第一文章对的相似度分值;
[0125]
协同过滤召回单元,用于将所述第一文章对的相似度分值大于预设阈值的待推送的文章进行召回,获得第二召回文章集合;
[0126]
热门召回单元,用于根据所述热门文章信息,对所述待推送的文章进行召回,获得第三召回文章集合;
[0127]
将所述第一召回文章集合、第二召回文章集合和第三召回文章集合汇集成所述初筛文章集合。
[0128]
进一步的,所述第一文章对构建单元包括:
[0129]
初始相似度分值计算子单元,用于统计各个所述第一文章对在所述用户历史点击文章的列表中的共现次数、以及各个所述第一文章对中的文章出现次数,计算各个所述第一文章对的初始相似度分值;
[0130]
第一相似度加权子单元,用于通过所述第一文章对应的展示位置信息权重、点击时间权重、以及创建时间权重对所述初始相似度分值依次进行加权计算,获得加权相似度分值,并将所述加权相似度分值作为所述第一文章对的相似度分值。
[0131]
进一步的,所述图数据网络构建单元722包括:
[0132]
第二相似度加权子单元,用于根据所述第二文章对的共现次数、所述第二文章对中的文章的出现次数、以及所述第二文章对中的文章所对应的流行度,计算所述第二文章对中的文章相似度分值;
[0133]
邻居边加权处理子单元,用于将所述第二文章对中的文章相似度分值作为边权重对与此所述第二文章对应的图数据网络的邻居边进行加权计算,获得加权后的所述图数据网络的邻居边。
[0134]
进一步的,所述候选样本获取模块73包括:
[0135]
跳转概率确定单元,用于将两个所述节点之间的邻居边对应的边权重作为跳转概率;
[0136]
游走路径获取单元,用于根据所述跳转概率在所述图数据网络上的节点连接结构,获取游走路径;
[0137]
样本候选集合确定单元,用于根据所述游走路径生成文章节点序列,并确定样本候选集合,其中,所述样本候选集合包括所述游走路径所对应的至少一对第二文章对。
[0138]
进一步的,所述候选样本获取模块73还包括:
[0139]
待预测文章确定单元,用于根据所述用户对所述初筛文章集合中的各文章的历史点击记录,确定与所述样本候选集合中的各文章分别对应的待预测文章;
[0140]
样本候选集合更新单元,用于将获得的所有所述待预测文章加入所述样本候选集合中,获得更新后的样本候选集合。
[0141]
本发明实施例提供了一种信息推荐模型训练装置,与现有技术相比,本发明实施例根据用户对所述初筛文章集合中的各文章的历史点击记录,构建初筛文章集合中的文章的第二文章对,再将第二文章对作为图数据网络的邻居边、以及将第二文章对中的文章作为邻居边的两端节点,构建图数据网络;最后通过在图数据网络上随机游走,挖掘更多无偏
数据来扩充样本集合,从而达到缓解选择性偏差的目的。
[0142]
根据本发明一个实施例提供了一种存储介质,所述存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的信息推荐模型训练方法。
[0143]
基于上述如图1所示方法和如图6所示装置的实施例,本发明实施例还提供了一种计算机设备的实体结构图,如图8所示,该计算机设备包括:处理器81、存储器82、及存储在存储器82上并可在处理器上运行的计算机程序,其中,存储器82和处理器,81均设置在总线83上所述处理器81执行所述程序时实现以下步骤:根据热门文章信息、以及用户的用户行为数据,筛选待推送的文章,获得初筛文章集合;根据所述初筛文章集合中的各文章之间关系,构建文章的图数据网络;通过在所述图数据网络上随机游走,获取样本候选集合;将所述初筛文章集合和所述样本候选集合汇集成训练样本集合,并对待训练的信息推荐模型进行训练,获得信息推荐模型。
[0144]
通过本发明的技术方案,本发明通过根据热门文章信息、以及用户的用户行为数据,筛选待推送的文章,获得初筛文章集合;再根据初筛文章集合中的各文章之间关系,构建文章的图数据网络,并通过在图数据网络上随机游走,获取样本候选集合;最后将初筛文章集合和样本候选集合汇集成训练样本集合,并对待训练的信息推荐模型进行训练,获得可向计算机设备下发推荐文章的信息推荐模型。本发明通过将根据用户行为数据筛选出的初筛文章集合,并将初筛文章集合中的各文章构建文章的图数据网络,再通过在图数据网络上的随机游走获得符合用户个性话需求的样本候选集合,进而使通过初筛文章集合和样本候选集合汇集成的训练样本集合训练出的信息推荐模型增加了用户粘性。
[0145]
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
[0146]
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1