信息推荐方法、装置、服务器及存储介质与流程

文档序号:29087792发布日期:2022-03-02 01:52阅读:62来源:国知局
信息推荐方法、装置、服务器及存储介质与流程

1.本公开涉及信息推荐技术领域,尤其涉及一种信息推荐方法、装置、服务器及存储介质。


背景技术:

2.随着信息推荐技术的发展,出现了一种对用户进行信息推荐的技术,首先从推荐信息库中召回推荐信息,即筛选出适合推荐给用户的推荐信息,之后则可以按照筛选出的推荐信息的信息价值,对筛选出的推荐信息进行排序和竞价,从而可以将高信息价值的推荐信息推荐至用户。
3.然而,目前的信息推荐方法中,召回推荐信息的过程通常需要增加召回信息的数量,以保证召回的效果,然而,如果需要增加召回信息的数量,则需要同时增加执行信息召回所需要的机器数量,因此在机器数量有限的情况下,目前的信息推荐方法中信息推荐的准确度较低。


技术实现要素:

4.本公开提供一种信息推荐方法、装置、服务器及存储介质,以至少解决相关技术中信息推荐的准确度低的问题。本公开的技术方案如下:
5.根据本公开实施例的第一方面,提供一种信息推荐方法,包括:
6.响应于目标帐户的信息推荐请求,从预设的推荐信息库中获取第一召回信息;
7.根据所述目标帐户的历史推荐信息,获取第二召回信息;所述历史推荐信息根据所述目标帐户的历史信息推荐请求所对应的历史召回信息得到,所述历史信息推荐请求为所述目标帐户在所述信息推荐请求之前预设时间段内触发的信息推荐请求;
8.从所述第一召回信息和所述第二召回信息中,获取候选推荐信息;
9.从所述候选推荐信息中确定目标推荐信息,将所述目标推荐信息发送至所述目标帐户。
10.在一示例性实施例中,所述历史推荐信息为从所述历史召回信息中得到的候选推荐信息;所述历史推荐信息的数量为多个;所述从所述目标帐户的历史推荐信息中,获取第二召回信息,包括:获取各历史推荐信息对应的聚类中心,确定各聚类中心对应的推荐信息集合;从所述各聚类中心对应的推荐信息集合中筛选出第一数量的推荐信息,作为所述第二召回信息。
11.在一示例性实施例中,所述从所述各聚类中心对应的推荐信息集合中筛选出第一数量的推荐信息,作为所述第二召回信息,包括:确定当前聚类中心,以及所述当前聚类中心对应的推荐信息集合,得到当前推荐信息集合;获取所述当前推荐信息集合中包含的历史推荐信息,以及所述当前推荐信息集合中包含的历史推荐信息的信息个数;从所述当前推荐信息集合中筛选出第二数量的除所述当前推荐信息集合中包含的历史推荐信息之外的其他推荐信息,将所述第二数量的其他推荐信息以及当前推荐信息集合中包含的历史推
荐信息作为所述第二召回信息;其中,所述第二数量为所述第一数量与所述信息个数的差值。
12.在一示例性实施例中,所述从所述当前推荐信息集合中筛选出第二数量的除所述当前推荐信息集合中包含的历史推荐信息之外的其他推荐信息,包括:获取各其他推荐信息分别对应的出价信息;按照所述出价信息的排序,从所述其他推荐信息中获取第二数量的其他推荐信息。
13.在一示例性实施例中,所述获取各历史推荐信息对应的聚类中心之前,还包括:获取所述推荐信息库中各推荐信息对应的信息特征,以及所述推荐信息库中各推荐信息对应的出价信息;利用所述信息特征以及所述出价信息对所述推荐信息库中各推荐信息进行聚类处理,得到所述推荐信息库中各推荐信息对应的聚类中心。
14.在一示例性实施例中,所述利用所述信息特征以及所述出价信息对所述推荐信息库中各推荐信息进行聚类处理,得到所述推荐信息库中各推荐信息对应的聚类中心,包括:获取多个初始聚类中心,根据所述信息特征以及所述出价信息计算各推荐信息与各初始聚类中心的第一距离,根据所述第一距离从所述各推荐信息中筛选出与各初始聚类中心分别对应的初始聚类信息,形成各个聚类信息集合;根据所述各个聚类信息集合包含的初始聚类信息的信息特征,获取所述各个聚类信息集合对应的目标聚类中心;根据所述各个聚类信息集合包含的初始聚类信息的信息特征,以及所述各个聚类信息集合包含的初始聚类信息的出价信息,计算所述各个聚类信息集合包含的初始聚类信息与所述各个聚类信息集合对应的目标聚类中心之间的第二距离,根据所述第二距离确定所述推荐信息库中各推荐信息对应的聚类中心。
15.在一示例性实施例中,所述根据所述第二距离确定所述推荐信息库中各推荐信息对应的聚类中心,包括:获取各个第二距离的距离总和;若所述距离总和大于或者等于预设的距离阈值,则将所述目标聚类中心作为初始聚类中心,并返回根据所述信息特征以及所述出价信息计算各推荐信息与各初始聚类中心的第一距离的步骤;和/或若所述距离总和小于所述距离阈值,则将所述目标聚类中心作为所述推荐信息库中各推荐信息对应的聚类中心。
16.根据本公开实施例的第二方面,提供一种信息推荐装置,包括:
17.第一召回获取单元,被配置为执行响应于目标帐户的信息推荐请求,从预设的推荐信息库中获取第一召回信息;
18.第二召回获取单元,被配置为执行根据所述目标帐户的历史推荐信息,获取第二召回信息;所述历史推荐信息根据所述目标帐户的历史信息推荐请求所对应的历史召回信息得到,所述历史信息推荐请求为所述目标帐户在所述信息推荐请求之前预设时间段内触发的信息推荐请求;
19.候选推荐获取单元,被配置为执行从所述第一召回信息和所述第二召回信息中,获取候选推荐信息;
20.目标推荐发送单元,被配置为执行从所述候选推荐信息中确定目标推荐信息,将所述目标推荐信息发送至所述目标帐户。
21.在一示例性实施例中,所述历史推荐信息为从所述历史召回信息中得到的候选推荐信息;所述历史推荐信息的数量为多个;所述第二召回获取单元,进一步被配置为执行获
取各历史推荐信息对应的聚类中心,确定各聚类中心对应的推荐信息集合;从所述各聚类中心对应的推荐信息集合中筛选出第一数量的推荐信息,作为所述第二召回信息。
22.在一示例性实施例中,所述第二召回获取单元,进一步被配置为执行确定当前聚类中心,以及所述当前聚类中心对应的推荐信息集合,得到当前推荐信息集合;获取所述当前推荐信息集合中包含的历史推荐信息,以及所述当前推荐信息集合中包含的历史推荐信息的信息个数;从所述当前推荐信息集合中筛选出第二数量的除所述当前推荐信息集合中包含的历史推荐信息之外的其他推荐信息,将所述第二数量的其他推荐信息以及当前推荐信息集合中包含的历史推荐信息作为所述第二召回信息;其中,所述第二数量为所述第一数量与所述信息个数的差值。
23.在一示例性实施例中,所述第二召回获取单元,进一步被配置为执行获取各其他推荐信息分别对应的出价信息;按照所述出价信息的排序,从所述其他推荐信息中获取第二数量的其他推荐信息。
24.在一示例性实施例中,信息推荐装置,还包括:推荐信息聚类单元,被配置为执行获取所述推荐信息库中各推荐信息对应的信息特征,以及所述推荐信息库中各推荐信息对应的出价信息;利用所述信息特征以及所述出价信息对所述推荐信息库中各推荐信息进行聚类处理,得到所述推荐信息库中各推荐信息对应的聚类中心。
25.在一示例性实施例中,所述推荐信息聚类单元,进一步被配置为执行获取多个初始聚类中心,根据所述信息特征以及所述出价信息计算各推荐信息与各初始聚类中心的第一距离,根据所述第一距离从所述各推荐信息中筛选出与各初始聚类中心分别对应的初始聚类信息,形成各个聚类信息集合;根据所述各个聚类信息集合包含的初始聚类信息的信息特征,获取所述各个聚类信息集合对应的目标聚类中心;根据所述各个聚类信息集合包含的初始聚类信息的信息特征,以及所述各个聚类信息集合包含的初始聚类信息的出价信息,计算所述各个聚类信息集合包含的初始聚类信息与所述各个聚类信息集合对应的目标聚类中心之间的第二距离,根据所述第二距离确定所述推荐信息库中各推荐信息对应的聚类中心。
26.在一示例性实施例中,所述推荐信息聚类单元,进一步被配置为执行获取各个第二距离的距离总和;若所述距离总和大于或者等于预设的距离阈值,则将所述目标聚类中心作为初始聚类中心,并返回根据所述信息特征以及所述出价信息计算各推荐信息与各初始聚类中心的第一距离的步骤;以及被配置为执行若所述距离总和小于所述距离阈值,则将所述目标聚类中心作为所述推荐信息库中各推荐信息对应的聚类中心。
27.根据本公开实施例的第三方面,提供一种服务器,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如第一方面中任一项实施例所述的信息推荐方法。
28.根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由服务器的处理器执行时,使得所述服务器能够执行如第一方面中任一项实施例所述的信息推荐方法。
29.根据本公开实施例的第五方面,提供一种计算机程序产品,所述计算机程序产品中包括指令,所述指令被服务器的处理器执行时,使得所述服务器能够执行如第一方面中任一项实施例所述的信息推荐方法。
30.本公开的实施例提供的技术方案至少带来以下有益效果:
31.通过响应于目标帐户的信息推荐请求,从预设的推荐信息库中获取第一召回信息;根据目标帐户的历史推荐信息,获取第二召回信息;历史推荐信息根据目标帐户的历史信息推荐请求所对应的历史召回信息得到,历史信息推荐请求为目标帐户在信息推荐请求之前预设时间段内触发的信息推荐请求;从第一召回信息和第二召回信息中,获取候选推荐信息;从候选推荐信息中确定目标推荐信息,将目标推荐信息发送至目标帐户。本公开在从推荐信息库中得到第一召回信息的基础上,还可以根据目标帐户的历史推荐信息得到第二召回信息,并基于第一召回信息以及第二召回信息得到最终的目标推荐信息推荐至目标帐户,相比于传统技术中只通过推荐信息库进行召回信息的获取,本公开在不增加额外的机器数量的基础上,可以增加召回信息的数量,从而可以提高信息推荐的准确度。
32.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
33.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
34.图1是根据一示例性实施例示出的一种信息推荐方法的应用环境图。
35.图2是根据一示例性实施例示出的一种信息推荐方法的流程图。
36.图3是根据一示例性实施例示出的获取第二召回信息的流程图。
37.图4是根据另一示例性实施例示出的获取第二召回信息的流程图。
38.图5是根据一示例性实施例示出的对推荐信息进行聚类处理的流程图。
39.图6是根据一示例性实施例示出的得到推荐信息对应的聚类中心的流程图。
40.图7是根据一示例性实施例示出的残差神经网络的结构示意图。
41.图8是根据一示例性实施例示出的竞价队列的广告缓存示意图。
42.图9是根据一示例性实施例示出的竞价队列的广告聚类示意图。
43.图10是根据一示例性实施例示出的一种信息推荐装置的框图。
44.图11是根据一示例性实施例示出的一种服务器的框图。
具体实施方式
45.为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
46.需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
47.还需要说明的是,本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经
过各方充分授权的信息和数据。
48.本公开所提供的信息推荐方法,可以应用于如图1所示的应用环境中。其中,终端101通过网络与服务器102进行交互。具体来说,目标帐户可以通过其终端101向服务器102发起用于获取推荐信息的信息推荐请求,服务器102则可以对该请求进行响应,从存储有推荐信息的推荐信息库中得到第一召回信息,以及根据由该目标帐户的历史推荐请求对应的历史召回信息得到的历史推荐信息,得到第二召回信息,并通过对第一召回信息以及第二召回信息进行排序后,筛选出候选推荐信息,并最终从候选推荐信息中确定出目标推荐信息,返回至目标帐户的终端101。其中,终端101可以是但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器102可以是用独立的服务器或者是多个服务器组成的服务器集群来实现。
49.图2是根据一示例性实施例示出的一种信息推荐方法的流程图,如图2所示,信息推荐方法用于服务器102中,包括以下步骤。
50.在步骤s201中,响应于目标帐户的信息推荐请求,从预设的推荐信息库中获取第一召回信息。
51.其中,目标帐户指的是进行推荐信息获取的帐户,该帐户可以通过其终端101触发相关的推荐信息获取操作,向服务器102发起用于获取服务器102发送的推荐信息的信息推荐请求,例如目标帐户可以对终端101中某个显示页面进行刷新操作来向服务器102触发上述信息推荐请求,服务器102则可以对该请求进行响应,从预先建立的推荐信息库中找到与该信息推荐请求相应的召回信息,作为第一召回信息。
52.例如,可以是根据该目标帐户的兴趣标签,或者浏览主题等筛选出该目标帐户可能感兴趣的推荐信息作为第一召回信息,也可以是将推荐信息库中的热门推荐信息作为第一召回信息,又或者是将和该目标帐户相似的其他帐户喜欢的推荐信息进行协同过滤召回,作为第一召回信息等等,本步骤中服务器102可以按照不同的筛选规则,从存储有推荐信息的推荐信息库中筛选出与不同筛选规则相应的第一召回信息。
53.在步骤s202中,根据目标帐户的历史推荐信息,获取第二召回信息;历史推荐信息根据目标帐户的历史信息推荐请求所对应的历史召回信息得到,历史信息推荐请求为目标帐户在信息推荐请求之前预设时间段内触发的信息推荐请求。
54.历史推荐信息指的是由历史召回信息得到的推荐信息,例如可以是对历史召回信息进行排序处理后筛选出来的推荐信息作为历史推荐信息。历史召回信息指的是目标帐户在触发历史信息推荐请求时,服务器102得到的与历史推荐请求对应的召回信息,该历史信息推荐请求指的是目标帐户在触发信息推荐请求之前的一段时间段内触发的信息推荐请求,可以是本次触发的信息推荐请求之前触发的预设次数的信息推荐请求作为历史信息推荐请求,例如可以是目标帐户在本次触发的信息推荐请求之前10次触发的信息推荐请求作为历史信息推荐请求。
55.具体来说,服务器102可以存储有该目标帐户的历史推荐信息,服务器102在每次目标帐户触发信息推荐请求后,都可以对该请求进行响应,得到相应的召回信息,以及对召回信息进行处理从而确定出相应的推荐信息,之后服务器102则可以将上述推荐信息进行存储,作为在目标帐户之后触发的信息推荐请求的历史推荐信息。并且,在目标帐户之后触发信息推荐请求时,则可以读取存储的历史推荐信息,并根据历史推荐信息,得到相应的召
回信息,作为第二召回信息,例如可以是将历史推荐信息直接作为新加入的召回信息,即第二召回信息,也可以是基于历史推荐信息筛选出与历史推荐信息相关的推荐信息作为第二召回信息。
56.在步骤s203中,从第一召回信息和第二召回信息中,获取候选推荐信息;
57.在步骤s204中,从候选推荐信息中确定目标推荐信息,将目标推荐信息发送至目标帐户。
58.候选推荐信息指的是对召回信息通过排序阶段进行排序后得到的推荐信息,该候选推荐信息可以作为竞价队列信息来执行最后的竞价阶段,以确定出最后推荐给目标帐户的推荐信息,即目标推荐信息。
59.具体来说,服务器102得到第一召回信息以及第二召回信息后,则可以将第一召回信息以及第二召回信息作为排序的候选集,并对第一召回信息以及第二召回信息进行排序,例如可以是将上述第一召回信息以及第二召回信息根据各种模型的预估值按照上述召回信息带来的收益来进行排序,排序完成后则可以得到相应的候选推荐信息,之后,服务器102还可以将候选推荐信息作为竞价队列中的推荐信息,对候选推荐信息经过门槛等一系列过滤,然后计算每个候选推荐信息对应的价值,从而选择价值最高的候选推荐信息作为目标推荐信息发送至目标帐户的终端101。
60.上述信息推荐方法中,通过响应于目标帐户的信息推荐请求,从预设的推荐信息库中获取第一召回信息;根据目标帐户的历史推荐信息,获取第二召回信息;历史推荐信息根据目标帐户的历史信息推荐请求所对应的历史召回信息得到,历史信息推荐请求为目标帐户在信息推荐请求之前预设时间段内触发的信息推荐请求;从第一召回信息和第二召回信息中,获取候选推荐信息;从候选推荐信息中确定目标推荐信息,将目标推荐信息发送至目标帐户。本公开在从推荐信息库中得到第一召回信息的基础上,还可以根据目标帐户的历史推荐信息得到第二召回信息,并基于第一召回信息以及第二召回信息得到最终的目标推荐信息推荐至目标帐户,相比于传统技术中只通过推荐信息库进行召回信息的获取,本公开在不增加额外的机器数量的基础上,可以增加召回信息的数量,从而可以提高信息推荐的准确度。
61.在一示例性实施例中,历史推荐信息为从历史召回信息中得到的候选推荐信息;历史推荐信息的数量为多个;如图3所示,步骤s202具体可以包括如下步骤:
62.在步骤s301中,获取各历史推荐信息对应的聚类中心,确定各聚类中心对应的推荐信息集合。
63.本实施例中,历史推荐信息可以是目标帐户触发历史信息推荐请求后,由服务器102得到的历史召回信息通过排序阶段后得到的推荐信息,即历史信息推荐请求对应的候选推荐信息。在本实施例中,服务器102得到作为竞价队列的候选推荐信息后,则可以将候选推荐信息进行存储,作为下一次目标帐户触发信息推荐请求所对应的历史推荐信息,同时由于该历史推荐信息是由竞价队列的信息,即候选推荐信息所组成,因此该历史推荐信息的数量也可以是多个。聚类中心则指的是历史推荐信息的类簇中心,而推荐信息集合则指的是该类簇中心所对应的推荐信息所组成的集合。
64.具体来说,服务器102可以预先对推荐信息库中包含的推荐信息进行聚类处理,形成多个聚类中心,以及每一个聚类中心包含的推荐信息形成的推荐信息集合。服务器102确
定出历史推荐信息后,则可以判断每一个历史推荐信息对应的聚类中心,以及该聚类中心对应的推荐信息集合。
65.例如,推荐信息库中包含推荐信息a、推荐信息b、推荐信息c以及推荐信息d,其中推荐信息a与推荐信息b对应于聚类中心a,该聚类中心a对应的推荐信息集合即包括推荐信息a与推荐信息b,而推荐信息c以及推荐信息d则对应于聚类中心b,该聚类中心b对应的推荐信息集合即包括推荐信息c与推荐信息d,那么当推荐信息a作为历史推荐信息时,服务器102则可以将聚类中心a作为该推荐信息a对应的聚类中心,并且将推荐信息a对应的推荐信息集合,作为聚类中心对应的推荐信息集合。
66.在步骤s302中,从各聚类中心对应的推荐信息集合中筛选出第一数量的推荐信息,作为第二召回信息。
67.第一数量可指的是从推荐信息集合中筛选出的推荐信息的数量,该数量可以是预先进行设定,由于本实施例中历史推荐信息是由历史召回信息经过排序阶段筛选后得到的竞价队列信息,因此相比于直接从推荐信息库中得到的第一召回信息,历史推荐信息的数据量较小,因此为了提高召回的效果,本实施例中还可以从每一个历史推荐信息的聚类中心对应的推荐信息集合中,筛选出第一数量的推荐信息,作为第二召回信息,来扩充第二召回信息的数据量。
68.例如第一数量为10,那么对于某一个历史推荐信息a,则可以从其对应的推荐信息集合中筛选出10个推荐信息,作为第二召回信息,相比于只将历史推荐信息a作为第二召回信息,这种召回方式可以增加第二召回信息的数据量,从而提高召回的效果。
69.本实施例中,第二召回信息可以是从历史推荐信息所对应的推荐信息集合进行筛选得到,从而可以提高第二召回信息的数据量,提高信息召回的可靠性。
70.进一步地,如图4所示,步骤s302可以进一步包括:
71.在步骤s401中,确定当前聚类中心,以及当前聚类中心对应的推荐信息集合,得到当前推荐信息集合。
72.当前聚类中心指的是多个历史推荐信息对应的多个聚类中心中的任意一个,由于历史推荐信息的数量为多个,因此不同的历史推荐信息也可以对应于不同的聚类中心,当前聚类中心则指的是多个聚类中心中的任意一个。例如历史推荐信息可以包含历史推荐信息a和历史推荐信息b,并且历史推荐信息a和历史推荐信息b分别对应于不同的聚类中心,即分别对应于聚类中心a和聚类中心b,那么当前聚类中心则可以是聚类中心a或者聚类中心b中的任意一个,当前推荐信息集合则指的是当前聚类中心对应的推荐信息集合,如果聚类中心a作为当前聚类中心,那么聚类中心a对应的推荐信息集合则可以作为当前推荐信息集合,而如果聚类中心b作为当前聚类中心,那么聚类中心b对应的推荐信息集合则可以作为当前推荐信息集合。
73.在步骤s402中,获取当前推荐信息集合中包含的历史推荐信息,以及当前推荐信息集合中包含的历史推荐信息的信息个数。
74.服务器102在确定出当前推荐信息集合后,还可以确定该集合中包含的历史推荐信息的信息个数,例如对于历史推荐信息a以及历史推荐信息c,都对应于同一个聚类中心a,因此当聚类中心a作为当前聚类中心时,当前推荐信息集合则可以包含两个历史推荐信息,而如果历史推荐信息b对应于聚类中心b,当聚类中心b作为当前聚类中心时,当前推荐
信息集合则可以包含一个历史推荐信息,本实施例中,在确定出当前推荐信息集合后,还可以统计出属于该集合的历史推荐信息的信息个数。
75.在步骤s403,从当前推荐信息集合中筛选出第二数量的除当前推荐信息集合中包含的历史推荐信息之外的其他推荐信息,将第二数量的其他推荐信息以及当前推荐信息集合中包含的历史推荐信息作为第二召回信息;其中,第二数量为第一数量与信息个数的差值。
76.其他推荐信息则指的是当前推荐信息集合中除了历史推荐信息以外的推荐信息,服务器102在确定出当前推荐信息集合中包含的历史推荐信息后,则可以将当前推荐信息集合中除历史推荐信息之外的推荐信息作为其他推荐信息,并且从其他推荐信息中筛选出第二数量的其他推荐信息,并且将第二数量的其他推荐信息以及当前推荐信息集合中包含的历史推荐信息作为第二召回信息,其中,第二数量为第一数量与信息个数的差值。
77.例如,第一数量可以设置为10个,假如某一个当前推荐信息集合中包含2个历史推荐信息,那么第二数量则可以是8个,即从当前推荐信息集合中筛选出8个其他推荐信息,并将8个其他推荐信息以及2个历史推荐信息作为第二召回信息,而如果某一个当前推荐信息集合中仅包含1个历史推荐信息,那么第二数量则可以是9个,即从当前推荐信息集合中筛选出9个其他推荐信息,并将9个其他推荐信息以及1个历史推荐信息作为第二召回信息。
78.本实施例中,第二召回信息的筛选可以是通过当前推荐信息集合中第二数量的其他推荐信息,以及当前推荐信息集合中的历史推荐信息组成得到,从而可以保证每一个推荐信息集合中筛选出的第二召回信息的数量都满足第一数量,并且可以保证第二召回信息中包含历史推荐信息,可以提高第二召回信息的多样性以及精确性。
79.进一步地,步骤s403可以进一步包括:获取各其他推荐信息分别对应的出价信息;按照出价信息的排序,从其他推荐信息中获取第二数量的其他推荐信息。
80.其中,出价信息指的是其他推荐信息的价格信息,本实施例中推荐信息可以是广告信息,而出价信息则指的是广告主的出价,本实施例中,在确定出其他推荐信息后,服务器102还可以得到每一个其他推荐信息所对应的广告主的出价,作为每一个其他推荐信息分别对应的出价信息,之后服务器102还可以按照出价信息对其他推荐信息进行排序,例如可以是按照出价信息的大小顺序进行其他推荐信息的排序,并且按照该排序选择第二数量的其他推荐信息,即选择出价较高的前第二数量的其他推荐信息。
81.例如其他推荐信息按照出价信息的大小顺序进行排序后为其他推荐信息a、其他推荐信息b、其他推荐信息c、其他推荐信息d以及其他推荐信息e,假如确定出的第二数量为3,那么服务器102则可以将其他推荐信息a、其他推荐信息b以及其他推荐信息c作为筛选出第二数量的其他推荐信息,而假如确定出的第二数量为2,那么服务器102则可以将其他推荐信息a和其他推荐信息b作为筛选出第二数量的其他推荐信息。
82.本实施例中,筛选出的第二数量的其他推荐信息可以是按照其他推荐信息对应的出价信息进行筛选,从而可以使得筛选出的其他推荐信息具有更高的出价信息,从而提高第二召回信息的信息价值。
83.在一示例性实施例中,如图5所示,步骤s202之前,还可以包括:
84.在步骤s501中,获取推荐信息库中各推荐信息对应的信息特征,以及推荐信息库中各推荐信息对应的出价信息。
85.其中,信息特征指的是推荐信息的内容特征,本实施例中,推荐信息可以是广告视频,因此该信息特征可以指的是广告视频的视频内容特征,该信息特征可以是通过预先训练的残差神经网络进行提取,如通过resnet-34来进行信息特征的提取,而出价信息则指的是广告主针对该广告视频的出价。具体地,服务器102可以对推荐信息库中每一个推荐信息,即每一个广告视频通过残差神经网络进行视频内容特征的提取,作为各推荐信息对应的信息特征,并且还可以得到每一个广告视频对应的广告主出价,作为各推荐信息对应的出价信息。
86.在步骤s502中,利用信息特征以及出价信息对推荐信息库中各推荐信息进行聚类处理,得到推荐信息库中各推荐信息对应的聚类中心。
87.之后,服务器102则可以利用步骤s501确定出的信息特征以及出价信息对上述推荐信息库中的推荐信息进行聚类处理,从而使得信息特征以及出价信息相似的推荐信息可以聚类到同样的推荐信息集合,并且还可以确定出该推荐信息集合的聚类中心,从而得到推荐信息库中每一个推荐信息对应的聚类中心。
88.本实施例中,服务器102还可以利用信息特征以及出价信息对推荐信息库中的推荐信息进行聚类处理,从而使得聚类后的推荐信息既满足信息特征的相似性,还满足出价信息的相似性,从而进一步提高推荐信息聚类的聚类精度。
89.进一步地,如图6所示,步骤s502可以进一步包括:
90.在步骤s601中,获取多个初始聚类中心,根据信息特征以及出价信息计算各推荐信息与各初始聚类中心的第一距离,根据第一距离从各推荐信息中筛选出与各初始聚类中心分别对应的初始聚类信息,形成各个聚类信息集合。
91.第一距离可以用于表征推荐信息库中各推荐信息与初始聚类中心的相似度,该初始聚类中心可以是服务器102随机生成,初始聚类信息则指的是初始聚类中心所对应的聚类信息集合中包含的推荐信息。
92.具体来说,服务器102可以随机生成多个聚类中心作为初始聚类中心,之后服务器102则可以分别利用每一个推荐信息的信息特征以及出价信息,计算各个推荐信息与每一个初始聚类中心之间的第一距离,从而可以确定出各个推荐信息分别对应的初始聚类中心,例如可以是将每一个推荐信息对应的第一距离最小的初始聚类中心作为该推荐信息对应的初始聚类中心,从而服务器102可以确定出每一个初始聚类中心对应的推荐信息,即初始聚类信息,并且将上述初始聚类信息组成与初始聚类中心匹配的聚类信息集合。
93.例如,推荐信息可以包括:推荐信息a、推荐信息b、推荐信息c、推荐信息d以及推荐信息e,而初始聚类中心则可以包括初始聚类中心a和初始聚类中心b,服务器102则可以利用上述推荐信息的信息特征以及出价信息,分别计算与初始聚类中心a和初始聚类中心b的第一距离,从而将第一距离较小的初始聚类中心作为每一个推荐信息对应的初始聚类中心,而该推荐信息则作为初始聚类中心对应的初始聚类信息,可以是初始聚类中心a对应的初始聚类信息为推荐信息a、推荐信息b和推荐信息c,而初始聚类中心b对应的初始聚类信息则可以是推荐信息d和推荐信息e,从而形成初始聚类中心a的聚类信息集合,即包括推荐信息a、推荐信息b和推荐信息c,以及形成初始聚类中心b的聚类信息集合,即包括推荐信息d和推荐信息e。其中,第一距离的计算公式可如下所示:
[0094][0095]
其中,xi表示第i个推荐信息的信息特征,centerk则表示第k个初始聚类中心,dist(xi,centerk)则表示第i个推荐信息与第k个初始聚类中心的第一距离,表示第i个推荐信息的出价信息,则表示对出价信息进行归一化处理,而表示的则是第i个推荐信息与第k个初始聚类中心的相似度。
[0096]
在步骤s602中,根据各个聚类信息集合包含的初始聚类信息的信息特征,获取各个聚类信息集合对应的目标聚类中心。
[0097]
目标聚类中心则是确定出各个聚类信息集合后,由服务器102重新确定的针对各个聚类信息集合的聚类中心,该目标聚类中心可以是服务器102根据每一个聚类信息集合包含的初始聚类信息的信息特征计算得到,例如可以通过如下公式计算得到:
[0098][0099]
其中,centerk表示重新确定的目标聚类中心,ck表示该目标聚类中心所对应的聚类信息集合中包含的初始聚类信息的信息个数,xi则表示第i个初始聚类信息的信息特征,本实施例通过对聚类信息集合中包含的初始聚类信息进行平均值求取,从而可以确定出相应的目标聚类中心。
[0100]
在步骤s603中,根据各个聚类信息集合包含的初始聚类信息的信息特征,以及各个聚类信息集合包含的初始聚类信息的出价信息,计算各个聚类信息集合包含的初始聚类信息与各个聚类信息集合对应的目标聚类中心之间的第二距离,根据第二距离确定推荐信息库中各推荐信息对应的聚类中心。
[0101]
第二距离则可以表征聚类信息集合中各个初始聚类信息,与重新确定出的针对该聚类信息集合的目标聚类中心之间的相似度,服务器102在确定出每一个聚类信息集合的目标聚类中心后,则可以再次按照计算第一距离的方式,得到每一个初始聚类信息与目标聚类中心之间的第二距离,从而服务器可以根据第二距离确定出每一个初始聚类信息对应的聚类中心,例如某一个聚类信息集合所对应的第二距离都小于一个设定的阈值,那么则可以将该目标聚类中心作为该聚类信息集合中所有初始聚类信息的聚类中心,从而可以确定出每一个初始聚类信息的聚类中心,得到各推荐信息对应的聚类中心。
[0102]
本实施例中,还可以通过推荐信息与出价信息计算与聚类中心的距离的方式,来确定每一个推荐信息的聚类中心,从而可以提高确定出的聚类中心的准确性。
[0103]
进一步地,步骤s603可以进一步包括:获取各个第二距离的距离总和;若距离总和大于或者等于预设的距离阈值,则将目标聚类中心作为初始聚类中心,并返回步骤s601;和/或若距离总和小于距离阈值,则将目标聚类中心作为推荐信息库中各推荐信息对应的聚类中心。
[0104]
其中,距离总和指的是所有初始聚类信息与其对应的目标聚类中心的第二距离之和,服务器102计算出所有初始聚类信息与对应的目标聚类中心的第二距离之后,则可以将所有得到的第二距离相加,得到距离总和,并且服务器102还可以将距离总和与预先设定的距离阈值进行比对,假如距离总和大于或者等于预设的距离阈值,则表明聚类的效果仍然
不够理想,此时服务器102则可以将确定出的目标聚类中心作为新一轮迭代的初始聚类中心,并返回执行步骤s601,直到距离总和小于距离阈值,此时表明聚类效果已足够理想,则可以将最后一轮迭代确定出的目标聚类中心作为推荐信息库中各推荐信息对应的聚类中心。
[0105]
本实施例中,还可以通过设置距离阈值的方式,实现聚类过程的迭代,直到距离总和小于距离阈值停止迭代的过程,从而可以进一步提高聚类的效果以及确定出的聚类中心的准确性。
[0106]
在一示例性实施例中,还提供了一种基于聚类中心的视频检索方法,在保证结果相关性的同时,让收益最大化。该方案可以包括离线部分以及在线部分实现,具体可以通过如下步骤实现:
[0107]
(1)离线部分,
[0108]
离线部分的主要的作用的对全库的视频进行抽取embedding并聚类,本实施例利用深度神经网络resnet-34来抽取全库视频embedding,resnet-34主要结构在于残差设计部分,残差部分的结构如图7所示,通过f(x)+x的“跳级”连接设置,可以非常有效的缓解反向传播带来的剃度损失,让神经网络更好的抽取视频的embedding。
[0109]
抽取完成所有视频的embedding后,通过加入bid信息的kmeans方法进行聚类,跟传统kmeans相比,将bid信息引入到聚类中,这样的聚类中心不仅考虑到视频的相似度,而且包含了广告主的出价信息,这样在兼顾效果的同时,保证了平台利益最大化。
[0110]
而对于广告主新创建的视频,则会定时利用聚类好的模型,对新广告进行预估,然后归属到对应的类上,这样就能保证新广告的快速起量。
[0111]
(2)在线部分
[0112]
在线部分主要是聚类中心展开,并召回,详细介绍如下。
[0113]
在广告系统中,通常会部署多个个性化模型进行个性化召回,为了保证效果,往往会使用大量机器召回成千上万个广告,但是在广告系统中,一次pv只会出一个广告,召回的结果大部分都是没有胜出的,如果调小召回的数目,可能会存在召回的结果无法胜出,保证不了大盘效果,如果调大召回的数目,这样会使用大量的机器。从上面可以看到,在这种情况下效果和机器是需要做一个平衡,针对这个问题,因此提出了在基于竞价广告队列聚类展开重召回的方法,保证效果的同时,节省大量的机器.
[0114]
基于竞价广告队列聚类展开重召回方法主要分为两步:
[0115]
第一步,如图8所示,缓存了竞价队列的广告,这样做的好处是:
[0116]
1.召回效率高,召回的广告是曾经过了定向的广告,这样重新召回的广告,大部分也是符合定向条件的,可以重新进行投放系统进行投放,避免召回的结果被定向信息过滤了
[0117]
2.对系统反应灵敏,系统有任何变化,都会反应到竞价队列中,这样召回的结果也能立马发生改变,能够非常快速的感知系统的变化
[0118]
3.综合其他各种召回方法的结果,竞价队列是所有召回的方法都需要经历的阶段,在竞价队列重召回,相当于将每一路召回的结果重新筛选出更好的结果,这样筛选的结果既能通过召回,也能参与竞价,换句话说,即使其他召回方法的能力得到了提升,也能立马反馈到竞价广告重召回方法中,从而召回方法同样能够得到提升.
[0119]
4.节省大量机器,由于缓存的是用户维度的竞价广告进行重召回,这样就不需要部署大量召回模型来进行预估,兼顾了个性化的同时,节省了大量机器。
[0120]
第二步,由于竞价队列的广告数据量一般在几十的样子,相比于模型召回数量偏少,为了补充召回的丰富度,提出了聚类展开的重召回策略。如图9所示,item1到itemn都是缓存的竞价队列,聚类中心1,

聚类中心n则是离线部分确定出的聚类中心,对于每个竞价队列都会找到聚类中心,通过聚类中心,找到这类下所有的广告,利用bid进行排序,取前面排序的k个广告,进行重召回,这样主要有以下几个优点:
[0121]
1.增加召回的候选集大小,提高召回求交率
[0122]
2.通过聚类的方法,引入photo相关信息,增加了广告的精准度
[0123]
3.通过bid进行聚类展开截断,考虑了广告主出价信息,提升竞价顺畅度,增加平台收入。
[0124]
上述实施例中,可以通过深度神经网络对视频进行聚类,从而提高整个推荐库的泛化能力,保证新创建的物品能够快速起量,在检索相似视频时,引入bid信息,即广告主的出价信息,保证检索效果的同时,最大化平台收益,并且可以通过聚类中心展开重召回的特殊方式,保证效果的同时,解决了上线模型需要大量机器的问题。
[0125]
应该理解的是,虽然本公开的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
[0126]
可以理解的是,本说明书中上述方法的各个实施例之间相同/相似的部分可互相参见,每个实施例重点说明的是与其他实施例的不同之处,相关之处参见其他方法实施例的说明即可。
[0127]
图10是根据一示例性实施例示出的一种信息推荐装置的框图。参照图10,该装置包括第一召回获取单元1001,第二召回获取单元1002,候选推荐获取单元1003和目标推荐发送单元1004。
[0128]
第一召回获取单元1001,被配置为执行响应于目标帐户的信息推荐请求,从预设的推荐信息库中获取第一召回信息;
[0129]
第二召回获取单元1002,被配置为执行根据目标帐户的历史推荐信息,获取第二召回信息;历史推荐信息根据目标帐户的历史信息推荐请求所对应的历史召回信息得到,历史信息推荐请求为目标帐户在信息推荐请求之前预设时间段内触发的信息推荐请求;
[0130]
候选推荐获取单元1003,被配置为执行从第一召回信息和第二召回信息中,获取候选推荐信息;
[0131]
目标推荐发送单元1004,被配置为执行从候选推荐信息中确定目标推荐信息,将目标推荐信息发送至目标帐户。
[0132]
在一示例性实施例中,历史推荐信息为从历史召回信息中得到的候选推荐信息;历史推荐信息的数量为多个;第二召回获取单元1002,进一步被配置为执行获取各历史推荐信息对应的聚类中心,确定各聚类中心对应的推荐信息集合;从各聚类中心对应的推荐
信息集合中筛选出第一数量的推荐信息,作为第二召回信息。
[0133]
在一示例性实施例中,第二召回获取单元1002,进一步被配置为执行确定当前聚类中心,以及当前聚类中心对应的推荐信息集合,得到当前推荐信息集合;获取当前推荐信息集合中包含的历史推荐信息,以及当前推荐信息集合中包含的历史推荐信息的信息个数;从当前推荐信息集合中筛选出第二数量的除当前推荐信息集合中包含的历史推荐信息之外的其他推荐信息,将第二数量的其他推荐信息以及当前推荐信息集合中包含的历史推荐信息作为第二召回信息;其中,第二数量为第一数量与信息个数的差值。
[0134]
在一示例性实施例中,第二召回获取单元1002,进一步被配置为执行获取各其他推荐信息分别对应的出价信息;按照出价信息的排序,从其他推荐信息中获取第二数量的其他推荐信息。
[0135]
在一示例性实施例中,信息推荐装置,还包括:推荐信息聚类单元,被配置为执行获取推荐信息库中各推荐信息对应的信息特征,以及推荐信息库中各推荐信息对应的出价信息;利用信息特征以及出价信息对推荐信息库中各推荐信息进行聚类处理,得到推荐信息库中各推荐信息对应的聚类中心。
[0136]
在一示例性实施例中,推荐信息聚类单元,进一步被配置为执行获取多个初始聚类中心,根据信息特征以及出价信息计算各推荐信息与各初始聚类中心的第一距离,根据第一距离从各推荐信息中筛选出与各初始聚类中心分别对应的初始聚类信息,形成各个聚类信息集合;根据各个聚类信息集合包含的初始聚类信息的信息特征,获取各个聚类信息集合对应的目标聚类中心;根据各个聚类信息集合包含的初始聚类信息的信息特征,以及各个聚类信息集合包含的初始聚类信息的出价信息,计算各个聚类信息集合包含的初始聚类信息与各个聚类信息集合对应的目标聚类中心之间的第二距离,根据第二距离确定推荐信息库中各推荐信息对应的聚类中心。
[0137]
在一示例性实施例中,推荐信息聚类单元,进一步被配置为执行获取各个第二距离的距离总和;若距离总和大于或者等于预设的距离阈值,则将目标聚类中心作为初始聚类中心,并返回根据信息特征以及出价信息计算各推荐信息与各初始聚类中心的第一距离的步骤;以及被配置为执行若距离总和小于距离阈值,则将目标聚类中心作为推荐信息库中各推荐信息对应的聚类中心。
[0138]
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
[0139]
图11是根据一示例性实施例示出的一种用于信息推荐的电子设备1100的框图。例如,电子设备1100可以为服务器。参照图11,电子设备1100包括处理组件1120,其进一步包括一个或多个处理器,以及由存储器1122所代表的存储器资源,用于存储可由处理组件1120的执行的指令,例如应用程序。存储器1122中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1120被配置为执行指令,以执行上述方法。
[0140]
电子设备1100还可以包括:电源组件1124被配置为执行电子设备1100的电源管理,有线或无线网络接口1126被配置为将电子设备1100连接到网络,和输入输出(i/o)接口s28。电子设备1100可以操作基于存储在存储器1122的操作系统,例如windows server,mac os x,unix,linux,freebsd或类似。
[0141]
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器1122,上述指令可由电子设备1100的处理器执行以完成上述方法。存储介质可以是计算机可读存储介质,例如,所述计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
[0142]
在示例性实施例中,还提供一种计算机程序产品,所述计算机程序产品中包括指令,上述指令可由电子设备1100的处理器执行以完成上述方法。
[0143]
需要说明的,上述的装置、电子设备、计算机可读存储介质、计算机程序产品等根据方法实施例的描述还可以包括其他的实施方式,具体的实现方式可以参照相关方法实施例的描述,在此不作一一赘述。
[0144]
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
[0145]
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1