推送推广信息的方法、装置、设备和计算机存储介质与流程

文档序号:11206476阅读:396来源:国知局
推送推广信息的方法、装置、设备和计算机存储介质与流程

【技术领域】

本发明涉及推送技术领域,尤其涉及一种推送推广信息的方法、装置、设备和计算机存储介质。



背景技术:

现有技术在进行推广信息的推送时,一般采用如下方式:广告主购买人群的定向属性,例如年龄、性别、兴趣等,在进行推广信息的推送时,将推广信息向符合广告主所购买定向属性的用户进行展现。但采用传统的人群定向属性购买的方式进行推广信息的推送时具有很大的局限性:根据用户的定向属性向用户推送的推广信息较为固定,无法灵活地根据用户在一定时段内的真实需求向用户推送推广信息。



技术实现要素:

有鉴于此,本发明提供了一种推送推广信息的方法、装置、设备和计算机存储介质,用于实现根据用户的真实需求,灵活地向用户推送推广信息。

本发明为解决技术问题而采用的技术方案是提供一种推送推广信息的方法,所述方法包括:根据用户标识,获取对应该用户的候选query集合以及第二预设时段内的推广展现日志;基于所述第二预设时段内的推广展现日志,对所述候选query集合中各query的质量度进行评估;根据所述各query质量度的评估结果,向用户推送推广信息;其中,用户的候选query集合是利用第一预设时段内用户的检索日志和推广展现日志中至少一种预先训练得到的。

根据本发明一优选实施例,所述候选query集合是采用如下方式预先离线训练得到的:获取第一预设时段内用户的检索日志以及推广展现日志;基于所述第一预设时段内的检索日志,挖掘用户感兴趣的query集合;基于所述第一预设时段内的推广展现日志,对所述用户感兴趣的query集合中的各query进行商业价值预估;根据所述各query商业价值的预估结果,挑选商业价值大于预设阈值的query构成候选query集合。

根据本发明一优选实施例,所述推广展现日志包括:页面浏览日志以及推广日志;其中,所述页面浏览日志包括检索query的时间、检索用户的标识、检索返回的推广数以及点击检索结果所对应的query中的至少一种;所述推广日志包括推广的触发方式、query对应的推广是否被点击以及推广出价中的至少一种。

根据本发明一优选实施例,所述基于所述第一预设时段内的推广展现日志,对所述用户感兴趣的query集合中的各query进行商业价值预估包括:依据query在第一预设时段内的被检索状况以及query所对应推广的出价状况,预估所述用户感兴趣的query集合中的各query的商业价值。

根据本发明一优选实施例,所述在预估所述用户感兴趣的query集合中的各query的商业价值时,针对各query分别执行:基于所述第一预设时段内的推广展现日志,得到第一预设时段内检索该query时返回推广的次数占检索总次数的百分比;基于所述第一预设时段内的推广展现日志,获取第一预设时段内该query所对应推广的平均出价;将检索该query时返回推广的次数占检索总次数的百分比以及该query所对应推广的平均出价的乘积作为该query商业价值的预估结果。

根据本发明一优选实施例,所述第二预设时段为:以当前时间为中心,取预设长度日期区间中的预设长度时间区间作为第二预设时段。

根据本发明一优选实施例,所述基于所述第二预设时段内的推广展现日志,对所述候选query集合中各query的质量度进行评估包括:基于所述第二预设时段内的推广展现日志,对所述候选query集合中的各query进行商业价值预估以及点击率预估;根据各query商业价值的预估结果以及点击率的预估结果,得到所述候选query集合中各query的质量度。

根据本发明一优选实施例,所述在基于所述第二预设时段内的推广展现日志,对所述候选query集合中的各query进行商业价值预估时,针对各query分别执行:基于所述第二预设时段内的推广展现日志,获取第二预设时段内query所对应推广的平均出价;将第一预设时段内检索该query时返回推广的次数占检索总次数的百分比与所述第二预设时段内该query所对应推广的平均出价的乘积作为该query商业价值的预估结果。

根据本发明一优选实施例,所述在基于所述第二预设时段内的推广展现日志,对所述候选query集合中的各query进行点击率预估时,针对各query分别执行:提取该query的字面或语义特征中的至少一种作为该query的query特征;基于第二预设时段内的推广展现日志,提取该用户的行为特征;将所述用户的行为特征以及所述query特征作为输入数据,输入到点击率预估模型中;将点击率预估模型的输出值作为该query的点击率预估结果;其中,该点击率预估模型是预先使用历史query特征以及用户行为特征训练得到。

根据本发明一优选实施例,所述根据所述各query质量度的评估结果向用户推送推广信息包括:根据所述各query质量度的评估结果,确定目标query;获取目标query所对应的推广信息集合,并对所述推广信息集合中的推广信息进行排序;根据所述推广信息的排序结果,向用户推送推广信息。

根据本发明一优选实施例,所述根据所述各query质量度的评估结果,确定目标query包括:将质量度大于预设阈值的query作为目标query,或者将质量度排在前n个的query作为目标query,所述n为预设的正整数。

本发明为解决技术问题而采用的技术方案是提供一种推送推广信息的装置,所述装置包括:获取单元,用于根据用户标识,获取对应该用户的候选query集合以及第二预设时段内的推广展现日志;评估单元,用于基于所述第二预设时段内的推广展现日志,对所述候选query集合中各query的质量度进行评估;推送单元,用于根据所述各query质量度的评估结果,向用户推送推广信息;训练单元,用于利用第一预设时段内用户的检索日志和推广展现日志中至少一种预先训练得到候选query集合。

根据本发明一优选实施例,所述训练单元是采用如下方式预先离线训练得到候选query集合的:获取第一预设时段内用户的检索日志以及推广展现日志;基于所述第一预设时段内的检索日志,挖掘用户感兴趣的query集合;基于所述第一预设时段内的推广展现日志,对所述用户感兴趣的query集合中的各query进行商业价值预估;根据所述各query商业价值的预估结果,挑选商业价值大于预设阈值的query构成候选query集合。

根据本发明一优选实施例,所述推广展现日志包括:页面浏览日志以及推广日志;其中,所述页面浏览日志包括检索query的时间、检索用户的标识、检索返回的推广数以及点击检索结果所对应的query中的至少一种;所述推广日志包括推广的触发方式、query对应的推广是否被点击以及推广出价中的至少一种。

根据本发明一优选实施例,所述训练单元在基于所述第一预设时段内的推广展现日志,对所述用户感兴趣的query集合中的各query进行商业价值预估时,具体执行:依据query在第一预设时段内的被检索状况以及query所对应推广的出价状况,预估所述用户感兴趣的query集合中的各query的商业价值。

根据本发明一优选实施例,所述训练单元在预估所述用户感兴趣的query集合中的各query的商业价值时,具体执行:基于所述第一预设时段内的推广展现日志,得到第一预设时段内检索该query时返回推广的次数占检索总次数的百分比;基于所述第一预设时段内的推广展现日志,获取第一预设时段内该query所对应推广的平均出价;将检索该query时返回推广的次数占检索总次数的百分比以及该query所对应推广的平均出价的乘积作为该query商业价值的预估结果。

根据本发明一优选实施例,所述第二预设时段为:以当前时间为中心,取预设长度日期区间中的预设长度时间区间作为第二预设时段。

根据本发明一优选实施例,所述评估单元在基于所述第二预设时段内的推广展现日志,对所述候选query集合中各query的质量度进行评估时,具体执行:基于所述第二预设时段内的推广展现日志,对所述候选query集合中的各query进行商业价值预估以及点击率预估;根据各query商业价值的预估结果以及点击率的预估结果,得到所述候选query集合中各query的质量度。

根据本发明一优选实施例,所述评估单元在基于所述第二预设时段内的推广展现日志,对所述候选query集合中的各query进行商业价值预估时,针对各query分别执行:基于所述第二预设时段内的推广展现日志,获取第二预设时段内query所对应推广的平均出价;将第一预设时段内检索该query时返回推广的次数占检索总次数的百分比与所述第二预设时段内该query所对应推广的平均出价的乘积作为该query商业价值的预估结果。

根据本发明一优选实施例,所述评估单元在基于所述第二预设时段内的推广展现日志,对所述候选query集合中的各query进行点击率预估时,针对各query分别执行:提取该query的字面或语义特征中的至少一种作为该query的query特征;基于第二预设时段内的推广展现日志,提取该用户的行为特征;将所述用户的行为特征以及所述query特征作为输入数据,输入到点击率预估模型中;将所述点击率预估模型的输出值作为该query的点击率预估结果;其中,该点击率预估模型是预先使用历史query特征以及用户行为特征训练得到。

根据本发明一优选实施例,所述推送单元在根据所述各query质量度的评估结果,向用户推送推广信息时,具体执行:根据所述各query质量度的评估结果,确定目标query;获取目标query所对应的推广信息集合,并对所述推广信息集合中的推广信息进行排序;根据所述推广信息的排序结果,向用户推送推广信息。

根据本发明一优选实施例,所述推送单元在根据所述各query质量度的评估结果确定目标query时,具体执行:将质量度大于预设阈值的query作为目标query,或者将质量度排在前n个的query作为目标query,所述n为预设的正整数。

由以上技术方案可以看出,本发明通过推广展现日志,对用户候选query集合中的各query进行质量度评估,再根据query质量度的评估结果向用户推送推广信息,从而实现利用用户实际的搜索状况以及推广展现状况,灵活地向用户推送推广信息。

【附图说明】

图1为本发明一实施例提供的推送推广信息的方法流程图。

图2为本发明一实施例提供的推送推广信息的示意图。

图3为本发明一实施例提供的推送推广信息的装置结构图。

图4为本发明一实施例提供的计算机系统/服务器的框图。

【具体实施方式】

为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。

应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。

取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

传统的推广信息推送方法,即按照用户所属的标签,向用户推送对应该标签的推广信息,该种方法存在一定的局限性。因此本发明提供一种推送推广信息的方法、装置、设备和计算机存储介质,用于解决传统推广信息推送方法的局限性,通过推广展现日志,在线评估候选query集合中各query的质量度,进而根据各query的质量度向用户推送对应的推广信息,从而使得向用户所推送的推广信息更加精准丰富,且更能够符合用户近期的实际需要。在本发明中,query的中文含义为“检索词”。

其中,推广展现日志为推广信息系统在处理推广信息请求的过程中所保存的相关信息,包括页面浏览日志以及推广日志。其中,页面浏览日志记录页面浏览的粒度信息,页面浏览的粒度信息包括检索query的时间、检索用户的标识、检索返回的推广数以及点击检索结果所对应的query中的至少一种。而推广日志则记录检索所返回推广的粒度信息,检索所返回推广的粒度信息包括推广的触发方式、推广是否被点击以及推广出价中的至少一种。

在本发明中,推广展现日志分为第一预设时段内的推广展现日志以及第二预设时段内的推广展现日志。为了描述方便,在下文中使用在线推广展现日志表示第二预设时段内的推广展现日志,使用离线推广展现日志表示第一预设时段内的推广展现日志。其中,在线推广展现日志用于在线评估query的质量度,其存放在推广信息系统中的短期存储服务器中,根据用户标识对应不同用户的近期行为信息(例如几个星期);离线推广展现日志则用于离线训练候选query集合,其存放在推广信息系统中的长期存储服务器中,对应全部用户的长期行为信息(例如几年)。

图1为本发明一实施例提供的推送推广信息的方法流程图,如图1中所示,所述方法包括:

在101中,根据用户标识,获取对应该用户的候选query集合以及在线推广展现日志。

在本步骤中,用户标识代表用户的身份信息。可选地,在本实施例的一个具体实现过程中,用户标识可以为用户的账号信息,例如账号名称或者uid,也可以为用户所使用终端的设备号,还可以为用户的浏览器cookie。

在获取到对应用户的用户标识后,根据该用户标识,获取对应该用户的候选query集合以及在线推广展现日志,即根据用户的身份信息获取对应该用户的候选query集合以及在线推广展现日志。这是由于每个用户的搜索需求、搜索兴趣以及对推广信息的感兴趣程度不同,因此所得到的候选query集合以及在线推广展现日志也会因人而异,而为了确保向用户所推送的推广信息尽可能准确,所以需要根据用户标识对候选query集合以及在线推广展现日志进行区分,进而根据用户标识获取对应该用户的候选query集合以及在线推广展现日志。

其中,在线推广展现日志是根据用户标识访问推广信息系统中的短期存储服务器获取的在第二预设时段内的推广展现日志。具体地,第二预设时段由当前时间确定。优选地,可以以当前时间为中心取预设长度日期区间中的预设长度时间区间作为第二预设时段。举例来说,若当前时间为2017年5月7日上午11点18分,则第二预设时段可以为2017.04.07~2017.05.07的11:00~12:00,也可以为2017.04.07~2017.05.07的11:00~13:00,还可以为2017.03.07~2017.05.07的11:00~12:00。在本发明的实施例中,第二预设时段优选的预设长度日期区间为1个月,预设长度时间区间为1个小时。

在本步骤中,根据用户标识所获取的候选query集合是采用离线训练的方式预先得到的。可以理解的是,在离线训练得到候选query集合后,将所得到的候选query集合存储在推广信息系统的特定服务器或数据库中。当根据用户标识获取对应该用户的候选query集合时,便能够通过访问推广信息系统中特定服务器或者数据库的方式,根据用户标识获取对应该用户的候选query集合。

具体地,候选query集合可以采用如下离线训练方式预先得到:

首先获取第一预设时段内用户的检索日志以及推广展现日志。其中,用户的检索日志通过访问检索服务器获取,离线推广展现日志则通过访问推广信息系统的长期存储服务器获取。需要说明的是,在第一预设时段内所获取的检索日志以及推广展现日志对应全部用户,根据所获取的检索日志以及推广展现日志中用户的身份信息对不同的用户进行区分,进而获取对应每个用户的候选query集合。

其中,第一预设时段与第二预设时段不同,第二预设时段必须根据当前时间进行确定,而第一预设时段则是预先设置的。举例来说,第一预设时段可以预先设置为当前日期之前1个月以内的时段,例如当前日期为2017.05.07,则第一预设时段可以为2017.04.07~2017.05.07,也可以设置为当前日期其他值以内的时段,例如1个星期、2个星期或几天等。可以理解的是,由于离线推广展现日志存储有用户长期的行为信息,因此也可以根据用户实际需求将第一预设时段设置为任意一段日期,例如2016.05.07~2017.05.07。

基于所获取的检索日志,采用机器学习或数据挖掘的方式获取用户感兴趣的query。可选地,用户感兴趣的query可以为用户进行检索时所输入的query,还可以为用户在检索过程中点击的检索结果所对应的query。然后将所获取的用户感兴趣的各条query构成用户感兴趣的query集合。

在获取用户感兴趣的query集合后,基于离线推广展现日志,对用户感兴趣query集合中的各query进行商业价值预估,将用户感兴趣的query集合中商业价值小于预设阈值的query过滤掉,进而挑选出商业价值满足一定要求的query构成候选query集合。

在对query进行商业价值预估时,可以依据query在第一预设时段内的被检索状况以及该query所对应推广的出价状况确定。具体地,首先基于离线推广展现日志,得到第一预设时段内检索各query时返回推广的次数占检索总次数的百分比,该百分比表示有推广展现的检索query数量占全部检索query数量的比率(为了描述方便,使用pvr1(pageviewrate,页面浏览比率)表示该比率);然后再基于离线推广展现日志,获取第一预设时段内各query所对应推广的平均出价(为了描述方便,使用acb1(averageclickbid,平均点击出价)表示该平均出价)。将在第一预设时段内所得到的各query的pvr1与acb1相乘得到的乘积,作为该query商业价值的预估结果。

在得到用户感兴趣query集合中各query商业价值的预估结果后,根据各query所具有的商业价值,将商业价值大于预设阈值的query构成对应用户的候选query集合。例如,预设阈值可以为0,则将商业价值大于0的query构成对应用户的候选query集合,可以理解的是该预设阈值也可以根据实际需要设置为其他值。因此,使用离线训练的方式预先得到的候选query集合中的各query满足既符合用户的兴趣,也具有一定的商业价值的要求。

举例来说,若某用户感兴趣query集合中的一条query为“一天中最好的健身时间”,若该条query在第一预设时段内没有返回推广,则该条query的pvr1为0,进而确定该query的商业价值为0。若商业价值的预设阈值为0,而由于该条query的商业价值为0,则对应该用户的候选query集合中就不包含该条“一天中最好的健身时间”的query。若该条query在第一预设时段内有返回的推广,则该条query的pvr1不为0,若该条query的acb1也不为0,则确定该条query具有商业价值。由于该条query具有商业价值,则对应该用户的候选query集合中就包含有该条“一天中最好的健身时间”的query。

可以理解的是,在基于检索日志以及离线推广日志进行候选query集合的离线训练时,可以根据用户检索日志中或离线推广日志中所包含的用户身份信息,例如用户的账号信息、用户所使用终端的设备号或者用户的浏览器cookie中的至少一种,对离线训练得到的候选query集合进行区分,从而使得在进行在线预估时能够根据用户标识获取对应该用户的候选query集合。

在102中,基于所述在线推广展现日志,对所述候选query集合中的各query进行质量度评估。

在步骤101中,获取候选query集合以及在线推广展现日志后,基于在线推广展现日志对所得到的候选query集合中各query的质量度进行在线评估。在线评估所获取的候选query集合中各query的质量度的意义在于:由于每个query的出价会随着一天中不同时段的变化而变化,因此为了实现推广收益的最大化,需要实时地在线评估候选query集合中各query的质量度。

在本步骤中,对候选query集合中的各query进行的质量度评估包括两部分:预估候选query集合中各query的商业价值以及点击率。进而根据各query商业价值的预估结果以及点击率的预估结果,最终得到候选query集合中各query的质量度。

其中,基于在线推广展现日志对候选query集合中各query进行商业价值预估的具体步骤为:基于在线推广展现日志,获取第二预设时段内各query所对应推广的平均出价(为了描述方便,使用acb2表示该平均出价);然后将第一预设时段内所得到的pvr1与第二预设时段内所得到的acb2相乘得到的乘积,作为候选query集合中各query商业价值的预估结果。第二预设时段已在步骤101中描述,在此不再进行赘述。

基于在线推广展现日志,对候选query集合中各query进行点击率预估时,对各query分别执行:首先提取该query的字面或语义特征中的至少一种作为该query的query特征;然后基于第二预设时段内的推广展现日志,提取对应该用户的行为特征,例如用户会话特征;然后将该用户的行为特征以及该query的query特征进行组合,将组合后的数据作为输入到点击率预估模型中的输入数据;将点击率预估模型根据输入数据得到的输出结果,作为该query的点击率预估结果。在本步骤中,该点击率预估模型是预先使用历史query特征以及用户行为特征训练得到。可以理解的是,还可以进一步提取用户的属性特征,例如年龄、性别、兴趣等,将该属性特征与query特征以及用户行为特征组合输入到点击率预估模型,进行对该query的点击率预估。

其中,在使用历史query特征以及用户行为特征训练得到点击率预估模型时,具体步骤为:将历史query的query特征以及用户的行为特征组合形成输入数据,然后基于历史推广展现日志,将历史query所对应推广的点击结果设置为标签以作为输出数据,使用预设模型进行训练,例如逻辑回归模型,从而确定由输入数据得到输出数据的参数。可以理解的是,也可以使用深度学习的方式,通过对历史query特征和用户行为特征以及历史query对应推广的点击结果进行学习,得到相应的深度学习模型,在线评估时使用该深度学习模型即可进行query点击率的预估。

举例来说,若预设模型为函数y=f(x),其中x为输入数据,包括query特征以及用户行为特征;y为输出数据,表示某query对应推广的点击结果,例如若点击则设置为1,未点击则设置为0。通过对该模型的训练,确定使得由输入数据得到输出数据的函数关系。当在线评估时,将由候选query集合中的某条query所得到的query特征以及在线推广展现日志中所得到的用户行为特征组合作为输入数据x,输入到所获得的函数f(x)中,将得到的输出结果y作为该query的点击率预估结果。

在得到候选query集合中各query商业价值的预估结果以及点击率的预估结果后,按照预设方法将两者进行融合,例如使用多目标融合的方法进行融合,然后再根据融合结果得到候选query集合中各query的质量度。

在使用多目标融合的方法对各query商业价值的预估结果以及点击率的预估结果进行融合时,可以使用如下公式:

q=α·ctr+β·ecom_value+γ·ctr·ecom_value

在公式中:q为候选query集合中各query的质量度,α、β、γ为预设参数,ctr为query的点击率预估结果,ecom_value为query的商业价值预估结果。

在103中,根据所述各query质量度的评估结果,向用户推送推广信息。

在本步骤中,首先根据步骤102所得到的候选query集合中各query的质量度,确定目标query。所确定的目标query为向用户推送的推广消息所对应的query。在根据所得到的各query的质量度确定目标query时,可以为将质量度排在前n个的query作为目标query,也可以为将质量度大于预设阈值的query作为目标query。

在确定目标query后,获取目标query所对应的推广信息集合,然后使用传统的推广信息排序模型,例如使用推广点击率与推广出价相乘的形式,对所得到的推广信息集合中的推广信息进行排序,再根据推广信息的排序结果向用户推送推广信息。

举例来说,如图2中所示,在新闻类app中使用传统方法进行推广信息的推送时,若该用户的标签为“房地产”,则向用户推送的推广信息固定与房地产相关,如图2中a图方框中所示“装修得花多少钱,三秒出预算”的推广信息。而使用本发明所提供的技术方案,若该用户近期检索过“人才引进”的相关内容,则会在新闻类app中向用户推送与“人才引进”相关的推广信息,如图2中b图中方框所示的“2017人才引进条件-落户帮”的推广信息,从而使得向用户推送的推广信息更符合用户当前时段内的兴趣。

下面对本发明实施例提供的装置结构图进行详述。如图3中所示,所述装置包括:训练单元31、获取单元32、评估单元33以及推送单元34。

训练单元31,用于利用第一预设时段内用户的检索日志和推广展现日志中至少一种预先训练得到候选query集合。

训练单元31根据训练数据,使用离线训练的方式得到候选query集合。在得到候选query集合后,训练单元31将所得到的候选query集合存储在推广信息系统的特定服务器或数据库中。其中,训练单元31所使用的训练数据为第一预设时段内用户的检索日志以及推广展现日志中的至少一种。

具体地,训练单元31可以采用如下离线训练方式得到候选query集合:

首先训练单元31获取第一预设时段内用户的检索日志以及推广展现日志。其中,用户的检索日志通过访问检索服务器获取,离线推广展现日志则通过访问推广信息系统的长期存储服务器获取。需要说明的是,训练单元31在第一预设时段内所获取的检索日志以及推广展现日志对应全部用户,训练单元31可以根据所获取的检索日志以及推广展现日志中用户的身份信息对不同的用户进行区分,进而确定对应每个用户的候选query集合。

其中,第一预设时段是预先设置的。举例来说,第一预设时段可以预先设置为当前日期之前1个月以内的时段,例如当前日期为2017.05.07,则第一预设时段可以为2017.04.07~2017.05.07,也可以设置为当前日期其他值以内的时段,例如1个星期、2个星期或几天等。可以理解的是,由于离线推广展现日志存储有用户长期的行为信息,因此也可以根据用户实际需求将第一预设时段设置为任意一段日期,例如2016.05.07~2017.05.07。

训练单元31基于所获取的检索日志,采用机器学习或数据挖掘的方式获取用户感兴趣的query。可选地,用户感兴趣的query可以为用户进行检索时所输入的query,还可以为用户在检索过程中点击的检索结果所对应的query。然后训练单元31将所获取的用户感兴趣的各条query构成用户感兴趣的query集合。

训练单元31在获取用户感兴趣的query集合后,基于离线推广展现日志,对用户感兴趣query集合中的各query进行商业价值预估,将用户感兴趣的query集合中商业价值小于预设阈值的query过滤掉,进而挑选出具有商业价值或商业价值较高的query构成候选query集合。

训练单元31在对query进行商业价值预估时,可以依据query在第一预设时段内的被检索状况以及该query所对应推广的出价状况确定。具体地,训练单元31首先基于离线推广展现日志,得到第一预设时段内检索各query时返回推广的次数占检索总次数的百分比,该百分比表示有推广展现的检索query数量占全部检索query数量的比率(为了描述方便,使用pvr1(pageviewrate,页面浏览比率)表示该比率);然后训练单元31再基于离线推广展现日志,获取第一预设时段内各query所对应推广的平均出价(为了描述方便,使用acb1(averageclickbid,平均点击出价)表示该平均出价)。训练单元31将在第一预设时段内所得到的各query的pvr1与acb1相乘得到的乘积,作为该query商业价值的预估结果。

训练单元31在得到用户感兴趣query集合中各query商业价值的预估结果后,根据各query所具有的商业价值,将商业价值大于预设阈值的query构成对应用户的候选query集合。例如,预设阈值可以为0,则将商业价值大于0的query构成对应用户的候选query集合,该预设阈值也可以根据实际需要设置为其他值。因此,训练单元31使用离线训练的方式预先得到的候选query集合中的各query满足既符合用户的兴趣,也具有一定的商业价值的要求。

可以理解的是,训练单元31在基于检索日志以及离线推广日志进行候选query集合的离线训练时,可以根据用户检索日志中或离线推广日志中所包含的用户身份信息,例如用户的账号信息、用户所使用终端的设备号或者用户的浏览器cookie中的至少一种,对离线训练得到的候选query集合进行区分,从而使得在进行在线预估时能够根据用户标识获取对应该用户的候选query集合。

获取单元32,用于根据用户标识,获取对应该用户的候选query集合以及在线推广展现日志。

获取单元32所使用的用户标识代表用户的身份信息。可选地,在本实施例的一个具体实现过程中,用户标识可以为用户的账号信息,例如账号名称或者uid,也可以为用户所使用终端的设备号,还可以为用户的浏览器cookie。

获取单元32在得到对应用户的用户标识后,根据用户标识,获取对应该用户的候选query集合以及在线推广展现日志,即根据用户的身份信息获取对应该用户的候选query集合以及在线推广展现日志。这是由于每个用户的搜索需求、搜索兴趣以及对推广信息的感兴趣程度不同,因此所得到的候选query集合以及在线推广展现日志也会因人而异,而为了确保向用户所推送的推广信息尽可能准确,所以需要根据用户标识对候选query集合以及在线推广展现日志进行区分,进而根据用户标识获取对应该用户的候选query集合以及在线推广展现日志。

其中,候选query集合是由训练单元31预先训练得到的,获取单元32根据用户标识访问推广信息系统的特定服务器进行获取;在线推广展现日志是根据用户标识访问推广信息系统中的短期存储服务器获取的在第二预设时段内的推广展现日志。

具体地,第二预设时段与第一预设时段不同,第二预设时段是由当前时间确定的。优选地,可以以当前时间为中心取预设长度日期区间中的预设长度时间区间作为第二预设时段。举例来说,若当前时间为2017年5月7日上午11点18分,则第二预设时段可以为2017.04.07~2017.05.07的11:00~12:00,也可以为2017.04.07~2017.05.07的11:00~13:00,还可以为2017.03.07~2017.05.07的11:00~12:00。在本发明的实施例中,第二预设时段优选的预设长度日期区间为1个月,预设长度时间区间为1个小时。

评估单元33,用于基于所述在线推广展现日志,对所述候选query集合中的各query进行质量度评估。

获取单元32在获取候选query集合以及在线推广展现日志后,由评估单元33基于在线推广展现日志对所得到的候选query集合中各query的质量度进行在线评估。评估单元33在线评估所获取的候选query集合中各query的质量度的意义在于:由于每个query的出价会随着一天中不同时段的变化而变化,因此为了实现推广收益的最大化,需要由评估单元33实时地在线评估候选query集合中各query的质量度。

评估单元33对候选query集合中的各query进行的质量度评估包括两部分:预估候选query集合中各query的商业价值以及点击率。评估单元33进而根据各query商业价值的预估结果以及点击率的预估结果,最终得到候选query集合中各query的质量度。

其中,评估单元33基于在线推广展现日志对候选query集合中各query进行商业价值的预估时,具体执行:评估单元33基于在线推广展现日志,获取第二预设时段内各query所对应推广的平均出价(为了描述方便,使用acb2表示该平均出价);然后评估单元33将第一预设时段内所得到的pvr1与第二预设时段内所得到的acb2相乘得到的乘积,作为候选query集合中各query商业价值的预估结果。

评估单元33基于在线推广展现日志,对候选query集合中各query进行点击率预估的具体步骤为:评估单元33首先提取该query的字面或语义特征中的至少一种作为该query的query特征;然后基于第二预设时段内的推广展现日志,评估单元33提取对应该用户的行为特征,例如用户会话特征;然后评估单元33将该用户的行为特征以及该query的query特征进行组合,将组合后的数据作为输入到点击率预估模型中的输入数据;评估单元33将点击率预估模型根据输入数据得到的输出结果,作为该query的点击率预估结果。可以理解的是,评估单元33还可以进一步使用用户的属性特征,例如年龄、性别、兴趣等,将该属性特征与query特征以及用户行为特征组合输入到点击率预估模型,进行对该query的点击率预估。

评估单元33所使用的点击率预估模型是预先根据历史query特征以及用户行为特征训练得到。其中,在使用历史query特征以及用户行为特征训练得到点击率预估模型时,具体步骤为:将历史query的query特征以及用户的行为特征组合形成输入数据,然后基于历史推广展现日志,将历史query所对应推广的点击结果设置为标签以作为输出数据,使用预设模型进行训练,例如逻辑回归模型,从而确定由输入数据得到输出数据的参数。可以理解的是,也可以使用深度学习的方式,通过对历史query特征和用户行为特征以及历史query对应推广的点击结果进行学习,得到相应的深度学习模型,在线评估时使用该深度学习模型即可进行query点击率的预估。

在评估单元33得到候选query集合中各query商业价值的预估结果以及点击率的预估结果后,按照预设方法将两者进行融合,例如使用多目标融合的方法进行融合,然后再根据融合结果得到候选query集合中各query的质量度。

在使用多目标融合的方法对各query商业价值的预估结果以及点击率的预估结果进行融合时,可以使用如下公式:

q=α·ctr+β·ecom_value+γ·ctr·ecom_value

在公式中:q为候选query集合中各query的质量度,α、β、γ为预设参数,ctr为query的点击率预估结果,ecom_value为query的商业价值预估结果。

推送单元34,用于根据所述各query质量度的评估结果,向用户推送推广信息。

推送单元34首先根据评估单元33所得到的候选query集合中各query的质量度,确定目标query。推送单元34所确定的目标query为向用户推送的推广消息所对应的query。在推送单元34根据所得到的各query的质量度确定目标query时,可以为将质量度大于预设阈值的query作为目标query,也可以为将质量度排在前n个的query作为目标query,其中n为预设的正整数。

在确定目标query后,推送单元34获取目标query所对应的推广信息集合,然后使用传统的推广信息排序模型,例如使用推广点击率与推广出价相乘的形式,对所得到的推广信息集合中的推广信息进行排序,再根据推广信息的排序结果向用户推送推广信息。

图4示出了适于用来实现本发明实施方式的示例性计算机系统/服务器012的框图。图4显示的计算机系统/服务器012仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图4所示,计算机系统/服务器012以通用计算设备的形式表现。计算机系统/服务器012的组件可以包括但不限于:一个或者多个处理器或者处理单元016,系统存储器028,连接不同系统组件(包括系统存储器028和处理单元016)的总线018。

总线018表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(isa)总线,微通道体系结构(mac)总线,增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。

计算机系统/服务器012典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器012访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。

系统存储器028可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(ram)030和/或高速缓存存储器032。计算机系统/服务器012可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统034可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如cd-rom,dvd-rom或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线018相连。存储器028可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块042的程序/实用工具040,可以存储在例如存储器028中,这样的程序模块042包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块042通常执行本发明所描述的实施例中的功能和/或方法。

计算机系统/服务器012也可以与一个或多个外部设备014(例如键盘、指向设备、显示器024等)通信,在本发明中,计算机系统/服务器012与外部雷达设备进行通信,还可与一个或者多个使得用户能与该计算机系统/服务器012交互的设备通信,和/或与使得该计算机系统/服务器012能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口022进行。并且,计算机系统/服务器012还可以通过网络适配器020与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器020通过总线018与计算机系统/服务器012的其它模块通信。应当明白,尽管图中未示出,可以结合计算机系统/服务器012使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。

处理单元016通过运行存储在系统存储器028中的程序,从而执行各种功能应用以及数据处理,例如实现一种推送推广信息的方法,可以包括:

根据用户标识,获取对应该用户的候选query集合以及第二预设时段内的推广展现日志;

基于所述第二预设时段内的推广展现日志,对所述候选query集合中各query的质量度进行评估;

根据所述各query质量度的评估结果,向用户推送推广信息。

上述的计算机程序可以设置于计算机存储介质中,即该计算机存储介质被编码有计算机程序,该程序在被一个或多个计算机执行时,使得一个或多个计算机执行本发明上述实施例中所示的方法流程和/或装置操作。例如,被上述一个或多个处理器执行的方法流程,可以包括:

根据用户标识,获取对应该用户的候选query集合以及第二预设时段内的推广展现日志;

基于所述第二预设时段内的推广展现日志,对所述候选query集合中各query的质量度进行评估;

根据所述各query质量度的评估结果,向用户推送推广信息。

随着时间、技术的发展,介质含义越来越广泛,计算机程序的传播途径不再受限于有形介质,还可以直接从网络下载等。可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、rf等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

本发明所提供的技术方案,不仅适用于普通推广信息的推送,而且还适用于目前较为流行的feed流推广信息的推送,该feed流推广信息为信息流推广信息,主要表现为在新闻类app中的浏览信息中插入推广信息或在微信朋友圈中的好友动态中插入推广信息。

利用本发明所提供的技术方案,通过推广展现日志,对用户候选query集合中的各query进行质量度评估,再根据query质量度的评估结果向用户推送推广信息,从而实现利用用户实际的搜索状况以及推广展现状况,灵活地向用户推送推广信息。

在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1