信息推送对象更新方法、装置和计算机设备与流程

文档序号:18740412发布日期:2019-09-21 01:42阅读:116来源:国知局
信息推送对象更新方法、装置和计算机设备与流程

本申请涉及计算机技术领域,特别是涉及一种信息推送对象更新方法、装置、计算机可读存储介质和计算机设备。



背景技术:

随着计算机技术的发展,信息的传播和共享越来越快速。目前信息的传播可通过向特定人群推送的方式,该方式使得信息可以具有针对性地推送,以增加信息的曝光率。

然而,目前对信息的推送需要根据人群的需求不断调整推送对象,并且需要通过人工收集反馈数据以调整信息的推送对象。



技术实现要素:

基于此,有必要针对需要通过人工收集反馈数据以调整信息的推送对象的技术问题,提供一种自动调整推送对象的信息推送对象更新方法、装置、计算机可读存储介质和计算机设备。

一种信息推送对象更新方法,包括:

获取目标信息推送业务的第一标识集;

提取所述目标标识集中各标识对应的用户的特征,根据所述特征训练得到预测模型;

获取待选用户的标识和特征,将所述待选用户的特征输入到所述预测模型进行预测,得到所述待选用户的预测数值;

根据预测数值选取预设数量的待选用户的标识,得到待选标识集;

根据所述待选标识集更新所述目标信息推送业务的目标标识集。

一种信息推送更新装置,所述装置包括:

获取模块,用于获取目标信息推送业务的目标标识集;

训练模块,用于提取所述目标标识集中各标识对应的用户的特征,根据所述特征训练得到预测模型;

预测模块,用于获取待选用户的标识和特征,将所述待选用户的特征输入到所述预测模型进行预测,得到所述待选用户的预测数值;

选取模块,用于根据预测数值选取预设数量的待选用户的标识,得到待选标识集;

更新模块,用于根据所述待选标识集更新所述目标信息推送业务的目标标识集。

一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述任一项所述方法的步骤。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述任一项所述方法的步骤。

上述信息推送对象更新方法、装置、计算机可读存储介质和计算机设备,通过定时获取目标信息推送业务的目标标识集,并提取目标标识集中各标识对应的用户的特征,根据特征训练得到预测模型。通过获取待选用户的标识和特征,将待选用户的特征输入到预测模型进行预测,得到待选用户的预测数值。根据预测数值选取预设数量的待选用户的标识,得到待选标识集,根据待选标识集更新目标信息推送业务的目标标识集。本方案通过获取已投放的目标标识集,将已投放的目标标识集作为样本自动训练更新预测模型,以自动更新目标标识集,无需人工参与运营,从而实现目标信息推送对象的自动更新。

附图说明

图1为一个实施例中信息推送对象更新方法的应用环境图;

图2为一个实施例中信息推送对象更新方法的流程示意图;

图3为一个实施例中信息推送对象更新的界面示意图;

图4为一个实施例中得到待选用户的预测数值的步骤的流程示意图;

图5为一个实施例中训练得到预测模型步骤的流程示意图;

图6为一个实施例中检测正样本数量的步骤的流程示意图;

图7为一个实施例中对特征进行拼接处理的步骤的流程示意图;

图8为一个实施例中自动更新训练预测模型的示意图;

图9为一个实施例中更新目标标识集的步骤的流程示意图;

图10为一个实施例中自动更新推送对象的示意图;

图11为一个实施例中本方案与传统信息推送对象更新方式的对比示意图;

图12为一个实施例中信息推送对象更新装置的结构框图;

图13为一个实施例中计算机设备的结构框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

图1为一个实施例中信息推送对象更新方法的应用环境图。参照图1,该信息推送对象更新方法应用于信息推送对象更新系统。该信息推送对象更新系统包括终端110和服务器120。终端110和服务器120通过网络连接。终端110具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在本实施例中,终端110可获取目标信息推送业务的目标标识集,并提取目标标识集中各标识对应的用户的特征。接着,终端110将提取目标标识集中各标识对应的用户的特征发送给服务器120。服务器120接收终端110发送的特征,并根据该特征训练得到预测模型。接着,终端110获取待选用户和待选用户的标识,并提取待选用户的特征。终端110将待选用户的标识和对应的待选用户的特征发送给服务器120,服务器120接收待选用户的标识和特征,将特征输入到预测模型,通过预测模型预测得到待选用户的预测数值。终端110接收服务器120返回的待选用户的标识和对应的预测数值,根据预测数值选取预设数量的待选用户的标识,得到待选标识集。接着,终端110根据待选标识集更新目标信息推送业务的目标标识集。

在本实施例中,终端110可将待选用户的标识和对应的待选用户的特征发送给服务器120,由服务器120通过预测模型预测得到待选用户的预测数值,并由服务器120执行选取预设数量的待选用户的标识,得到待选标识集,以及更新目标信息推送业务的目标标识集的步骤。

在本实施例中,终端110可定时获取目标信息推送业务的目标标识集,并提取目标标识集中各标识对应的用户的特征,根据该特征训练得到预测模型。接着,终端110获取待选用户的标识和特征,将待选用户的特征输入到预测模型进行预测,得到待选用户的预测数值。终端110按照预测数值选取预设数量的待选用户的标识,得到待选标识集。接着,终端110根据待选标识集更新目标信息推送业务的目标标识集,得到更新后的目标标识集。通过定时获取已投放的目标标识集,将已投放的目标标识集作为样本自动训练更新预测模型,以自动更新目标标识集,无需人工参与运营,从而实现目标信息推送对象的自动更新。

如图2所示,在一个实施例中,提供了一种信息推送对象更新方法。本实施例主要以该方法应用于上述图1中的终端110(或服务器120)来举例说明。参照图2,该信息推送对象更新方法具体包括如下步骤:

步骤202,获取目标信息推送业务的目标标识集。

其中,目标信息推送业务是指需要推送给用户的信息。目标信息可以但不限于是广告、各领域新闻、资讯。推送的形式可以但不限于是文本、链接、视频和音频等。目标标识集为正在投放的包,该包中包括用户的标识,一个用户对应一个标识。用户的标识可以是用户的昵称、用户的账号标识等。

具体地,计算机设备可确定需要推送给用户的目标信息,并确定该项目标信息推送业务对应的目标标识集。

在本实施例中,当计算机设备接收到目标信息的推送指令时,获取该目标信息推送业务对应的目标标识集。

在本实施例中,获取目标信息推送业务的目标标识集,包括:定时获取目标信息推送业务的目标标识集。

具体地,计算机设备可实时监测当前的时间,并将当前的时间与预先设定的时间进行对比。当当前的时间与预先设定的时间相同时,计算机设备获取该项推送业务对应的目标标识集。

例如,预先设置每天0时0分0秒获取目标信息推送业务的目标标识集,则计算机设备实时监测当前的时间,当当前的时间达到0时0分0秒时,计算机设备获取该目标信息推送业务的目标标识集。

步骤204,提取该目标标识集中各标识对应的用户的特征,根据该特征训练得到预测模型。

其中,用户的特征可以是用户的属性信息、用户的个人兴趣和用户关注的垂直行业中的至少一个特征。

具体地,计算机设备确定目标标识集中各标识对应的用户,并提取每个标识对应的用户的特征。接着,计算机设备根据所提取的每个用户对应的特征训练预测模型,得到训练好的预测模型。

在本实施例中,计算机设备可获取目标标识集中各标识对应的用户的个人信息,从用户的个人信息中提取该用户的属性信息、个人兴趣和用户关注的垂直行业等特征。进一步地,计算机设备可从用户的注册信息以及用户的个性签名等信息中提取用户的特征。

步骤206,获取待选用户的标识和特征,将待选用户的特征输入到该预测模型进行预测,得到待选用户的预测数值。

其中,待选用户是指等待输入预测模型进行预测的用户,该待选用户可以是目标标识集中的标识对应的用户,也可以是非目标标识集中的标识对应的用户。预测数值是指待选用户通过预测模型预测后的得到的数值,该预测数值可以是分值或百分比等。

具体地,计算机设备获取待选用户的标识,并提取每个待选用户的特征。接着,计算机设备将每个待选用户的特征输入预测模型中进行预测,得到预测模型输出的每个待选用户对应的预测数值。

步骤208,根据预测数值选取预设数量的待选用户的标识,得到待选标识集。

其中,待选标识集是指被选取的各待选用户对应的标识的集合,该待选标识集中包括预设数量的待选用户的标识。

具体地,计算机设备可根据预测数值的大小,选取预设数量的待选用户的标识。进一步地,计算机设备可将每个待选用户对应的预测数值进行排序,从排序后的预测数值中选取预设数量的待选用户的标识,得到待选标识集。

在本实施例中,根据预测数值选取预设数量的待选用户的标识,得到待选标识集,包括:按照预测数值从高到低依次选取待选用户的标识,得到待选标识集,该待选标识集中包括预设数量的待选用户的标识。

具体地,计算机设备将每个待选用户对应的预测数值进行排序,获取需要选取的用户的预设数量,预设数量可以但不限于200、500或1000。该预设数量可根据需要推送的目标信息的需求进行调整。接着,计算机设备按照预测数值从高到低的顺序依次选择待选用户,得到预设数量的待选用户。进一步地,可将预测数值按照从高到低或者从低到高的方式进行排序,并从排序后的预测数值中从高到低依次选取待选用户,得到预设数量的待选用户。计算机设备获取所选取的预设数量的待选用户的标识,从而得到待选标识集,则该待选标识集中包括预设数量的标识。

步骤210,根据待选标识集更新目标信息推送业务的目标标识集。

具体地,计算机设备根据得到的待选标识集更新该目标信息推送业务的目标标识集,得到该目标信息推送业务的更新后的目标标识集。

上述信息推送对象更新方法,通过获取目标信息推送业务的目标标识集,提取目标标识集中各标识对应的用户的特征,根据特征训练得到预测模型。通过将目标信息推送给目标标识集中各标识对应的用户后,自动回收反馈数据。将提取反馈数据的特征训练预测模型,使得根据每次回收的反馈数据调整更新训练模型。接着获取待选用户的标识和特征,将待选用户的特征输入到预测模型进行预测,得到待选用户的预测数值。通过使用更新后的预测模型预测待选用户,使得预测的结果更准确。接着根据预测数值选取预设数量的待选用户的标识,得到待选标识集,并根据待选标识集更新目标信息推送业务的目标标识集。使得更新后的目标标识集增加了目标信息曝光的可能性。本方案通过获取已投放的目标标识集,将已投放的目标标识集作为样本自动训练更新预测模型,以自动更新目标标识集,无需人工参与运营,从而实现目标信息推送对象的自动更新。

在一个实施例中,在定时获取目标信息推送业务的目标标识集之前,该信息推送对象更新方法,还包括:获取初始训练样本;提取初始训练样本的特征,根据初始训练样本的特征训练得到预测模型;获取待选用户的标识和特征,将该待选用户的特征输入到该预测模型进行预测,得到该待选用户的预测数值;按照预测数值从高到低依次选取待选用户的标识作为目标标识,生成目标信息推送业务的目标标识集,该目标标识集中包括预设数量的目标标识;将目标信息推送给目标标识集中的标识。

其中,初始训练样本是指首次获取的训练样本,用于对构建的预测模型进行首次训练和测试。

具体地,计算机设备获取初始训练样本,并提取初始训练样本的特征。根据初始训练样本的特征对构建好的预测模型进行首次训练和测试,以得到训练好的预测模型。接着,计算机设备用训练好的预测模型对待选用户进行预测,得到每个待选用户的预测数值。接着,计算机设备按照预测数值从高到低依次选取待选用户的标识作为目标标识,生成目标信息推送业务的目标标识集,该目标标识集中包括预设数量的目标标识,从而首次生成目标信息的推送对象。接着,计算机设备将目标信息推送给目标标识集中的标识,从而实现目标信息的推送。

在本实施例中,该获取初始训练样本包括:基于画像索引方式获取初始训练样本。

其中,画像索引是指给用户创建的标签。画像索引方式包括以基础属性为标签或以兴趣为标签的人群,以位置信息为标签的人群,以使用某类应用程序为标签的人群,以浏览某类广告为标签的人群,以关键词为标签的人群。

具体地,计算机设备可基于画像索引方式获取初始训练样本。进一步地,计算机设备可获取以基础属性为标签或以兴趣为标签的人群,以位置信息为标签的人群,以使用某类应用程序为标签的人群,以浏览某类广告为标签的人群和以关键词为标签的人群的中的至少一种作为初始训练样本。

例如,计算机设备可基于使用网购应用程序的标签获取初始训练样本,则计算机设备获取标签为使用网购应用程序的用户作为初始训练样本。计算机设备基于喜欢美妆的标签获取初始训练样本,则计算机设备获取标签为喜欢美妆的用户作为初始训练样本。通过基于画像索引的方式获取初始训练样本,可扩大初始训练样本的选择范围,提供多种选择,以满足不同目标信息推送业务的需求。

在本实施例中,计算机设备可根据目标信息推送业务的类型设置选择初始训练样本的标签。例如,目标信息为美妆类的广告,则计算机设备可设置选择的用户标签为喜欢美妆或者其它与美妆相关的标签,以此选择与目标信息推送业务相关的初始训练样本。

在本实施例中,该获取初始训练样本包括:基于相似人群扩展方式获取初始训练样本。

其中,相似人群扩展方式是基于广告主提供的种子用户,例如已采集的用户样本或设备标识,通过特定的算法评估模型,寻找更多与种子用户存在潜在关联性的相似人群的技术。例如,目标信息为凉茶的推荐广告,则把凉茶的购买者作为种子用户,按照一些逻辑规律,如容易上火等,查找相关的群体,如压力大的工作人群、熬夜人群和火锅店的客人等。

具体地,计算机设备可获取目标标识集,并将目标标识集中各标识对应的用户作为种子用户,基于相似人群扩展方式查找与种子用户相关的人群作为初始训练样本。或者,计算机设备可获取已推送的目标信息,基于相似人群扩展方式查找与目标信息相关的其它信息推送业务的推送对象作为初始训练样本。通过基于相似人群扩展的方式获取初始训练样本,可获取与当前用户样本相关,或与推送的目标信息相关的用户作为初始训练样本,使得获取的初始训练样本与用户样本更相似,能够满足不同目标信息推送业务的需求。

在本实施例中,该获取初始训练样本包括:基于画像索引方式和基于相似人群扩展方式中的至少一种获取初始训练样本。

如图3所示,为一个实施例中信息推送对象更新的界面示意图。

具体地,投放日期是指目标信息推送给用户的时间。优化目标是指通过更新目标信息的推送对象能达到的目标。本实施例中的优化目标为点击率,即通过更新目标信息的推送对象,使得更多的推送对象能够点击目标信息,提高目标信息的点击率。种子人群为历史推送对象的标识对应的包。“XXA”和“XXB”为信息推送端的名称,“XXC”为要推送的目标信息的标识。用户可以勾选该信息推送平台的自动更新功能,并选择投放日期、在信息推送端输入需要推送的目标信息,以及该需要推送的目标信息对应的标识集。选择之后,该信息推送平台可自动获取已投放的目标信息对应的目标标识集更新预测模型,并自动更新目标标识集。

在一个实施例中,该定时获取目标信息推送业务的目标标识集,包括:从更新目标标识集后开始计时;当达到预设时长时,获取目标信息推送业务的目标标识集。

其中,预设时长是指从上次更新目标标识集到再次更新目标标识集的一段时间。该预设时长可根据需求调整,例如预设时长可以是一天、两天等。

具体地,计算机设备从更新目标标识集后开始计时,可实时检测目标标识集更新的时间。计算机设备获取预设时长,将检测的时间与预设时长进行比较,当检测到的时间小于预设时长时,计算机设备继续计时并继续实时监测。当检测到的时间达到预设时长时,计算机设备停止计时,并获取目标信息推送业务的目标标识集。通过从更新目标标识集后开始计时,当达到预设时长时,获取目标信息推送业务的目标标识集。使得在将目标信息推送给目标标识集的一段时间后,能够自动收集正在投放的目标标识集,以收集反馈数据,从而更好地调整目标信息的推送对象。

在一个实施例中,该获取目标信息推送业务的目标标识集,包括:自将目标信息推送给更新后的目标标识集起开始计时;当达到预设时长时,获取目标信息推送业务的目标标识集。

具体地,计算机设备将目标信息推送给更新后的目标标识集,从成功推送目标信息后开始计时。当将目标信息成功推送给更新后的目标标识集的时间达到预设时长时,计算机设备获取目标信息推送业务的目标标识集。通过自将目标信息推送给更新后的目标标识集起开始计时,当达到预设时长时,获取目标信息推送业务的目标标识集。使得在将目标信息推送给目标标识集的一段时间后,能够自动收集正在投放的目标标识集,以收集得到反馈数据,从而更好地调整目标信息的推送对象。

在一个实施例中,如图4所示,该将该待选用户的特征输入到该预测模型进行预测,得到该待选用户的预测数值,包括:

步骤402,根据该待选用户的特征确定该待选用户属于该预测模型中的各分类的概率。

具体地,计算机设备将待选用户的特征输入训练好的预测模型中。预测模型接收待选用户的特征,根据预测模型内部的已构建好的各分类,计算得到该待选用户属于各分类的概率。

步骤404,获取该预测模型中的各分类对应的权重。

步骤406,根据概率和权重,确定该待选用户的预测数值。

具体地,预测模型中的一个分类对应一个权重,每个分类对应的不同的权重。计算机设备获取该预测模型中的各分类对应的权重。接着,计算机设备根据每个分类对应的权重与待选用户属于各分类的概率计算得到每个待选用户的预测数值。

在本实施例中,计算机设备可将每个待选用户属于各分类的概率和各分类的权重加权求和,得到每个待选用户的预测数值。

在本实施例中,预测数值可以是分值,计算机设备计算得到每个待选用户属于预测模型中各分类的概率,并获取该预测模型中的各分类对应的权重。计算机设备将一个待选用户属于预测模型中各分类的概率和各分类对应的权重进行加权求和,得到该待选用户的预测分值。使用相同的方式对每个待选用户进行计算,可得到每个待选用户的预测分值。

上述信息推送对象更新方法,根据待选用户的特征确定待选用户属于预测模型中的各分类的概率,获取预测模型中的各分类对应的权重,根据概率和权重,确定待选用户的预测数值,从而能够快速准确地得到出每个待选用户的预测数值。

在一个实施例中,如图5所示,该提取该目标标识集中各标识对应的用户的特征,根据该特征训练得到预测模型,包括:

步骤502,将目标标识集中各标识对应的用户分类为正样本和负样本。

其中,正样本可以是点击了所推送的目标信息的用户,负样本可以是未点击所推送的目标信息的用户。

具体地,计算机设备获取目标标识集后,检测目标标识集中各标识对应的用户是否点击了所推送的目标信息。计算机设备根据用户是否点击了所推送的目标信息将用户进行分类。进一步地,计算机设备将点击了所推送的目标信息的用户作为正样本,将未点击所推送的目标信息的用户作为负样本。

步骤504,提取正样本的特征和负样本的特征,该正样本的特征和该负样本的特征包括用户的属性信息、个人兴趣和垂直行业中的至少一个。

其中,属性信息可包括年龄、性别、学历、职业和收入等。个人兴趣是指普遍的兴趣爱好,例如,喜欢跑步、喜欢看漫画和喜欢购物等等。垂直行业是指用户关注的具有专业性的行业,例如,关注金融行业,关注信息技术行业等。

具体地,计算机设备提取正样本用户的属性信息、个人兴趣和垂直行业中的至少一个特征。并提取负样本用户的属性信息、个人兴趣和垂直行业中的至少一个特征。

步骤506,根据正样本的特征和负样本的特征训练得到预测模型。

具体地,计算机设备根据分别提取的正样本和负样本的属性信息、个人兴趣和垂直行业中的特征训练预测模型,并根据每次训练的结果不断调整参数,以得到训练好的预测模型。

上述信息推送对象更新方法,通过将目标标识集中各标识对应的用户分类为正样本和负样本,提取正样本的特征和负样本的特征,根据正样本的特征和负样本的特征训练得到预测模型。根据正负样本训练模型,使得训练得到的预测模型区分度更高,预测更准确。

在一个实施例中,如图6所示,在该定时获取目标信息推送业务的目标标识集之后,还包括:

步骤602,检测目标标识集中各标识对应的用户为正样本的数量。

步骤604,将正样本的数量与预设样本数量对比。

其中,预设样本数量可以是预先设置的需要的正样本的数量。该预设样本数量小于目标标识集中各标识的数量。预设样本数量可以根据需求调整,例如预设样本数量可以为50、100或200等。

具体地,计算机设备定时获取目标信息推送业务的目标标识集之后,将目标标识集中各标识对应的用户分类为正样本和负样本,再检测正样本的用户的数量。接着,计算机设备获取预设样本数量,将正样本的数量与预设样本数量对比,以确定正样本的数量是否达到预设样本数量。

步骤606,当正样本的数量小于预设样本数量时,获取与该目标信息推送业务类型相同的信息推送业务对应的用户的特征。

其中,类型相同是指与目标信息推送业务属于同一类的信息推送业务,可以是同一行业、类似的信息素材或类似的信息推广计划等。例如,推送的目标信息为某个平台上的购物信息,则与该目标信息同类型的信息推送业务可以是其它购物平台上的购物信息。推送的信息为某种化妆品的广告,则同类型的信息为各类化妆品的广告,或者与该化妆品相同品牌、相同功能或者可搭配使用的广告等。

具体地,当计算机设备检测到正样本的数量小于预设样本数量时,表示在该段时间内没有收集到足够数量的反馈数据以更新训练模型。则计算机设备确定与该目标信息推送业务相同类型的信息推送业务,并获取该相同类型的信息推送业务对应的用户,以该相同类型的信息推送业务对应的用户作为补充的正样本。接着,计算机设备提取该相同类型的信息推送业务的推送用户的特征。

该提取该目标标识集中各标识对应的用户的特征,根据该特征训练得到预测模型,包括:

步骤608,提取目标标识集中各标识对应的用户的特征。

步骤610,根据目标标识集中各标识对应的用户的特征和该类型相同的信息推送业务对应的用户的特征训练得到预测模型。

具体地,计算机设备确定目标标识集中各标识对应的用户,并提取每个标识对应的用户的特征。接着,计算机设备根据所提取的每个用户对应的特征和类型相同的信息推送业务对应的用户的特征训练预测模型,得到训练好的预测模型。

例如,预设样本数量为100,目标信息是A品牌的化妆品推荐广告,将该目标信息推送给目标标识集中的各标识对应的用户后,经过一段时间,计算机设备收集获取该目标标识集。计算机设备检测目标标识集中各标识对应的用户进行分类后得到的正样本数量为80,正样本的数量小于预设样本数量,表示收集到的反馈数据不够。则计算机设备可检测该A品牌的其它化妆品的广告,以确定该A品牌的其它化妆品的广告对应的标识集。并从该标识集中获取20个与目标标识集不相同的标识作为补充的正样本。接着,计算机设备提取该20个标识对应的用户的属性类型、个人兴趣和垂直行业这三类特征,并分别提取目标标识集中的正样本和负样本的用户的属性类型、个人兴趣和垂直行业三类特征。将20个标识对应的用户的特征作为正样本的特征,与目标标识集中的80个正样本的特征,以及目标标识集中负样本的特征一起输入到预测模型中,以训练预测模型,从而得到训练好的预测模型。

上述信息推送对象更新方法,通过检测获取的目标标识集中各标识对应的用户为正样本的数量是否达到预设样本数量,以确定是否收集到充足的反馈数据。当正样本的数量小于预设样本数量时,表示收集到的正样本数量不充分,则可以通过与该目标信息推送业务相同类型的信息推送业务对应的推送对象作为正样本的补充数据,从而能够获取到数量充足的训练样本。

在一个实施例中,该预测模型包括因子分解机模型和集成树模型;该根据该特征训练得到预测模型,包括:通过因子分解机模型对该特征进行特征转换和特征拼接处理;将因子分解机模型的输出输入到集成树模型进行模型训练,得到预测模型。

其中,因子分解机(Factorization Machine,简称FM)模型对稀疏的数据具有很好的学习能力,能够将一些高维的离散的特征向量实现降维,从而得到连续的低维的特征向量。集成树模型(eXtreme Gradient Boosting,简称xgboost模型)是一种基于梯度提升算法的模型,通过对目标函数进行二阶泰勒展开,并根据一阶导数和二阶导数信息来拟合残差,得到新的目标函数。再通过构建多棵树,并定义每棵树的复杂度结构部分和叶子权重部分,并将其作为正则项加入到新的目标函数中。然后通过贪心算法获取最优切分点进行划分,直到满足某个阈值或得到纯节点时停止划分,以构建集成树模型。

具体地,该预测模型包括因子分解机模型和集成树模型。计算机设备提取目标标识集中的各标识对应的用户的特征后,将目标标识集中的各标识对应的用户的特征输入到预测模型中的因子分解机模型中。因子分解机模型接收到用户的特征,将用户的特征进行特征转化,得到每个特征对应的特征向量。接着,因子分解机模型将每个用户的特征对应的特征向量进行拼接处理,得到每个用户对应的拼接后的特征向量,因子分解机模型输出每个用户对应的拼接后的特征向量。接着,因子分解机模型将输出的每个用户对应的拼接后的特征向量传输给集成树模型。集成树模型接收每个用户对应的拼接后的特征向量,根据拼接后的特征向量进行模型训练,并多次调整模型的参数进行重复训练,最终得到满足预设准确率要求的预测模型。

上述信息推送对象更新方法,通过因子分解机模型对特征进行特征转换和特征拼接处理,将因子分解机模型的输出输入到集成树模型进行模型训练,得到预测模型,使得得到的预测模型更准确,识别度更高。

在一个实施例中,该通过因子分解机模型对该特征进行特征转换,包括:将目标标识集中的每个标识对应的用户的特征与预设特征分别进行匹配;将与每个标识对应的用户的特征相匹配的预设特征的特征向量,作为每个标识对应的特征向量。

其中,预设特征是指预先设置的特征词,每个特征词对应一个特征向量。

具体地,计算机设备选择目标标识集中的任意一个标识对应的用户,并选取该用户的任一特征与预设特征进行匹配。当匹配成功时,获取该匹配成功的预设特征对应的特征向量,将该特征向量作为所选取的特征对应的特征向量。接着,计算机设备按照相同的方式选取该用户的其余特征进行匹配,可得到该用户的每个特征对应的特征向量,从而得到该用户的标识对应的多个特征向量。针对每个用户的每个特征执行相同的匹配操作,从而得到每个用户的标识对应的特征向量,一个用户的标识对应的特征向量的数量与该用户的特征数量相同。通过将提取的特征与预设特征进行匹配,将预设特征的特征向量作为匹配成功的用户特征对应的特征向量,能够将文本特征转化为对应的数值向量,从而实现特征转换处理。

在一个实施例中,计算机设备可将用户的特征分类为离散型特征和连续型特征,并通过独热编码方式对用户的离散型特征编码,以得到离散型特征对应的特征向量。其中,离散型特征是指具有至少两个分类取值的特征。例如,“性别”该特征有“男性”和“女性”两种取值。连续性特征是指具有一定规律变化的特征,例如“身高”,人的身高是逐渐增加的,属于连续型特征。独热编码即One-Hot编码,又称一位有效编码,独热编码针对的是离散型特征,它是使用N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位处于有效状态1,其余的都为0。例如,独热编码0001,0100,0010,0001。比如,“性别”这个特征包含有两个属性值:男性和女性,男性用1表示,女性用2表示,进行独热编码后,这一特征则被一分为二:男性=[0,1],女性=[1,0]。经过独热编码后,可以得到离散型特征的特征向量,并且得到的特征向量为低维的连续的特征向量。

在一个实施例中,如图7所示,通过该因子分解机模型对该特征进行特征拼接处理,包括:

步骤702,针对该目标标识集中任一标识,获取该标识对应的特征向量中的第一维特征向量。

其中,第一维特征向量是指一些预设特征对应的高维的离散的特征向量。例如,预设特征中的用户关注的垂直行业为金融行业,该金融行业对应的特征向量为第一维特征向量。

具体地,一个标识可以对应一个用户的三个特征,并且一个特征对应一个特征向量,则一个标识可对应三个特征向量。计算机设备获取目标标识集中各标识对应的特征向量。针对每一个标识,计算机设备将每个标识对应的特征向量进行分类,分类第一维特征向量和非第一维特征向量。计算机设备提取特征向量为第一维特征向量的预设特征,确定与该提取的预设特征相匹配的目标标识集中各标识对应的用户的特征,即可确定与该提取的预设特征相匹配的用户的特征对应的特征向量为第一维特征向量。接着,计算机设备获取目标标识集中各标识对应的特征向量中的第一维特征向量。

步骤704,将第一维特征向量进行降维处理,得到第二维特征向量,该第二维特征向量的维度小于该第一维特征向量的维度。

其中,第二维特征向量是指由第一维特征向量经过降维处理得到的低维的连续的特征向量,因此第二维特征向量的维度小于该第一维特征向量的维度。

具体地,计算机设备通过因子分解机模型将获取的第一维特征向量进行降维处理。因子分解机模型根据将第一维特征向量映射到低维连续空间中,以将高维的离散的特征向量转化为低维的连续的特征向量,从而得到每个第一维特征向量对应的第二维特征向量。

步骤706,将该第二维特征向量与该标识对应的特征向量中除第一维特征向量外的其余特征向量进行拼接处理。

具体地,计算机设备将获取目标标识集中的一个标识对应的特征向量,以获取该特征向量中的第一维特征向量对应的第二维特征向量。接着,计算机设备通过因子分解机模型将该标识对应的第二维特征向量和除第一维特征向量以外的其余特征向量进行拼接,得到拼接后的一个特征向量。经过拼接处理后,一个标识对应一个拼接后的特征向量。接着,按照相同的处理方式,将每个标识对应的第二维特征向量和除第一维特征向量以外的其余特征向量进行拼接,得到每个标识对应的拼接后的特征向量。因子分解机模型输出每个标识对应的经过拼接处理后的特征向量。

上述信息推送对象更新方法,通过针对所述目标标识集中任一标识,获取所述标识对应的特征向量中的第一维特征向量,将第一维特征向量进行降维处理,得到第二维特征向量。能够将高维的离散的特征向量转化为低维的连续的特征向量,保留了第一维特征向量中的关键信息,去除了非关键信息,从而降低了由于高维的离散的特征向量中的冗余信息所造成的误差。将所述第二维特征向量与所述标识对应的特征向量中除第一维特征向量外的其余特征向量进行拼接处理,将多个特征向量整合一个特征向量,从而将多个关键信息整合到一个向量中,提高模型识别的精度。

在一个实施例中,因子分解机模型将第二维特征向量与该标识对应的特征向量中除第一维特征向量外的其余特征向量进行拼接处理,包括:因子分解机模型将第二维特征向量与该标识对应的特征向量中除第一维特征向量外的其余特征向量按照行向量方向进行拼接处理。

具体地,计算机设备将获取目标标识集中的一个标识对应的特征向量,以获取该特征向量中的第一维特征向量对应的第二维特征向量。接着,计算机设备通过因子分解机模型将该标识对应的第二维特征向量和除第一维特征向量以外的其余特征向量按照行向量方向进行拼接,得到拼接后的一个特征向量。接着,按照相同的处理方式,将每个标识对应的第二维特征向量和除第一维特征向量以外的其余特征向量按照行向量方向进行拼接,得到每个标识对应的拼接后的特征向量。因子分解机模型输出每个标识对应的按照行向量方向进行拼接处理后的特征向量。通过将特征向量按照行向量方向进行拼接,使得能够将多个特征向量整合一个特征向量,从而将多个关键信息整合为一个关键信息,提高处理的效率。

例如,一个标识对应的第二维特征向量为[345],该标识对应的除第一维特征向量以外的其余特征向量为[12],[768]。则因子分解机模型按照行向量方向将三个特征向量进行拼接处理,得到长向量[34512768]。

如图8所示,为一个实施例中自动更新训练预测模型的示意图。如图8所示,稀疏特征1和稀疏特征2的特征向量为高维特征向量,需要降维处理的特征。密集特征3的特征向量为低维特征向量,不需要降维。预测模型中的因子分解机模型将提取的用户的特征通过独热编码的方式得到每个特征对应的特征向量。由于一些特征是稀疏的,得到的特征向量为高维的离散的特征向量。高维的离散的特征向量较复杂,计算过程更繁琐,并且容易增大误差。为了减小计算的误差,因子分解机模型将特征向量中的高维的离散的特征向量映射到低维的连续的空间中,以实现降维,从而得到低维的连续的特征向量。w0、wi、wj、vi和vj为降维后的特征向量。接着,因子分解机模型将一个用户降维得到的低维的连续的特征向量与不需要降维处理的其它特征向量按照行向量方向进行拼接处理。因子分解机模型将拼接处理后的特征向量输出给集成树模型。集成树模型中存在至少两棵树,集成树模型将接收的特征向量进行组合,每棵树采用不同的特征向量的组合方式,并定义每棵树的复杂度结构部分和叶子权重部分。再通过特定算法获取最优切分点进行划分,直到满足某个阈值或得到纯节点时停止划分。通过多次训练并调解参数,得到集成树模型最终的参数,从而实现预测模型的自动更新训练。

在一个实施例中,该根据该待选标识集更新该目标信息推送业务的目标标识集,包括:确定待选标识集和目标标识集中不相同的标识;将目标标识集中不相同的标识替换为待选标识集中不相同的标识。

具体地,计算机设备将待选标识集中的各标识和目标标识集中的各标识一一对比,确定两个标识集中不相同的标识。接着,计算机设备获取待选标识集中与目标标识集中的标识不相同的标识,并用待选标识集中的不相同的标识替换目标标识集中的不相同的标识,从而得到新的目标标识集。通过确定两个标识集中的不相同的标识,并用待选标识集中的不相同的标识替换目标标识集中不相同的标识,从而实现了目标信息推送业务的推送对象的更新。并且只需要替换不相同的标识,实现了数据的增量更新,并提高了数据处理的效率。

在一个实施例中,如图9所示,该根据该待选标识集更新该目标信息推送业务的目标标识集,包括:

步骤902,确定待选标识集和目标标识集中不相同的标识,该目标标识集中不相同的标识为第一标识,该待选标识集中不相同的标识为第二标识。

具体地,计算机设备将待选标识集中的各标识和目标标识集中的各标识一一对比,确定两个标识集中不相同的标识。将目标标识集中存在的与待选标识集中的标识不相同的各标识作为第一标识,该待选标识集中存在的与目标标识集中的标识不相同的各标识作为第二标识。

步骤904,确定第一标识的数量。

步骤906,选取与第一标识的数量相同的第二标识。

步骤908,将该第一标识替换为数量相同的第二标识。

具体地,计算机设备确定第一标识的数量,并选取与第一标识的数量相同的第二标识。接着,计算机设备将目标标识集中的第一标识替换为数量相同的第二标识,以实现目标标识集的更新。

上述信息推送对象更新方法,通过确定两个标识集中不相同的标识,并确定目标标识集中不相同的标识的数量,再从待选标识集的不相同的标识中选取数量相同的标识替换目标标识集中不相同的标识,从而更新了目标信息推送业务的推送对象。并且,只替换不相同的标识,并不需要替换所有的标识,实现数据的增量更新,并使得更新前后的目标信息推送业务的推送对象的数量保持不变。

在一个实施例中,该选取与该第一标识的数量相同的第二标识,包括:按照预测数值从高到低依次选取第二标识以替换第一标识,该选取的第二标识的数量与第一标识的数量相同。

具体地,计算机设备将目标标识集中存在的与待选标识集中的标识不相同的各标识作为第一标识,该待选标识集中存在的与目标标识集中的标识不相同的各标识作为第二标识。接着,计算机设备获取各第二标识对应的用户的预测数值,将各个第二标识对应的预测数值进行排序。进一步地,计算机设备可将各个第二标识对应的预测数值按照从高到低或者从低到高的方式排序。接着,计算机设备确定第一标识的数量,并按照预测数值从高到低依次选取第二标识,所选取的第二标识的数量与第一标识的数量相同。接着,计算机设备用选取的第二标识替换第一标识,以实现目标标识集的更新。通过将待选标识集中的第二标识按照对应的预测数值排序,并从高到低依次选取第二标识以替换第一标识,以增加曝光目标信息的可能性。并且第二标识的数量与第一标识的数量相同,并使得更新前后的目标信息推送业务的推送对象的数量保持不变。

在一个实施例中,该信息推送对象更新方法还包括:获取更新后的目标标识集中的各标识的状态,该状态包括登录状态和未登录状态;将目标信息推送给更新后的目标标识集中处于登录状态的标识。

其中,登录状态是指标识对应的用户终端处于在线状态。未登录状态是指标识对应的用户终端处于离线状态。

具体地,计算机设备获取更新后的目标标识集,并检测更新后的目标标识集中的各标识的状态。计算机设备通过检测确定更新后的目标标识集中处于登录状态的标识和处于非登录状态的标识。接着,计算机设备将目标信息推送给该更新后的目标标识集中处于登录状态的标识对应的用户终端。对于处于非登录状态的标识,计算机设备不推送目标信息。通过检测更新后的目标标识集中的各标识的状态,以确定各标识对应的用户终端是否处于在线状态,并给在线状态的用户终端推送目标信息,以增加目标信息的曝光度。处于非登录状态的标识不推送目标信息,能够避免目标信息的浪费曝光。

在一个实施例中,该信息推送对象更新方法还包括:检测更新后的目标标识集中的各标识的最近一次登录的时间,当标识的最近一次登录的时间在预设时间内时,推送目标信息。

其中,预设时间可以是从目标标识集更新的时间起,将时间向前推算预设天数后所得到的一段时间,该预设天数可以是三天、五天或七天等。例如,目标标识集更新的时间为2019-05-25,预设天数为3天,则预设时间为2019-05-22至2019-05-25该段时间内。

具体地,计算机设备获取更新后的目标标识集,检测该目标标识集更新的时间。接着,计算机设备检测更新后的目标标识集中各标识的最近一次登录的时间,将各标识的最近一次登录的时间与预设时间进行对比,以确定各标识的最近一次登录的时间是否在预设时间内。当标识的最近一次登录的时间在预设时间内时,将目标信息推送给该标识对应的用户终端。当标识的最近一次登录的时间未在预设时间内时,不推送目标信息。通过检测更新后的目标标识集中的各标识的最近一次登录的时间是否在预设时间内,以判断标识对应的用户终端登录的可能性。当标识的最近一次登录的时间在预设时间内时,表示该标识对应的用户浏览该目标信息的可能性较大,则可推送目标信息,以增加目标信息的曝光度,有利于目标信息的传播。当标识的最近一次登录的时间未在预设时间内时,表示该标识对应的用户短时间内可能不会登录,则无需推送目标信息,避免目标信息的无效传播。

如图10所示,为一个实施例中自动更新推送对象的示意图。首先,计算机设备根据标签为基础属性或兴趣的人群、使用应用程序的人群、定位信息得到的人群、历史推送广告信息的人群、关键词对应的人群和基于相似人群扩展算法获得的人群中获取初始训练样本,并通过初始训练样本训练和测试构建的预测模型。通过训练好的预测模型对待选用户进行预测,得到每个待选用户的预测数值。接着,计算机设备按照预测数值从高到低依次选取待选用户的标识,生成目标信息推送业务的目标标识集,该目标标识集中包括预设数量的待选用户的标识,从而首次生成目标信息的推送对象。接着,计算机设备将目标信息推送给目标标识集中的标识。接着,经过一段时间的投放后,计算机设备定时获取该目标信息推送业务的目标标识集,将投放的目标标识集作为反馈数据。将目标标识集中点击了目标信息的用户作为正样本,未点击目标信息的用户作为负样本。接着,计算机设备选取正样本和负样本的特征,将正负样本的特征进行特征转化和特征拼接处理,根据处理的特征对预测模型进行训练,以更新预测模型。接着,计算机设备使用更新后的预测模型对待选用户进行预测,得到待选用户的预测数值。并按照预测数值从高到低依次选取前N个待选用户的标识,组成待选标识集,再根据待选标识集更新该目标信息推送业务的目标标识集。并通过定时收集目标标识集作为反馈数据以自动更新预测模型,从而实现目标信息的推送对象的自动更新。

在一个实施例中,提供了一种信息推送对象更新方法,该方法包括:

计算机设备基于画像索引方式和基于相似人群扩展方式中的至少一种获取初始训练样本。

接着,计算机设备提取初始训练样本的特征,根据初始训练样本的特征训练得到预测模型。

接着,计算机设备获取待选用户的标识和特征,将该待选用户的特征输入到该预测模型进行预测,得到该待选用户的预测数值。

接着,计算机设备按照预测数值从高到低依次选取待选用户的标识,生成目标信息推送业务的目标标识集,该目标标识集中包括预设数量的待选用户的标识。

进一步地,计算机设备将目标信息推送给目标标识集中的标识。

接着,计算机设备从将目标信息推送给目标标识集中的标识起开始计时。

接着,当达到预设时长时,计算机设备获取目标信息推送业务的目标标识集。

接着,计算机设备提取该目标标识集中各标识对应的用户的特征,通过因子分解机模型将该目标标识集中的每个标识对应的用户的特征与预设特征分别进行匹配。

进一步地,计算机设备将与该每个标识对应的用户的特征相匹配的预设特征的特征向量,作为该每个标识对应的特征向量。

接着,针对该目标标识集中任一标识,计算机设备通过因子分解机模型获取该标识对应的特征向量中的第一维特征向量。

接着,计算机设备通过因子分解机模型将该第一维特征向量进行降维处理,得到第二维特征向量,该第二维特征向量的维度小于该第一维特征向量的维度。

进一步地,计算机设备通过因子分解机模型将该第二维特征向量与该标识对应的特征向量中除第一维特征向量外的其余特征向量进行拼接处理。

接着,计算机设备将该因子分解机模型的输出输入到该集成树模型进行模型训练,得到预测模型。

接着,计算机设备获取待选用户的标识和特征,根据该待选用户的特征确定该待选用户属于该预测模型中的各分类的概率。

接着,计算机设备获取该预测模型中的各分类对应的权重。

进一步地,计算机设备根据该概率和权重,确定该待选用户的预测数值。

接着,计算机设备根据预测数值选取预设数量的待选用户的标识,得到待选标识集。

接着,计算机设备确定该待选标识集和该目标标识集中不相同的标识,该目标标识集中不相同的标识为第一标识,该待选标识集中不相同的标识为第二标识。

接着,计算机设备确定该第一标识的数量;选取与该第一标识的数量相同的第二标识。

进一步地,计算机设备按照预测数值从高到低依次选取第二标识以替换该第一标识,该选取的第二标识的数量与该第一标识的数量相同。

接着,计算机设备获取更新后的目标标识集中的各标识的状态,该状态包括登录状态和未登录状态。

接着,计算机设备将目标信息推送给该更新后的目标标识集中处于登录状态的标识。

上述信息推送对象更新方法,通过基于画像索引和基于相似人群扩展的方式获取初始训练样本,可扩大初始训练样本的选择范围,提供多种选择,以满足不同目标信息推送业务的需求。并根据训练样本训练得到预测模型,根据预测模型预测待选用户,生成目标标识集,将目标信息推送给目标标识集,实现目标信息的推送。

在将目标信息推送给目标标识集的一段时间后,能够定时收集正在投放的目标标识集,以收集反馈数据,从而更好地调整目标信息的推送对象。

通过将提取的特征与预设特征进行匹配,将预设特征的特征向量作为匹配成功的用户特征对应的特征向量,能够将文本特征转化为对应的数值向量,从而实现特征转换处理。

通过针对所述目标标识集中任一标识,获取所述标识对应的特征向量中的第一维特征向量,将所述第一维特征向量进行降维处理,得到第二维特征向量。能够将高维的离散的特征向量转化为低维的连续的特征向量,保留了第一维特征向量中的关键信息,去除了非关键信息,从而降低了由于高维的离散的特征向量中的冗余信息所造成的误差。将所述第二维特征向量与所述标识对应的特征向量中除第一维特征向量外的其余特征向量进行拼接处理,将多个特征向量整合一个特征向量,从而将多个关键信息整合到一个向量中,提高模型识别的精度。

根据待选用户的特征确定待选用户属于预测模型中的各分类的概率,获取预测模型中的各分类对应的权重,根据概率和权重,确定待选用户的预测数值,从而能够快速准确地得到出每个待选用户的预测数值。

通过确定两个标识集中不相同的标识,并确定目标标识集中不相同的标识的数量,再从待选标识集的不相同的标识中选取数量相同的标识替换目标标识集中不相同的标识,从而更新了目标信息推送业务的推送对象。

通过将待选标识集中的第二标识按照对应的预测数值排序,并从高到低依次选取第二标识以替换第一标识,以增加曝光目标信息的可能性。并且,只替换不相同的标识,并不需要替换所有的标识,实现数据的增量更新,并使得更新前后的目标信息推送业务的推送对象的数量保持不变。

通过检测更新后的目标标识集中的各标识的状态,以确定各标识对应的用户终端是否处于在线状态,并给在线状态的用户终端推送目标信息,以增加目标信息的曝光度。处于非登录状态的标识不推送目标信息,能够避免目标信息的浪费曝光。

本方案通过定时获取已投放的目标标识集,将已投放的目标标识集作为样本自动训练更新预测模型,以自动更新目标标识集,无需人工参与运营,从而实现目标信息推送对象的自动更新。

如图11所示,为一个实施例中本方案与传统的信息推送及对象更新方式的对比示意图。其中,左边为传统的广告投放周期和优化周期的流程图,包括:投放-收集反馈-洞察分析-修正定向-推送-再次投放。右边为本方案基于自动更新的推送对象的流程图,包括:投放-收集反馈-生成新标识集-替换-投放。传统的方案是广告主在提取推送对象的标识集之后会在投放端将该标识集绑定广告进行投放,通常情况下,该标识集在整个投放过程中一直是静态的,也就是标识集里包含的用户群体是不变的。如果广告主想优化这个过程,通常的做法是根据该标识集在线上投放的效果收集反馈数据,即用户的曝光点击情况,然后对有正向行为的用户进行分析和洞察,以获取更加符合目标人群的定向条件,以此来修正原始的人群定向条件,并用新的定向条件来提取一个新的标识集,然后继续推送到投放端绑定广告进行投放。整个优化过程需要很长的时间,而且里面的每个步骤都需要广告主或者运营人员的参与。

而本方案是广告主使用现有人群定向方式,可以是基于画像索引的标签人群提取、应用程序人群提取、定位信息人群提取、广告人群提取、关键词人群提取和基于相似人群扩展算法提取,生成目标标识集,然后将该目标标识集推送到投放端绑定广告后进行投放,之后信息推送对象更新系统会持续收集该目标标识集的投放效果反馈数据,使用广告曝光后点击用户作为正样本,曝光后未点击用户作为负样本,然后分别提取正负样本用户的特征,并进行特征转换和特征拼接,之后输入到预测模型以训练更新预测模型。再获取待选用户,用训练好的预测模型对每个待选用户进行打分,使用打分值从高到低选出指定数量的用户,得到待选标识集。该待选标识集中标识的数量与首次生成的目标标识集中标识的数量相同。再将该待选标识集推送到投放端替换原始在投的目标标识集进行投放,即相当于生成同等大小的新标识集替换原始在投的标识集。然后经过一段时间的投放再次进行整个自动更新的过程。由此可知,本方案相对于传统的方案能够实现自动收集反馈数据,并根据反馈数据自动训练更新预测模型,从而实现信息推送对象的自动更新。并且在本方案的整个投放更新过程,除了初始人群是广告主或者运营人员进行提取和投放,后续过程都是信息推送对象更新系统自动完成的,无需人工参与,并且更新周期短能够快速生效。

在一个实施例中,本方案还可基于画像索引自动更新信息的推送对象。因为基于画像索引方式提取的人群标识集依赖于用户画像的构建,而画像数据会随着数据源的更新而更新,这样就可以针对相同的人群定向提取条件,周期性的提取新的标识集,替换现有在投的标识集。例如,目标信息为推荐XX游戏的相关广告,正在投放的标识集为标签为“XX游戏迷”的用户人群。在XX游戏的相关广告推送给用户的这段时间内,一些用户可能不再关注该XX游戏,一些用户可能开始关注该XX游戏,则标签为“XX游戏迷”的用户人群就发生了变化。计算机设备可定时获取标签为“关注XX”的用户人群,得到新的标识集,并利用该新的标识集替换正在投放的标识集,从而根据实现画像索引自动更新信息的推送对象。

图2-图9为一个实施例中信息推送对象更新方法的流程示意图。应该理解的是,虽然图2-图9的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-图9中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图12所示,提供了一种信息推送更新装置,该装置包括:获取模块1202、训练模块1204、预测模块1206、选取模块1208和更新模块1210。其中,

获取模块1202,用于获取目标信息推送业务的目标标识集。

训练模块1204,用于提取目标标识集中各标识对应的用户的特征,根据特征训练得到预测模型。

预测模块1206,用于获取待选用户的标识和特征,将待选用户的特征输入到预测模型进行预测,得到待选用户的预测数值。

选取模块1208,用于根据预测数值选取预设数量的待选用户的标识,得到待选标识集。

更新模块1210,用于根据待选标识集更新目标信息推送业务的目标标识集。

上述信息推送对象更新装置,通过获取目标信息推送业务的目标标识集,提取目标标识集中各标识对应的用户的特征,根据特征训练得到预测模型。通过将目标信息推送给目标标识集中各标识对应的用户后,自动回收反馈数据。将提取反馈数据的特征训练预测模型,使得根据每次回收的反馈数据调整更新训练模型。接着获取待选用户的标识和特征,将待选用户的特征输入到预测模型进行预测,得到待选用户的预测数值。通过使用更新后的预测模型预测待选用户,使得预测的结果更准确。接着根据预测数值选取预设数量的待选用户的标识,得到待选标识集,并根据待选标识集更新目标信息推送业务的目标标识集。使得更新后的目标标识集增加了目标信息曝光的可能性。本方案通过获取已投放的目标标识集,将已投放的目标标识集作为样本自动训练更新预测模型,以自动更新目标标识集,无需人工参与运营,从而实现目标信息推送对象的自动更新。

在一个实施例中,该获取模块1202还用于:从更新目标标识集后开始计时;当达到预设时长时,获取目标信息推送业务的目标标识集。通过从更新目标标识集后开始计时,当达到预设时长时,获取目标信息推送业务的目标标识集。使得在将目标信息推送给目标标识集的一段时间后,能够自动收集正在投放的目标标识集,以收集反馈数据,从而更好地调整目标信息的推送对象。

在一个实施例中,预测模块1206还用于:根据该待选用户的特征确定该待选用户属于该预测模型中的各分类的概率;获取该预测模型中的各分类对应的权重;根据概率和权重,确定该待选用户的预测数值。上述信息推送对象更新装置,根据待选用户的特征确定待选用户属于预测模型中的各分类的概率,获取预测模型中的各分类对应的权重,根据概率和权重,确定待选用户的预测数值,从而能够快速准确地得到出每个待选用户的预测数值。

在一个实施例中,训练模块1204还用于:将目标标识集中各标识对应的用户分类为正样本和负样本;提取正样本的特征和负样本的特征,该正样本的特征和该负样本的特征包括用户的属性信息、个人兴趣和垂直行业中的至少一个;根据正样本的特征和负样本的特征训练得到预测模型。通过将目标标识集中各标识对应的用户分类为正样本和负样本,提取正样本的特征和负样本的特征,根据正样本的特征和负样本的特征训练得到预测模型。根据正负样本训练模型,使得训练得到的预测模型区分度更高,预测更准确。

在一个实施例中,获取模块1202还用于:检测目标标识集中各标识对应的用户为正样本的数量;将正样本的数量与预设样本数量对比;当正样本的数量小于预设样本数量时,获取与该目标信息推送业务类型相同的信息推送业务对应的用户的特征;

该训练模块1204还用于:提取目标标识集中各标识对应的用户的特征;根据目标标识集中各标识对应的用户的特征和该类型相同的信息推送业务对应的用户的特征训练得到预测模型。

上述信息推送对象更新装置,通过检测获取的目标标识集中各标识对应的用户为正样本的数量是否达到预设样本数量,以确定是否收集到充足的反馈数据。当正样本的数量小于预设样本数量时,表示收集到的正样本数量不充分,则可以通过与该目标信息推送业务相同类型的信息推送业务对应的推送对象作为正样本的补充数据,从而能够获取到数量充足的训练样本。

在一个实施例中,该预测模型包括因子分解机模型和集成树模型;该训练模块1204还用于:通过因子分解机模型对该特征进行特征转换和特征拼接处理;将因子分解机模型的输出输入到集成树模型进行模型训练,得到预测模型。通过因子分解机模型对特征进行特征转换和特征拼接处理,将因子分解机模型的输出输入到集成树模型进行模型训练,得到预测模型,使得得到的预测模型更准确,识别度更高。

在一个实施例中,该训练模块1204还用于:将目标标识集中的每个标识对应的用户的特征与预设特征分别进行匹配;将与每个标识对应的用户的特征相匹配的预设特征的特征向量,作为每个标识对应的特征向量。通过将提取的特征与预设特征进行匹配,将预设特征的特征向量作为匹配成功的用户特征对应的特征向量,能够将文本特征转化为对应的数值向量,从而实现特征转换处理。

在一个实施例中,该训练模块1204还用于:针对该目标标识集中任一标识,获取该标识对应的特征向量中的第一维特征向量;将第一维特征向量进行降维处理,得到第二维特征向量,该第二维特征向量的维度小于该第一维特征向量的维度;将该第二维特征向量与该标识对应的特征向量中除第一维特征向量外的其余特征向量进行拼接处理。通过针对所述目标标识集中任一标识,获取所述标识对应的特征向量中的第一维特征向量,将所述第一维特征向量进行降维处理,得到第二维特征向量。能够将高维的离散的特征向量转化为低维的连续的特征向量,保留了第一维特征向量中的关键信息,去除了非关键信息,从而降低了由于高维的离散的特征向量中的冗余信息所造成的误差。将所述第二维特征向量与所述标识对应的特征向量中除第一维特征向量外的其余特征向量进行拼接处理,将多个特征向量整合一个特征向量,从而将多个关键信息整合到一个向量中,提高模型识别的精度。

在一个实施例中,该更新模块1210还用于:确定待选标识集和目标标识集中不相同的标识;将目标标识集中不相同的标识替换为待选标识集中不相同的标识。通过确定两个标识集中的不相同的标识,并用待选标识集中的不相同的标识替换目标标识集中不相同的标识,从而实现了目标信息推送业务的推送对象的更新。并且只需要替换不相同的标识,实现了数据的增量更新,并提高了数据处理的效率。

在一个实施例中,该更新模块1210还用于:确定待选标识集和目标标识集中不相同的标识,该目标标识集中不相同的标识为第一标识,该待选标识集中不相同的标识为第二标识;确定第一标识的数量;选取与第一标识的数量相同的第二标识;将该第一标识替换为数量相同的第二标识。通过确定两个标识集中不相同的标识,并确定目标标识集中不相同的标识的数量,再从待选标识集的不相同的标识中选取数量相同的标识替换目标标识集中不相同的标识,从而更新了目标信息推送业务的推送对象。并且,只替换不相同的标识,并不需要替换所有的标识,实现数据的增量更新,并使得更新前后的目标信息推送业务的推送对象的数量保持不变。

在一个实施例中,该更新模块1210还用于:按照预测数值从高到低依次选取第二标识以替换第一标识,该选取的第二标识的数量与第一标识的数量相同。通过将待选标识集中的第二标识按照对应的预测数值排序,并从高到低依次选取第二标识以替换第一标识,以增加曝光目标信息的可能性。并且第二标识的数量与第一标识的数量相同,并使得更新前后的目标信息推送业务的推送对象的数量保持不变。

在一个实施例中,该装置还包括:推送模块。该推送模块用于:获取更新后的目标标识集中的各标识的状态,该状态包括登录状态和未登录状态;将目标信息推送给更新后的目标标识集中处于登录状态的标识。通过检测更新后的目标标识集中的各标识的状态,以确定各标识对应的用户终端是否处于在线状态,并给在线状态的用户终端推送目标信息,以增加目标信息的曝光度。处于非登录状态的标识不推送目标信息,能够避免目标信息的浪费曝光。

图13示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的终端110(或服务器120)。如图13所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现信息推送对象更新方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行信息推送对象更新方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图13中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,本申请提供的信息推送对象更新装置可以实现为一种计算机程序的形式,计算机程序可在如图13所示的计算机设备上运行。计算机设备的存储器中可存储组成该信息推送对象更新装置的各个程序模块,比如,图12所示的获取模块1202、训练模块1204、预测模块1206、选取模块1208和更新模块1210。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的信息推送对象更新方法中的步骤。

例如,图13所示的计算机设备可以通过如图12所示的信息推送对象更新装置中的获取模块1202执行定时获取目标信息推送业务的目标标识集的步骤。计算机设备可通过训练模块1204执行提取目标标识集中各标识对应的用户的特征,根据特征训练得到预测模型的步骤。计算机设备可通过预测模块1206执行获取待选用户的标识和特征,将待选用户的特征输入到预测模型进行预测,得到待选用户的预测数值的步骤。计算机设备可通过选取模块1208执行按照预测数值从高到低依次选取待选用户的标识作为目标标识,得到待选标识集,待选标识集中包括预设数量的目标标识的步骤。计算机设备可通过更新模块1210执行根据待选标识集更新目标信息推送业务的目标标识集的步骤。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述信息推送对象更新方法的步骤。此处信息推送对象更新方法的步骤可以是上述各个实施例的信息推送对象更新方法中的步骤。

在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述信息推送对象更新方法的步骤。此处信息推送对象更新方法的步骤可以是上述各个实施例的信息推送对象更新方法中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1