一种预测用户频次的方法及装置与流程

文档序号:12064600阅读:257来源:国知局
一种预测用户频次的方法及装置与流程

本发明涉及网络技术领域,特别涉及一种预测用户频次的方法及装置。



背景技术:

随着互联网占据了人们日常生活越来越多的比重,互联网广告也得到了飞速的发展。如果从广告的目的作为区分标准,互联网广告可以分为:品牌广告和效果广告。效果广告主要目的是促进消费行为,评价指标通常为CPA(Cost Per Action,每次行动成本)指标:点击、下载、注册、电话、在线咨询,或者购买等;品牌广告主要目的是建立品牌知名度,提升品牌影响力,评价指标通常为:TA(Target Audiences,目标受众)和N+UV(user view,用户频次),用户频次主要是指用户在一定时间内的使用次数。例如:用户在一天内使用优酷播放器播放视频的次数,用户在一周内浏览目标网站的次数等。

如果能够预测出一段时间中的用户频次,可以根据预测出的用户频次,对用户流量进行最佳分配,进行广告投放,能够大大提高用户流量的收益。现有技术无法预测用户频次。



技术实现要素:

本发明实施例提供了一种预测用户频次的方法及装置,能够预测用户频次。

一方面,本发明实施例提供了一种预测用户频次的方法,包括:

设置至少一个用户类别,设置所述用户类别与用户频次的对应关系;

设置每个所述用户类别对应的目标预测模型;

包括:

获取目标用户的特征数据;

根据所述目标用户的特征数据和每个所述目标预测模型,预测所述目标用户所属的目标用户类别;

根据所述对应关系,确定所述目标用户类别对应的用户频次;

将所述目标用户类别对应的用户频次作为所述目标用户的用户频次。

进一步地,所述设置每个用户类别对应的目标预测模型,包括:

设置每个所述用户类别对应的初始预测模型;

获取样本用户的特征数据和用户频次;

根据每个所述样本用户的用户频次和所述对应关系,确定每个所述样本用户所属的用户类别;

根据各个所述样本用户的特征数据和各个所述样本用户所属的用户类别,对每个所述初始预测模型进行训练,获取每个所述用户类别对应的目标预测模型。

进一步地,所述设置每个所述用户类别对应的初始预测模型,包括:

设置每个所述用户类别对应的初始预测函数,其中,当前用户类别对应的所述初始预测函数为:

其中,θTx=θ01x1+,...,+θixi+,...,+θnxn,θi为第i个特征权重,x为当前样本用户的特征数据向量,x=(x1,x2,...,xj,...,xn),xj为所述当前样本用户的第j个特征数据;h(x)为所述当前样本用户属于所述当前用户类别的概率,在所述当前样本用户属于所述当前用户类别时,h(x)为1;在所述当前样本用户不属于所述当前用户类别时,h(x)为0;

所述根据各个所述样本用户的特征数据和各个所述样本用户所属的用户类别,对每个所述初始预测模型进行训练,获取每个所述用户类别对应的目标预测模型,包括:

根据各个所述样本用户的特征数据和各个所述样本用户所属的用户类别,确定每个所述初始预测函数中的每个特征权重;

根据每个所述用户类别对应的所述初始预测函数中的每个特征权重,确定每个所述用户类别对应的目标预测函数,其中,当前用户类别对应的目标预测函数为:

其中,θTy=θ01y1+,...,+θiyi+,...,+θnyn,θi为所述当前用户类别对应的初始预测函数中的第i个特征权重,y为所述目标用户的特征数据向量,y=(y1,y2,...,yj,...,yn),yj为所述目标用户的第i个特征数据,H(y)为所述目标用户属于所述当前用户类别的概率;

所述根据所述目标用户的特征数据和每个所述目标预测模型,预测所述目标用户所属的目标用户类别,包括:

根据所述目标用户的特征数据和每个所述目标预测函数,确定每个所述目标预测函数对应的预测概率;

将各个所述预测概率中最大的目标预测概率对应的用户类别作为所述目标用户类别。

进一步地,所述根据各个所述样本用户的特征数据和各个所述样本用户所属的用户类别,确定每个所述初始预测函数中的每个特征权重,包括:

根据各个所述样本用户的特征数据和各个所述样本用户所属的用户类别,确定在当前初始预测函数的权重确定参数取最大值时的所述当前初始预测函数的每个特征权重,其中,

其中,l(θ)为所述当前初始预测函数的权重确定参数,m为所述样本用户的数量,x(k)为第k个样本用户的特征数据向量,当所述第k个样本用户属于所述当前初始预测函数对应的用户类别时,z(k)=1,当所述第k个样本用户不属于所述当前初始预测函数对应的用户类别时,z(k)=0。

进一步地,所述特征数据,包括:用户cookie、访问时间、访问次数、属性标签、登录时间分布、访问间隔分布、访问时间的均值、访问时间的方差、访问次数的均值、访问次数的方差中的一个或多个。

进一步地,在所述将所述目标用户类别对应的用户频次作为所述目标用户的用户频次之后,进一步包括:

根据所述目标用户的用户频次、至少一个广告主的控频要求和预设原则,针对所述目标用户投放所述至少一个广告主的广告,其中,所述预设原则包括:满足最多的广告主的控频要求,所述广告主的控频要求包括:所述广告主的广告最少被所述目标用户浏览预设值次。

另一方面,本发明实施例提供了一种预测用户频次的装置,包括:

第一设置单元,用于设置至少一个用户类别,设置所述用户类别与用户频次的对应关系

第二设置单元,用于设置每个所述用户类别对应的目标预测模型;

目标获取单元,用于获取目标用户的特征数据;

预测单元,用于根据所述目标用户的特征数据和每个所述目标预测模型,预测所述目标用户所属的目标用户类别;

频次确定单元,用于根据所述对应关系,确定所述目标用户类别对应的用户频次,将所述目标用户类别对应的用户频次作为所述目标用户的用户频次。

进一步地,所述第二设置单元,包括:

设置子单元,用于设置每个所述用户类别对应的初始预测模型;

样本获取子单元,用于获取样本用户的特征数据和用户频次;

样本类别确定子单元,用于根据每个所述样本用户的用户频次和所述对应关系,确定每个所述样本用户所属的用户类别;

训练子单元,用于根据各个所述样本用户的特征数据和各个所述样本用户所属的用户类别,对每个所述初始预测模型进行训练,获取每个所述用户类别对应的目标预测模型。

进一步地,所述设置子单元,用于设置每个所述用户类别对应的初始预测函数,其中,当前用户类别对应的所述初始预测函数为:

其中,θTx=θ01x1+,...,+θixi+,...,+θnxn,θi为第i个特征权重,x为当前样本用户的特征数据向量,x=(x1,x2,...,xj,...,xn),xj为所述当前样本用户的第j个特征数据;h(x)为所述当前样本用户属于所述当前用户类别的概率,在所述当前样本用户属于所述当前用户类别时,h(x)为1;在所述当前样本用户不属于所述当前用户类别时,h(x)为0;

所述训练子单元,用于根据各个所述样本用户的特征数据和各个所述样本用户所属的用户类别,确定每个所述初始预测函数中的每个特征权重;根据每个所述用户类别对应的所述初始预测函数中的每个特征权重,确定每个所述用户类别对应的目标预测函数,其中,当前用户类别对应的目标预测函数为:

其中,θTy=θ01y1+,...,+θiyi+,...,+θnyn,θi为所述当前用户类别对应的初始预测函数中的第i个特征权重,y为所述目标用户的特征数据向量,y=(y1,y2,...,yj,...,yn),yj为所述目标用户的第i个特征数据,H(y)为所述目标用户属于所述当前用户类别的概率;

所述预测单元,用于根据所述目标用户的特征数据和每个所述目标预测函数,确定每个所述目标预测函数对应的预测概率,将各个所述预测概率中最大的目标预测概率对应的用户类别作为所述目标用户类别。

进一步地,所述训练子单元,在执行所述根据各个所述样本用户的特征数据和各个所述样本用户所属的用户类别,确定每个所述初始预测函数中的每个特征权重时,用于根据各个所述样本用户的特征数据和各个所述样本用户所属的用户类别,确定在当前初始预测函数的权重确定参数取最大值时的所述当前初始预测函数的每个特征权重,其中,

其中,l(θ)为所述当前初始预测函数的权重确定参数,m为所述样本用户的数量,x(k)为第k个样本用户的特征数据向量,当所述第k个样本用户属于所述当前初始预测函数对应的用户类别时,z(k)=1,当所述第k个样本用户不属于所述当前初始预测函数对应的用户类别时,z(k)=0。

进一步地,所述特征数据,包括:用户cookie、访问时间、访问次数、属性标签、登录时间分布、访问间隔分布、访问时间的均值、访问时间的方差、访问次数的均值、访问次数的方差中的一个或多个。

进一步地,该装置进一步包括:

广告投放单元,用于根据所述目标用户的用户频次、至少一个广告主的控频要求和预设原则,针对所述目标用户投放所述至少一个广告主的广告,其中,所述预设原则包括:满足最多的广告主的控频要求,所述广告主的控频要求包括:所述广告主的广告最少被所述目标用户浏览预设值次。

在本发明实施例中,设置每个用户类别对应的目标预测模型,将目标用户的特征数据输入到每个目标预测模型中,确定出目标用户的目标用户类别,将目标用户类别对应的用户频次作为目标用户的用户频次,实现对目标用户的用户频次的预测。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一实施例提供的一种预测用户频次的方法的流程图;

图2是本发明一实施例提供的另一种预测用户频次的方法的流程图;

图3是本发明一实施例提供的又一种预测用户频次的方法的流程图;

图4是本发明一实施例提供的一种预测用户频次的装置的示意图;

图5是本发明一实施例提供的另一种预测用户频次的装置的示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,本发明实施例提供了一种预测用户频次的方法,该方法可以包括以下步骤:

步骤101:设置至少一个用户类别,设置所述用户类别与用户频次的对应关系;

步骤102:设置每个所述用户类别对应的目标预测模型;

步骤103:获取目标用户的特征数据;

步骤104:根据所述目标用户的特征数据和每个所述目标预测模型,预测所述目标用户所属的目标用户类别;

步骤105:根据所述对应关系,确定所述目标用户类别对应的用户频次;

步骤106:将所述目标用户类别对应的用户频次作为所述目标用户的用户频次。

在本发明实施例中,设置每个用户类别对应的目标预测模型,将目标用户的特征数据输入到每个目标预测模型中,确定出目标用户的目标用户类别,将目标用户类别对应的用户频次作为目标用户的用户频次,实现对目标用户的用户频次的预测。

为了更加准确地预测用户频次,在本发明一实施例中,所述设置每个用户类别对应的目标预测模型,包括:

设置每个所述用户类别对应的初始预测模型;

获取样本用户的特征数据和用户频次;

根据每个所述样本用户的用户频次和所述对应关系,确定每个所述样本用户所属的用户类别;

根据各个所述样本用户的特征数据和各个所述样本用户所属的用户类别,对每个所述初始预测模型进行训练,获取每个所述用户类别对应的目标预测模型。

在本发明实施例中,根据样本用户的特征数据和用户类别,对预设的每个初始预测模型进行训练,得到每个初始预测模型对应的目标预测模型,这里的目标预测模型是基于样本用户的特征数据训练得到,在进行目标用户的用户频次的预测时,能够得到更加准确的预测结果。

为了进一步准确地预测用户频次,在本发明一实施例中,所述获取样本用户的特征数据和用户频次,包括:

获取所述样本用户在第一时间周期内的特征数据,以及在第二时间周期内的用户频次,其中,所述第一时间周期在所述第二时间周期之前,且所述第一时间周期与所述第二时间周期之间相隔预设值个时间周期;

所述获取目标用户的特征数据,包括:

获取所述目标用户在目标时间周期内的特征数据,其中,所述目标时间周期在待预测时间周期之前,且所述目标时间周期与所述待预测时间周期之间相隔所述预设值个时间周期;

所述将所述目标用户类别对应的用户频次作为所述目标用户的用户频次,包括:

将所述目标用户类别对应的用户频次作为所述目标用户在所述待预测时间周期的用户频次。

在本发明实施例中,预先划分出多个时间周期,在训练初始预测模型时,利用第一时间周期内的特征数据和第二时间周期内的用户频次来训练初始预测模型,对于第二时间周期来说,第一时间周期内的特征数据是历史数据,对于待预测时间周期来说,目标时间周期的特征数据是历史数据,而且第二时间周期与第一时间周期的时间间隔等于待预测时间周期与目标时间周期的时间间隔,用来训练初始预测模型的数据与用来预测目标用户的特征数据在时间上具有相似性,因此,能够提高预测的准确性。举例来说,在训练初始预测模型时,采用样本用户在1月份的特征数据和3月份的用户频次,为了提高预测的准确性,在预测目标用户的用户频次时,由于待预测时间周期为8月份,为了与训练时的数据在时间上具有相似性,采用目标用户在6月份的特征数据来进行预测处理,二者在时间间隔上相同。

在本发明一实施例中,所述获取样本用户的特征数据和用户频次,包括:

从目标服务器中获取用户访问日志,从所述用户访问日志中提取所述样本用户的特征数据和用户频次;

所述获取目标用户的特征数据,包括:

从所述目标服务器中获取所述目标用户的用户访问日志,从所述目标用户的用户访问日志中提取所述目标用户的特征数据。

在本发明实施例中,目标服务器可以是网络播放器的服务器,例如:优酷的服务器、腾讯视频的服务器等,也可以是软件的服务器,例如:微信的服务器、淘宝软件的服务器等,也可以是网站的服务器,例如:新浪网站、腾讯网站等。从目标服务器中的用户访问日志中提取出样本用户的特征数据和用户频次,通过这些数据训练得到的目标预测模型可以用于对目标服务器中的目标用户进行用户频次的预测。

举例来说,为了在腾讯视频中投放广告,从腾讯视频的服务器获取用户访问日志,从用户访问日志中提取样本用户在1月份的特征数据和3月份的用户频次,通过这些数据训练得到各个目标预测模型;从腾讯视频的服务器获取目标用户的用户访问日志,从目标用户的用户访问日志中提取目标用户在6月份的特征数据,利用这些特征数据和各个目标预测模型,预测目标用户在8月份的用户频次,根据用户频次可以在8月份针对目标用户投放广告。例如:预测出目标用户在8月份的用户频次为4次,也就是预测出目标用户在8月份会使用4次腾讯视频,有2个广告主需要在腾讯视频中投放广告,每个广告主都要求广告被至少看到2次,这时,可以在8月份,针对该目标用户分别投放每个广告主的广告2次。

在本发明一实施例中,所述特征数据,包括:用户cookie、访问时间、访问次数、属性标签、登录时间分布、访问间隔分布、访问时间的均值、访问时间的方差、访问次数的均值、访问次数的方差中的一个或多个。

在本发明实施例中,可以通过用户cookie来标识每个用户,属性标签可以包括:用户的性别、年龄、所在地等信息。这些特征数据可以通过清洗日志来获取,并针对清洗日志后得到的初步特征数据,确定各个初步特征数据的统计指标,并将各个初步特征数据的统计指标和初步特征数据作为特征数据。这里的统计指标包括:均值、方差等。

在本发明一实施例中,在所述将所述目标用户类别对应的用户频次作为所述目标用户的用户频次之后,进一步包括:

根据所述目标用户的用户频次、至少一个广告主的控频要求和预设原则,针对所述目标用户投放所述至少一个广告主的广告,其中,所述预设原则包括:满足最多的广告主的控频要求,所述广告主的控频要求包括:所述广告主的广告最少被所述目标用户浏览预设值次。

在本发明实施例中,在预测出目标用户的用户频次后,将预测出的用户频次用于针对该目标用户投放广告,在投放广告时,按照预设原则进行投放,能够实现对用户频次的最佳分配,能够最大化用户流量的收益。

举例来说,有三个广告主,分别是广告主A、广告主B和广告主C,他们的控频要求分别是:控频为3、控频为1、控频为2,其中,广告主的控频为a是指要求用户至少看到n次该广告主的广告。通过本发明实施例预测出目标用户在下一周内在腾讯视频的用户频次为4次,也就是说,用户在下一周内会使用腾讯视频4次。按照预设原则,针对目标用户进行投放广告的方式为:投放广告主A的广告和广告主B的广告。这样能够满足2个广告主的控频要求。如果不按照预设原则进行投放,可以通过以下方式进行投放广告:投放广告主A的广告和广告主C的广告,在这种情况下,由于二者需要共被目标用户流量5次,因此,只能满足一个广告主,比按照预设原则进行投放的用户流量的收益低。

如图2所示,本发明实施例提供了一种预测用户频次的方法,该方法可以包括以下步骤:

步骤201:设置至少一个用户类别,设置用户类别与用户频次的对应关系。

举例来说,用户频次为用户在一个月内的使用次数,例如用户在一个月内的使用腾讯视频的使用次数。设置4个用户类别,该对应关系为:用户类别1对应用户频次小于等于2次;用户类别2对应用户频次等于3次;用户类别3对应用户频次等于4次;用户类别4对应用户频次大于等于5次。

步骤202:设置每个用户类别对应的初始预测模型。

步骤203:获取样本用户的特征数据和用户频次。

具体地,获取多个样本用户的特征数据和用户频次。

特征数据,包括:用户cookie、访问时间、访问次数、属性标签、登录时间分布、访问间隔分布、访问时间的均值、访问时间的方差、访问次数的均值、访问次数的方差中的一个或多个。

举例来说,从腾讯视频的服务器中获取用户访问日志,从用户访问日志提取样本用户在1月份的特征数据和3月份的用户频次。这里的样本用户是腾讯视频的用户。这里的用户访问日志可以从腾讯视频的用户中随机选择的多个用户的用户访问日志。

步骤204:根据每个样本用户的用户频次和对应关系,确定每个样本用户所属的用户类别。

举例来说,样本用户A的用户频次为3,那么样本用户属于用户类别2;样本用户B的用户频次为7,那么样本用户属于用户类别4。

步骤205:根据各个样本用户的特征数据和各个样本用户所属的用户类别,对每个初始预测模型进行训练,获取每个用户类别对应的目标预测模型。

举例来说,经过训练后,用户类别1对应的目标预测模型1,用户类别2对应的目标预测模型2,用户类别3对应的目标预测模型3,用户类别4对应的目标预测模型4。

步骤206:获取目标用户的特征数据。

举例来说,从腾讯视频的服务器中获取目标用户的用户访问日志,从目标用户的用户访问日志提取样本用户在6月份的特征数据。这里的样本用户是腾讯视频的用户。

步骤207:根据目标用户的特征数据和每个目标预测模型,预测目标用户所属的目标用户类别。

举例来说,将目标用户的在6月份的特征数据输入到每个目标预测模型中,得到每个目标预测模型输入的预测结果,该预测结果可以是目标用户输入当前目标预测模型对应的当前用户类别的概率,这是,将输入的概率最大的目标预测模型对应的用户类别作为目标用户类别。例如:目标预测模型1、目标预测模型2、目标预测模型3、目标预测模型4输出的概率分别是:0.5、0.4、0.7、0.2。那么,目标预测模型3对应的用户类别3为目标用户类别,也就是说,目标用户属于用户类别3。

步骤208:根据对应关系,确定目标用户类别对应的用户频次。

举例来说,当目标用户类别为用户类别3时,根据对应关系,用户类别3对应的用户频次等于4次。

步骤209:将目标用户类别对应的用户频次作为目标用户的用户频次。

举例来说,将用户类别3对应的用户频次等于4次作为目标用户的用户频次,也就是说,预测出目标用户在待预测时间周期内使用腾讯视频的使用次数为4次,这里的待预测时间周期可以是8月份。

另外,还可以包括:根据目标用户的用户频次、至少一个广告主的控频要求和预设原则,针对目标用户投放至少一个广告主的广告,其中,预设原则包括:满足最多的广告主的控频要求,广告主的控频要求包括:广告主的广告最少被所述目标用户浏览预设值次。

举例来说,针对目标用户的用户频次,在目标用户使用腾讯视频时,针对目标用户投放广告,具体地,向目标用户投放4次广告,具体地,可以按照预设原则进行投放。

为了进一步提供预测的准确性,在本发明一实施例中,所述设置每个所述用户类别对应的初始预测模型,包括:

设置每个所述用户类别对应的初始预测函数,其中,当前用户类别对应的所述初始预测函数为:

其中,θTx=θ01x1+,...,+θixi+,...,+θnxn,θi为第i个特征权重,x为当前样本用户的特征数据向量,x=(x1,x2,...,xj,...,xn),xj为所述当前样本用户的第j个特征数据;h(x)为所述当前样本用户属于所述当前用户类别的概率,在所述当前样本用户属于所述当前用户类别时,h(x)为1;在所述当前样本用户不属于所述当前用户类别时,h(x)为0;

所述根据各个所述样本用户的特征数据和各个所述样本用户所属的用户类别,对每个所述初始预测模型进行训练,获取每个所述用户类别对应的目标预测模型,包括:

根据各个所述样本用户的特征数据和各个所述样本用户所属的用户类别,确定每个所述初始预测函数中的每个特征权重;

根据每个所述用户类别对应的所述初始预测函数中的每个特征权重,确定每个所述用户类别对应的目标预测函数,其中,当前用户类别对应的目标预测函数为:

其中,θTy=θ01y1+,...,+θiyi+,...,+θnyn,θi为所述当前用户类别对应的初始预测函数中的第i个特征权重,y为所述目标用户的特征数据向量,y=(y1,y2,...,yj,...,yn),yj为所述目标用户的第i个特征数据,H(y)为所述目标用户属于所述当前用户类别的概率;

所述根据所述目标用户的特征数据和每个所述目标预测模型,预测所述目标用户所属的目标用户类别,包括:

根据所述目标用户的特征数据和每个所述目标预测函数,确定每个所述目标预测函数对应的预测概率;

将各个所述预测概率中最大的目标预测概率对应的用户类别作为所述目标用户类别。

在本发明实施例中,每个用户类别的初始预测函数可以相同,但是,在训练后得到的每个初始预测函数对应的目标预测函数可能是不同的。在设置对应关系时,每个用户类别可以对应一个用户频次或者一个用户频次的范围。举例来说,用户类别1对应用户频次小于等于2次;用户类别2对应用户频次等于3次;用户类别3对应用户频次等于4次;用户类别4对应用户频次大于等于5次。在进行训练时,样本用户A的用户频次为3次,样本用户A的特征数据向量为XA。对于用户类别1的初始预测函数1,由于样本用户A不属于用户类别1,初始预测函数1中的h(x)为0,x为XA;同理,对于用户类别3的初始预测函数3和用户类别4的初始预测函数4,h(x)为0,x为XA。对于用户类别1的初始预测函数2,由于样本用户A属于用户类别2,初始预测函数2中的h(x)为1,x为XA。针对其他的样本用户也是采用同样的赋值。也就是说,针对同一个x,在不同的用户类别的初始预测函数中的h(x)可能是不同的,这样,在训练后,不同的用户类别的目标预测函数可能是不同。在训练时,每个初始预测函数的每个特征权重是未知的,需要通过训练获得。在确定出每个初始预测函数的每个特征权重后,将确定出特征权重代入到对应的初始预测函数中,即可得到每个用户类别对应的目标预测函数。对于目标预测函数来说,特征权重是已知的,H(y)是根据特征数据得到的结果。举例来说,经过训练后,用户类别1对应的目标预测函数1,用户类别2对应的目标预测函数2,用户类别3对应的目标预测函数3,用户类别4对应的目标预测函数4;针对目标用户的特征数据,目标预测函数1、目标预测函数2、目标预测函数3、目标预测函数4输出的H(y)分别是:0.5、0.4、0.7、0.2,那么,目标预测函数3输出的H(y)最大,目标预测函数3对应的用户类别3为目标用户类别,也就是说,目标用户属于用户类别3。

在本发明实施例中,初始预测模型包括:初始预测函数,目标预测模型包括:目标预测函数,

为了进一步提供预测的准确性,在本发明一实施例中,所述根据各个所述样本用户的特征数据和各个所述样本用户所属的用户类别,确定每个所述初始预测函数中的每个特征权重,包括:

根据各个所述样本用户的特征数据和各个所述样本用户所属的用户类别,确定在当前初始预测函数的权重确定参数取最大值时的所述当前初始预测函数的每个特征权重,其中,

其中,l(θ)为所述当前初始预测函数的权重确定参数,m为所述样本用户的数量,x(k)为第k个样本用户的特征数据向量,当所述第k个样本用户属于所述当前初始预测函数对应的用户类别时,z(k)=1,当所述第k个样本用户不属于所述当前初始预测函数对应的用户类别时,z(k)=0。

在本发明实施例中,通过每个初始预测函数的权重确定参数,可以确定出较优地特征权重,通过较优地特征权重可以确定出更加准确的目标预测函数,进而使得预测结果更加准确。

如图3所示,本发明实施例提供了一种预测用户频次的方法,该方法可以包括以下步骤:

步骤301:设置至少一个用户类别,设置用户类别与用户频次的对应关系。

举例来说,用户频次为用户在一个月内的使用次数,例如用户在一个月内的使用腾讯视频的使用次数。设置4个用户类别,该对应关系为:用户类别1对应用户频次小于等于2次;用户类别2对应用户频次等于3次;用户类别3对应用户频次等于4次;用户类别4对应用户频次大于等于5次。

步骤302:设置每个用户类别对应的初始预测函数,其中,当前用户类别对应的初始预测函数为:

其中,θTx=θ01x1+,...,+θixi+,...,+θnxn,θi为第i个特征权重,x为当前样本用户的特征数据向量,x=(x1,x2,...,xj,...,xn),xj为所述当前样本用户的第j个特征数据;h(x)为所述当前样本用户属于所述当前用户类别的概率,在所述当前样本用户属于所述当前用户类别时,h(x)为1;在所述当前样本用户不属于所述当前用户类别时,h(x)为0。

举例来说,用户类别1对应初始预测函数1;用户类别2对应初始预测函数2;用户类别3对应初始预测函数3;用户类别4对应初始预测函数4。

步骤303:获取样本用户的特征数据和用户频次。

具体地,可以根据样本用户的特征数据和用户频次,生成标准的分类数据集。举例来说,在标准的分类数据集中,每个样本用户对应一个元素,该元素为x,x为样本用户的特征数据向量,其中,每个样本用户的特征数据向量按照预设的格式设置,举例来说,x1为特征数据1,x2为特征数据2,xj为特征数据j,xn为特征数据n,依次类推。例如:x1为样本用户的访问时间、x2为样本用户的访问次数、x3为样本用户的访问时间的均值、x4为样本用户的访问次数的均值。

步骤304:根据每个样本用户的用户频次和对应关系,确定每个样本用户所属的用户类别。

步骤305:根据各个样本用户的特征数据和各个样本用户所属的用户类别,确定在每个初始预测函数的权重确定参数取最大值时的每个初始预测函数的每个特征权重,其中,

其中,l(θ)为当前初始预测函数的权重确定参数,m为样本用户的数量,x(k)为第k个样本用户的特征数据向量,当第k个样本用户属于当前初始预测函数对应的用户类别时,z(k)=1,当第k个样本用户不属于当前初始预测函数对应的用户类别时,z(k)=0。

步骤306:根据每个用户类别对应的初始预测函数中的每个特征权重,确定每个用户类别对应的目标预测函数,其中,当前用户类别对应的目标预测函数为:

其中,θTy=θ01y1+,...,+θiyi+,...,+θnyn,θi为当前用户类别对应的初始预测函数中的第i个特征权重,y为目标用户的特征数据向量,y=(y1,y2,...,yj,...,yn),yj为目标用户的第i个特征数据,H(y)为目标用户属于当前用户类别的概率。

举例来说,用户类别1对应的目标预测函数1,用户类别2对应的目标预测函数2,用户类别3对应的目标预测函数3,用户类别4对应的目标预测函数4。

步骤307:获取目标用户的特征数据。

具体地,可以根据目标用户的特征数据生成目标用户的特征数据向量,其中,目标用户的特征数据向量按照预设的格式设置,该预设的格式与样本用户的特征向量相同,举例来说,y1为特征数据1,y2为特征数据2,yj为特征数据j,yn为特征数据n,依次类推。例如:y1为目标用户的访问时间、y2为目标用户的访问次数、y3为目标用户的访问时间的均值、y4为目标用户的访问次数的均值。

步骤308:根据目标用户的特征数据和每个目标预测函数,确定每个目标预测函数对应的预测概率。

举例来说,针对目标用户的特征数据,目标预测函数1、目标预测函数2、目标预测函数3、目标预测函数4输出的H(y)分别是:0.5、0.4、0.7、0.2,

步骤309:将各个预测概率中最大的目标预测概率对应的用户类别作为目标用户类别。

举例来说,目标预测函数3输出的H(y)最大,目标预测函数3对应的用户类别3为目标用户类别,也就是说,目标用户属于用户类别3。

步骤310:根据对应关系,确定目标用户类别对应的用户频次。

举例来说,根据对应关系,确定用户类别3对应用户频次等于4次。

步骤311:将目标用户类别对应的用户频次作为目标用户的用户频次。

举例来说,由于目标用户类别对应的用户频次为4次,所以目标用户的用户频次为4次。

如图4所示,本发明实施例提供了一种预测用户频次的装置,包括:

第一设置单元401,用于设置至少一个用户类别,设置所述用户类别与用户频次的对应关系

第二设置单元402,用于设置每个所述用户类别对应的目标预测模型;

目标获取单元403,用于获取目标用户的特征数据;

预测单元404,用于根据所述目标用户的特征数据和每个所述目标预测模型,预测所述目标用户所属的目标用户类别;

频次确定单元405,用于根据所述对应关系,确定所述目标用户类别对应的用户频次,将所述目标用户类别对应的用户频次作为所述目标用户的用户频次。

如图5所示,为了提高预测的准确性,在本发明一实施例中,所述第二设置单元,包括:

设置子单元501,用于设置每个所述用户类别对应的初始预测模型;

样本获取子单元502,用于获取样本用户的特征数据和用户频次;

样本类别确定子单元503,用于根据每个所述样本用户的用户频次和所述对应关系,确定每个所述样本用户所属的用户类别;

训练子单元504,用于根据各个所述样本用户的特征数据和各个所述样本用户所属的用户类别,对每个所述初始预测模型进行训练,获取每个所述用户类别对应的目标预测模型。

具体地,样本类别确定子单元与第一设置单元相连;训练子单元与预测单元相连。

为了进一步提高预测的准确性,在本发明一实施例中,所述设置子单元,用于设置每个所述用户类别对应的初始预测函数,其中,当前用户类别对应的所述初始预测函数为:

其中,θTx=θ01x1+,...,+θixi+,...,+θnxn,θi为第i个特征权重,x为当前样本用户的特征数据向量,x=(x1,x2,...,xj,...,xn),xj为所述当前样本用户的第j个特征数据;h(x)为所述当前样本用户属于所述当前用户类别的概率,在所述当前样本用户属于所述当前用户类别时,h(x)为1;在所述当前样本用户不属于所述当前用户类别时,h(x)为0;

所述训练子单元,用于根据各个所述样本用户的特征数据和各个所述样本用户所属的用户类别,确定每个所述初始预测函数中的每个特征权重;根据每个所述用户类别对应的所述初始预测函数中的每个特征权重,确定每个所述用户类别对应的目标预测函数,其中,当前用户类别对应的目标预测函数为:

其中,θTy=θ01y1+,...,+θiyi+,...,+θnyn,θi为所述当前用户类别对应的初始预测函数中的第i个特征权重,y为所述目标用户的特征数据向量,y=(y1,y2,...,yj,...,yn),yj为所述目标用户的第i个特征数据,H(y)为所述目标用户属于所述当前用户类别的概率;

所述预测单元,用于根据所述目标用户的特征数据和每个所述目标预测函数,确定每个所述目标预测函数对应的预测概率,将各个所述预测概率中最大的目标预测概率对应的用户类别作为所述目标用户类别。

在本发明一实施例中,所述训练子单元,在执行所述根据各个所述样本用户的特征数据和各个所述样本用户所属的用户类别,确定每个所述初始预测函数中的每个特征权重时,用于根据各个所述样本用户的特征数据和各个所述样本用户所属的用户类别,确定在当前初始预测函数的权重确定参数取最大值时的所述当前初始预测函数的每个特征权重,其中,

其中,l(θ)为所述当前初始预测函数的权重确定参数,m为所述样本用户的数量,x(k)为第k个样本用户的特征数据向量,当所述第k个样本用户属于所述当前初始预测函数对应的用户类别时,z(k)=1,当所述第k个样本用户不属于所述当前初始预测函数对应的用户类别时,z(k)=0。

在本发明一实施例中,所述特征数据,包括:用户cookie、访问时间、访问次数、属性标签、登录时间分布、访问间隔分布、访问时间的均值、访问时间的方差、访问次数的均值、访问次数的方差中的一个或多个;

在本发明一实施例中,该装置进一步包括:

广告投放单元,用于根据所述目标用户的用户频次、至少一个广告主的控频要求和预设原则,针对所述目标用户投放所述至少一个广告主的广告,其中,所述预设原则包括:满足最多的广告主的控频要求,所述广告主的控频要求包括:所述广告主的广告最少被所述目标用户浏览预设值次。

在本发明一实施例中,所述样本获取子单元,用于从目标服务器中获取用户访问日志,从所述用户访问日志中提取所述样本用户的特征数据和用户频次;

所述目标获取单元,用于从所述目标服务器中获取所述目标用户的用户访问日志,从所述目标用户的用户访问日志中提取所述目标用户的特征数据。

为了进一步准确地预测用户频次,在本发明一实施例中,,所述样本获取子单元,用于获取所述样本用户在第一时间周期内的特征数据,以及在第二时间周期内的用户频次,其中,所述第一时间周期在所述第二时间周期之前,且所述第一时间周期与所述第二时间周期之间相隔预设值个时间周期;

所述目标获取单元,用于获取所述目标用户在目标时间周期内的特征数据,其中,所述目标时间周期在待预测时间周期之前,且所述目标时间周期与所述待预测时间周期之间相隔所述预设值个时间周期;

所述频次确定单元,在执行所述将所述目标用户类别对应的用户频次作为所述目标用户的用户频次时,用于将所述目标用户类别对应的用户频次作为所述目标用户在所述待预测时间周期的用户频次。

上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。

本发明各个实施例至少具有如下有益效果:

1、在本发明实施例中,设置每个用户类别对应的目标预测模型,将目标用户的特征数据输入到每个目标预测模型中,确定出目标用户的目标用户类别,将目标用户类别对应的用户频次作为目标用户的用户频次,实现对目标用户的用户频次的预测。

2、在本发明实施例中,根据样本用户的特征数据和用户类别,对预设的每个初始预测模型进行训练,得到每个初始预测模型对应的目标预测模型,这里的目标预测模型是基于样本用户的特征数据训练得到,在进行目标用户的用户频次的预测时,能够得到更加准确的预测结果。

3、在本发明实施例中,预先划分出多个时间周期,在训练初始预测模型时,利用第一时间周期内的特征数据和第二时间周期内的用户频次来训练初始预测模型,对于第二时间周期来说,第一时间周期内的特征数据是历史数据,对于待预测时间周期来说,目标时间周期的特征数据是历史数据,而且第二时间周期与第一时间周期的时间间隔等于待预测时间周期与目标时间周期的时间间隔,用来训练初始预测模型的数据与用来预测目标用户的特征数据在时间上具有相似性,因此,能够提高预测的准确性。

4、在本发明实施例中,在预测出目标用户的用户频次后,将预测出的用户频次用于针对该目标用户投放广告,在投放广告时,按照预设原则进行投放,能够实现对用户频次的最佳分配,能够最大化用户流量的收益。

需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个······”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。

本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。

最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1