1.一种广告点击率预估模型的优化方法,其特征在于,包括:
采用训练集中的数据统计优化前的第一参数向量对应的方向向量及步长向量;其中,所述第一参数向量为所述广告点击率预估模型的参数向量;
将所述优化前的第一参数向量、所述方向向量及所述步长向量作为更新函数的输入,采用优化前的第二参数向量计算优化后的第一参数向量;其中,所述第二参数向量为所述更新函数的参数向量;
以在验证集中的优化目标为准则,估计优化后的第二参数向量;其中,所述优化目标采用所述优化后的第一参数向量确定;
采用所述优化后的第二参数向量更新所述优化后的第一参数向量。
2.根据权利要求1所述的方法,其特征在于,所述采用训练集中的数据统计优化前的第一参数向量对应的方向向量,包括:
采用以下式子分别计算所述方向向量中的各个元素,将所述各个元素组成所述方向向量;
其中,
所述表示第t轮优化时,所述方向向量中的第i个元素;
所述α为大于0并且小于1的正数;
所述xi表示广告特征向量中的第i个特征;
所述click(xi)表示所述xi在所述训练集中被真实点击的次数;
所述predict(xi)表示所述xi被预估点击的次数。
3.根据权利要求1所述的方法,其特征在于,采用训练集中的数据统计优化前的第一参数向量对应的步长向量,包括:
采用以下式子分别计算所述步长向量中的各个元素,将所述各个元素组成所述步长向量;
其中,
所述表示第t轮优化时,所述步长向量中的第i个元素;
所述β为大于0并且小于1的正数;
所述xi表示广告特征向量中的第i个特征;
所述predict(xi)表示所述xi在所述训练集中被展现的次数。
4.根据权利要求1、2或3所述的方法,其特征在于,所述更新函数采用以下式子定义:
wt+1=F(wt,d(wt),s(wt));其中,
所述wt+1表示第t轮优化时,优化后的所述第一参数向量;
所述wt表示第t轮优化时,优化前的所述第一参数向量;
所述d(wt)表示第t轮优化时,wt对应的方向向量;
所述s(wt)表示第t轮优化时,wt对应的步长向量。
5.根据权利要求4所述的方法,其特征在于,所述wt+1的计算方式为:
采用以下式子分别计算所述wt+1中的各个元素,将所述各个元素组成所述wt+1;
其中,
所述表示所述wt+1的第j个槽位中的第m个元素;
所述表示所述wt的第j个槽位中的第m个元素;
所述表示所述d(wt)的第j个槽位中的第m个元素;
所述表示所述s(wt)的第j个槽位中的第m个元素;
所述uj表示所述优化前的第二参数向量中对应第j个槽位的向量;
所述vj表示第j个槽位的特征值向量。
6.根据权利要求5所述的方法,其特征在于,所述vj的确定方式为:
将所述优化前的第一参数向量中对应第j个槽位的各个元素分别用一个三维向量表示;所述三维向量为:其中,所述m为第j个槽位中元素的索引;
针对第j个槽位的各个元素对应的所述三维向量,采用K-means算法进行聚类,得到每个槽位中的l个中心点;所述l为整数;
针对所述优化前的第一参数向量中的第j个槽位的各个元素对应的三维向量,分别计算所述三维向量与所述元素所属槽位中的l个中心点的距离的倒数,将所述倒数作为所述vj的各个元素;
将所述各个元素组成得到所述vj。
7.根据权利要求5所述的方法,其特征在于,所述vj的确定方式为:
将所述优化前的第一参数向量中的第j个槽位用一组三维向量表示;所述一组三维向量为:其中,所述为所述wt的第j个槽位对应的向量;所述为所述d(wt)的第j个槽位对应的向量;所述为所述s(wt)的第j个槽位对应的向量;
将所述一组三维向量用高斯混合模型重新表示,利用最大期望算法估计所述vj。
8.根据权利要求1、2或3所述的方法,其特征在于,所述训练集及所述验证集的确定方式为:
采用滑动窗口在流式数据环境中进行动态切割和划分,得到所述训练集及所述验证集。
9.一种广告点击率预估模型的优化装置,其特征在于,包括:
统计模块,用于采用训练集中的数据统计优化前的第一参数向量对应的方向向量及步长向量;其中,所述第一参数向量为所述广告点击率预估模型的参数向量;
优化模块,用于将所述优化前的第一参数向量、所述方向向量及所述步长向量作为更新函数的输入,采用优化前的第二参数向量计算优化后的第一参数向量;其中,所述第二参数向量为所述更新函数的参数向量;
验证模块,用于以在验证集中的优化目标为准则,估计优化后的第二参数向量;其中,所述优化目标采用所述优化后的第一参数向量确定;
更新模块,用于采用所述优化后的第二参数向量更新所述优化后的第一参数向量。
10.根据权利要求9所述的装置,其特征在于,所述统计模块用于:
采用以下式子分别计算所述方向向量中的各个元素,将所述各个元素组成所述方向向量;
其中,
所述表示第t轮优化时,所述方向向量中的第i个元素;
所述α为大于0并且小于1的正数;
所述xi表示广告特征向量中的第i个特征;
所述click(xi)表示所述xi在所述训练集中被真实点击的次数;
所述predict(xi)表示所述xi被预估点击的次数。
11.根据权利要求9所述的装置,其特征在于,所述统计模块用于:
采用以下式子分别计算所述步长向量中的各个元素,将所述各个元素组成所述步长向量;
其中,
所述表示第t轮优化时,所述步长向量中的第i个元素;
所述β为大于0并且小于1的正数;
所述xi表示广告特征向量中的第i个特征;
所述predict(xi)表示所述xi在所述训练集中被展现的次数。
12.根据权利要求9、10或11所述的装置,其特征在于,所述更新函数采用以下式子定义:
wt+1=F(wt,d(wt),s(wt));其中,
所述wt+1表示第t轮优化时,优化后的所述第一参数向量;
所述wt表示第t轮优化时,优化前的所述第一参数向量;
所述d(wt)表示第t轮优化时,wt对应的方向向量;
所述s(wt)表示第t轮优化时,wt对应的步长向量。
13.根据权利要求12所述的装置,其特征在于,所述优化模块用于,采用以下式子分别计算所述wt+1中的各个元素,将所述各个元素组成所述wt+1;
其中,
所述表示所述wt+1的第j个槽位中的第m个元素;
所述表示所述wt的第j个槽位中的第m个元素;
所述表示所述d(wt)的第j个槽位中的第m个元素;
所述表示所述s(wt)的第j个槽位中的第m个元素;
所述uj表示所述优化前的第二参数向量中对应第j个槽位的向量;
所述vj表示第j个槽位的特征值向量。
14.根据权利要求13所述的装置,其特征在于,所述vj的确定方式为:
将所述优化前的第一参数向量中对应第j个槽位的各个元素分别用一个三维向量表示;所述三维向量为:其中,所述m为第j个槽位中元素的索引;
针对第j个槽位的各个元素对应的所述三维向量,采用K-means算法进行聚类,得到每个槽位中的l个中心点;所述l为整数;
针对所述优化前的第一参数向量中的第j个槽位的各个元素对应的三维向量,分别计算所述三维向量与所述元素所属槽位中的l个中心点的距离的倒数,将所述倒数作为所述vj的各个元素;
将所述各个元素组成得到所述vj。
15.根据权利要求13所述的装置,其特征在于,所述vj的确定方式为:
将所述优化前的第一参数向量中的第j个槽位用一组三维向量表示;所述一组三维向量为:其中,所述为所述wt的第j个槽位对应的向量;所述为所述d(wt)的第j个槽位对应的向量;所述为所述s(wt)的第j个槽位对应的向量;
将所述一组三维向量用高斯混合模型重新表示,利用最大期望算法估计所述vj。
16.根据权利要求9、10或11所述的装置,其特征在于,所述装置还包括:
训练集及验证集确定模块,用于采用滑动窗口在流式数据环境中进行动态切割和划分,得到所述训练集及所述验证集。
17.一种广告点击率预估模型的优化设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-8中任一所述的方法。
18.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一所述的方法。