一种点击到达率ctr的确定方法及装置的制造方法

文档序号:9453098阅读:511来源:国知局
一种点击到达率ctr的确定方法及装置的制造方法
【技术领域】
[0001] 本发明涉及互联网技术领域,具体涉及一种点击到达率CTR的确定方法及装置。
【背景技术】
[0002] 在互联网技术领域,互联网产品的推广方可以利用应用墙等推广资源为应用的开 发方推广应用,即互联网产品的推广方会根据用户的当前操作场景以及确定出的应用的点 击到达率(CTR,ClickThroughRate)为用户推荐CTR较高的一个或多个优质应用。可见, 快速确定出应用的CTR在应用的推广方面显得尤为重要。
[0003] 当前,常见的CTR确定方法为基于统计的确定方法,即假设应用在相同操作场景 下的CTR相同,从根据历史样本数据统计出应用在不同操作场景下的CTR中查找与当前操 作场景相同或相似的操作场景下的CTR,以作为应用在当前操作场景下的CTR。但是,由于 操作场景由多个特征维度构成,该基于统计的确定方法依赖于大量的历史样本数据,且在 查找与当前操作场景相同或相似的操作场景时需要考虑到多个特征维度,无法快速的确定 出应用的CTR且资源消耗大。

【发明内容】

[0004] 本发明实施例公开了一种点击到达率CTR的确定方法及装置,能够快速的确定出 应用的CTR且资源消耗小。
[0005] 本发明实施例第一方面公开了一种点击到达率CTR的确定方法,所述方法包括:
[0006] 在检测到针对应用的显示请求时,确定每个应用的特征值序列,所述特征值序列 由用于描述应用信息的应用特征值序列、用于描述用户信息的用户特征值序列以及流量特 征值序列组成;
[0007] 分别将每个所述特征值序列作为预先设置的CTR计算算法的输入,获取与每个所 述特征值序列对应的所述CTR计算算法的输出;
[0008] 将每个所述特征值序列对应的所述CTR计算算法的输出确定为该特征值序列对 应应用的CTR。
[0009] 在本发明实施例第一方面的第一种可能的实现方式中,所述CTR计算算法为基于 逻辑回归模型的算法,且所述基于逻辑回归模型的算法的计算公式为:
[0010]
[0011] 其中,所述yCTR为所述计算公式的输出,所述f.为所述计算公式的输入,所述为 预先计算出的所述计算公式的系数。
[0012] 结合本发明实施例第一方面的第一种可能的实现方式,在本发明实施例第一方面 的第二种可能的实现方式中,所述在检测到针对应用的显示请求时,确定每个应用的特征 值序列之前,所述方法还包括:
[0013] 从预先存储的样本数据中读取第一数量的第一样本数据,所述样本数据由特征值 序列、用于标识该样本数据是否被展现的展现标识以及用于标识该样本数据是否被点击的 点击标识组成;
[0014] 归并所述第一数量的第一样本数据中特征值序列相同的第一样本数据,以获取第 二数量的第二样本数据,所述第二样本数据由形成该第二样本数据的第一样本数据的特征 值序列、形成该第二样本数据的第一样本数据的展现标识之和以及形成该第二样本数据的 第一样本数据的点击标识之和组成;
[0015] 将每个所述第二样本数据表达成似然表达式,并将所有所述似然表达式相乘以获 取乘积似然表达式;
[0016] 通过牛顿迭代法以及初始迭代参数进行目标次数次的迭代,计算出所述乘积似然 表达式取最大值时所述乘积似然表达式中未知参数的值,并将所述未知参数的值确定为所 、I、..-* 还谈 <3:
[0017] 结合本发明实施例第一方面的第一种可能的实现方式,在本发明实施例第一方面 的第三种可能的实现方式中,所述在检测到针对应用的显示请求时,确定每个应用的特征 值序列之前,所述方法还包括:
[0018] 从预先存储的样本数据中读取第一数量的第一样本数据,所述第一样本数据由特 征值序列、用于标识该样本数据是否被展现的展现标识以及用于标识该样本数据是否被点 击的点击标识组成;
[0019] 归并所述第一数量的第一样本数据中特征值序列相同的第一样本数据,以获取第 二数量的第二样本数据,所述第二样本数据由形成该第二样本数据的第一样本数据的特征 值序列、形成该第二样本数据的第一样本数据的展现标识之和以及形成该第二样本数据的 第一样本数据的点击标识之和组成;
[0020] 将所述第二数量的第二样本数据均分成每份包括第三数量的第二样本数据的样 本组;
[0021] 分别将每个所述样本组包括的每个第二样本数据表达成似然表达式,并将每个所 述样本组对应的所有所述似然表达式相乘以获取该样本组的乘积似然表达式;
[0022] 通过牛顿迭代法以及初始迭代参数进行一次迭代,分别计算出每个所述乘积似然 表达式取最大值时该乘积似然表达式中未知参数的第一值,将每个所述第一值的和作为下 一次迭代的初始迭代参数,执行所述通过牛顿迭代法以及初始迭代参数进行一次迭代的操 作,直至迭代次数到达目标次数;
[0023] 将在所述目标次数迭代后计算出的每个所述乘积似然表达式中所述未知参数的 第二值的和确定为所述分。
[0024] 结合本发明实施例第一方面的第三种可能的实现方式,在本发明实施例第一方面 的第四种可能的实现方式中,所述归并所述第一数量的第一样本数据中特征值序列相同的 第一样本数据之后,所述将所述第二数量的第二样本数据均分成每份包括第三数量的第二 样本数据的样本组之前,所述方法还包括:
[0025] 将所述第二数量的第二样本数据存储在地址连续的内存空间中。
[0026] 本发明实施例第二方面公开了一种点击到达率CTR的确定装置,所述装置包括第 一确定单元、第一获取单元以及第二确定单元,其中:
[0027]所述第一确定单元,用于在检测到针对应用的显示请求时,确定每个应用的特征 值序列,所述特征值序列由用于描述应用信息的应用特征值序列、用于描述用户信息的用 户特征值序列以及流量特征值序列组成;
[0028] 所述第一获取单元,用于分别将每个所述特征值序列作为预先设置的CTR计算算 法的输入,获取与每个所述特征值序列对应的所述CTR计算算法的输出;
[0029] 所述第二确定单元,用于将每个所述特征值序列对应的所述CTR计算算法的输出 确定为该特征值序列对应应用的CTR。
[0030] 在本发明实施例第二方面的第一种可能的实现方式中,所述CTR计算算法为基于 逻辑回归模型的算法,且所述基于逻辑回归模型的算法的计算公式为:
[0031]
[0032] 其中,所述yCT[?为所述计算公式的输出,所述i为所述计算公式的输入,所述涵:为 预先计算出的所述计算公式的系数。
[0033] 结合本发明实施例第二方面的第一种可能的实现方式,在本发明实施例第二方面 的第二种可能的实现方式中,所述装置还包括第一读取单元、第一归并单元、第二获取单 元、第一计算单元以及第三确定单元,其中:
[0034] 所述第一读取单元,用于从预先存储的样本数据中读取第一数量的第一样本数 据,所述样本数据由特征值序列、用于标识该样本数据是否被展现的展现标识以及用于标 识该样本数据是否被点击的点击标识组成;
[0035] 所述第一归并单元,用于归并所述第一数量的第一样本数据中特征值序列相同的 第一样本数据,以获取第二数量的第二样本数据,所述第二样本数据由形成该第二样本数 据的第一样本数据的特征值序列、形成该第二样本数据的第一样本数据的展现标识之和以 及形成该第二样本数据的第一样本数据的点击标识之和组成;
[0036] 所述第二获取单元,用于将每个所述第二样本数据表达成似然表达式,并将所有 所述似然表达式相乘以获取乘积似然表达式;
[0037] 所述第一计算单元,用于通过牛顿迭代法以及初始迭代参数进行目标次数次的迭 代,计算出所述乘积似然表达式取最大值时所述乘积似然表达式中未知参数的值;
[0038] 所述第三确定单元,用于将所述未知参数的值确定为所述# ?
[0039] 结合本发明实施例第二方面的第一种可能的实现方式,在本发明实施例第二方面 的第三种可能的实现方式中,所述装置还包括第二读取单元、第二归并单元、均分单元、第 三获取单元、第二计算单元以及第四确定单元,其中:
[0040] 所述第二读取单元,用于从预先存储的样本数据中读取第一数量的第一样本数 据,所述第一样本数据由特征值序列、用于标识该样本数据是否被展现的展现标识以及用 于标识该样本数据是否被点击的点击标识组成;
[0041] 所述第二归
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1