一种品牌广告效果优化的离散计算方法_3

文档序号:9826549阅读:来源:国知局
志信息:用户点击广告时记录下的相关信息,
[0085] 将上述四种数据进行数据的整合与清洗,得到用户的人口属性和偏好信息;
[0086] 特征提取及格式化单元S220:对清洗及整合后的数据进行特征提取与格式化,将 格式化后的数据按照一定的比例进行分配得到模型训练数据和模型验证数据;
[0087]模型训练及验证单元S230:使用模型训练数据利用逻辑回归模型算法(Logistic Regression)得到逻辑回归模型,使用模型验证数据在逻辑回归模型中进行验证,得到预测 的点击率阈值;
[0088] 模型测试及投放单元S240:使用最近的广告投放的所述四种数据,利用特征提取 及格式化单元S220得到模型测试数据,将所述模型测试数据输入到逻辑回归模型中获得的 点击率值与预先设定的点击率阈值比较,大于等于所述点击率阈值则进行投放,小于点击 率阈值则不投放。
[0089] 优选地,在数据源清洗及整合单元S210中,所述将上述四种数据进行数据的整合 与清洗,包括通过验证去除不需要的属性,或者对一些缺失的数据进行补充,整合。
[0090] 优选地,在特征提取及格式化单元S220中,所述特征提取进一步包括抽取三方面 不同的特征,包括:
[0091 ]上下文信息特征,即发生当前广告行为时的上下文环境信息;
[0092] 广告信息特征,即广告素材的描述信息;
[0093] 用户信息特征,即当前用户的基础信息与偏好信息。
[0094]优选地,在特征提取及格式化单元S220中,所述格式化包括将上述三种特征分两 类不同类别的特征:类别特征与连续特征,分别进行处理,变成适合算法训练的数据格式。 [0095]优选地,在所述模型训练及验证单元S230中:将逻辑回归模型算法(Logistic Regression)与梯度增强决策树算法(Gradient Boosting Decision Tree,简称GBDT)结 合,得到逻辑回归模型。
[0096] 显然,本领域技术人员应该明白,上述的本发明的各单元或各步骤可以用通用的 计算装置来实现,它们可以集中在单个计算装置上,可选地,他们可以用计算机装置可执行 的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分 别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来 实现。这样,本发明不限制于任何特定的硬件和软件的结合。
[0097] 以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定 本发明的【具体实施方式】仅限于此,对于本发明所属技术领域的普通技术人员来说,在不脱 离本发明构思的前提下,还可以做出若干简单的推演或替换,都应当视为属于本发明由所 提交的权利要求书确定保护范围。
【主权项】
1. 一种广告效果优化的离散计算方法,包括如下步骤: 数据源清洗及整合步骤(S110):获得四种数据作为点击率优化模型的数据源,所述四 种数据包括: 用户信息数据:指的是用户在视频网站内观看和/或点击广告的行为得到的用户关注 行业偏好信息以及视频网站偏好信息, 素材信息数据:指的是品牌广告的素材信息, 广告展示日志信息:指的是广告展示时记录下的相关信息, 广告点击日志信息:用户点击广告时记录下的相关信息, 将上述四种数据进行数据的整合与清洗,得到用户的人口属性和偏好信息; 特征提取及格式化步骤(S120):对清洗及整合后的数据进行特征提取与格式化,将格 式化后的数据按照一定的比例进行分配得到模型训练数据和模型验证数据; 模型训练及验证步骤(S130):使用模型训练数据利用逻辑回归模型算法(Logistic Regression)得到逻辑回归模型,使用模型验证数据在逻辑回归模型中进行验证,得到预测 的点击率阈值; 模型测试及投放步骤(S140):使用最近的广告投放的所述四种数据,利用特征提取及 格式化步骤的方法得到所述模型测试数据,将所述模型测试数据输入到逻辑回归模型中获 得的点击率值与预先设定的点击率阈值比较,大于等于所述点击率阈值则进行投放,小于 点击率阈值则不投放。2. 根据权利要求1所述的广告效果优化的离散计算方法,其特征在于: 在数据源清洗及整合步骤(S110)中,所述将上述四种数据进行数据的整合与清洗,包 括通过验证去除不需要的属性,或者对一些缺失的数据进行补充,整合。3. 根据权利要求1所述的广告效果优化的离散计算方法,其特征在于: 在特征提取及格式化步骤(S120)中,所述特征提取进一步包括抽取三方面不同的特 征,包括: 上下文信息特征,即发生当前广告行为时的上下文环境信息; 广告信息特征,即广告素材的描述信息; 用户信息特征,即当前用户的基础信息与偏好信息。4. 根据权利要求3所述的广告效果优化的离散计算方法,其特征在于: 在特征提取及格式化步骤(S120)中,所述格式化包括将上述三种特征分两类不同类别 的特征:类别特征与连续特征,分别进行处理,变成适合算法训练的数据格式。5. 根据权利要求1-4中任意一项所述的广告效果优化的离散计算方法,其特征在于: 在所述模型训练及验证步骤(S130)中:将逻辑回归模型算法(Logistic Regression) 与梯度增强决策树算法(Gradient Boosting Decision Tree,简称GBDT)结合,训练得到逻 辑回归模型。6. -种广告效果优化的离散计算装置,包括如下单元: 数据源清洗及整合单元(S210):获得四种数据作为点击率优化模型的数据源,所述四 种数据包括: 用户信息数据:指的是用户在视频网站内观看和/或点击广告的行为得到的用户关注 行业偏好信息以及视频网站偏好信息, 素材信息数据:指的是品牌广告的素材信息, 广告展示日志信息:指的是广告展示时记录下的相关信息, 广告点击日志信息:用户点击广告时记录下的相关信息, 将上述四种数据进行数据的整合与清洗,得到用户的人口属性和偏好信息; 特征提取及格式化单元(S220):对清洗及整合后的数据进行特征提取与格式化,将格 式化后的数据按照一定的比例进行分配得到模型训练数据和模型验证数据; 模型训练及验证单元(S230):使用模型训练数据利用逻辑回归模型算法(Logistic Regression)得到逻辑回归模型,使用模型验证数据在逻辑回归模型中进行验证,得到预测 的点击率阈值; 模型测试及投放单元(S240):使用最近的广告投放的所述四种数据,利用特征提取及 格式化单元得到模型测试数据,将所述模型测试数据输入到逻辑回归模型中获得的点击率 值与预先设定的点击率阈值比较,大于等于所述点击率阈值则进行投放,小于点击率阈值 则不投放。7. 根据权利要求6所述的广告效果优化的离散计算装置,其特征在于: 在数据源清洗及整合单元(S210)中,所述将上述四种数据进行数据的整合与清洗,包 括通过验证去除不需要的属性,或者对一些缺失的数据进行补充,整合。8. 根据权利要求6所述的广告效果优化的离散计算装置,其特征在于: 在特征提取及格式化单元(S220)中,所述特征提取进一步包括抽取三方面不同的特 征,包括: 上下文信息特征,即发生当前广告行为时的上下文环境信息; 广告信息特征,即广告素材的描述信息; 用户信息特征,即当前用户的基础信息与偏好信息。9. 根据权利要求8所述的广告效果优化的离散计算装置,其特征在于: 在特征提取及格式化单元(S220)中,所述格式化包括将上述三种特征分两类不同类别 的特征:类别特征与连续特征,分别进行处理,变成适合算法训练的数据格式。10. 根据权利要求6-9中任意一项所述的广告效果优化的离散计算装置,其特征在于: 在所述模型训练及验证单元(S230)中:将逻辑回归模型算法(Logistic Regression) 与梯度增强决策树算法(Gradient Boosting Decision Tree,简称GBDT)结合,训练得到逻 辑回归模型。
【专利摘要】一种广告效果优化的离散计算方法及装置,所述方法充分利用了视频网站中被挖掘出的大量用户信息,包括人口基础信息和偏好,还能够结合素材本身的行业描述,对这些数据整合、清洗;再进行特征抽取与格式化,获取用于模型训练的特征;通过得到特征数据进行逻辑回归模型训练得到优化模型并验证,利用随后的测试数据经过与点击率阈值的比较进行广告投放判断。经过实践证明,本发明提高了对新广告投放的各项指标均有大幅提高,更精准地向用户投放广告,提高点击率。
【IPC分类】G06Q30/02
【公开号】CN105590240
【申请号】CN201511021014
【发明人】雷龙艳, 章岑, 杨田, 周盛, 潘柏宇, 王冀
【申请人】合一网络技术(北京)有限公司
【公开日】2016年5月18日
【申请日】2015年12月30日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1