一种品牌广告效果优化的离散计算方法

文档序号:9826549阅读:391来源:国知局
一种品牌广告效果优化的离散计算方法
【技术领域】
[0001] 本申请涉及广告投放领域,具体的,涉及一种利用广告的以往投放数据建立投放 模型,对品牌广告效果优化的离散计算方法。
【背景技术】
[0002] 品牌广告主在进行广告投放往往希望投放的广告达到一定的展现量,以展现他们 的产品,在这个基础上,广告主希望自己的广告在一定展现量的前提下能获取更多的点击 率。
[0003] 要想获取高的广告点击率,除了跟广告本身品质、吸引度相关之外,还与用户是个 人的需求及喜好相关,而根据用户需求及喜好向用户投放其喜好的视频广告能够提高广告 的点击率。
[0004] 视频网站是指在完善的技术平台支持下,让互联网用户在线流畅发布、浏览和分 享视频作品的网络媒体。由此,视频网站没有像搜索引擎那样获取用户直接需求信息的功 能,现阶段的广告点击率预算模型选择不当又导致不能准确地向用户精准地投放视频广 告。因此,如何向用户投放更准确的广告在提高广告点击率,进一步的,如何建立更加优化 的广告点击率预算模型对广告投放进行预测以向用户精确地投放广告成为现有技术亟待 解决的问题。

【发明内容】

[0005] 本发明的目的在于提出一种广告投放的预测算法,对视频网站中被挖掘出来的大 量用户信息,包括用户基本信息及用户偏好,进行整合处理,结合广告素材本身的特点,通 过模型预测及验证最优广告点击率,再进行广告投放点击率优化工作,更精准地像用户投 放广告,提高点击率。
[0006] 为达此目的,本发明采用以下技术方案:
[0007] -种广告效果优化的离散计算方法,包括如下步骤:
[0008] 数据源清洗及整合步骤S110:获得四种数据作为点击率优化模型的数据源,所述 四种数据包括:
[0009] 用户信息数据:指的是用户在视频网站内观看和/或点击广告的行为得到的用户 关注行业偏好信息以及视频网站偏好信息,
[0010]素材信息数据:指的是品牌广告的素材信息,
[0011] 广告展示日志信息:指的是广告展示时记录下的相关信息,
[0012] 广告点击日志信息:用户点击广告时记录下的相关信息,
[0013] 将上述四种数据进行数据的整合与清洗,得到用户的人口属性和偏好信息;
[0014] 特征提取及格式化步骤S120:对清洗及整合后的数据进行特征提取与格式化,将 格式化后的数据按照一定的比例进行分配得到模型训练数据和模型验证数据;
[0015] 模型训练及验证步骤S130:使用模型训练数据利用逻辑回归模型算法(Logistic Regression)得到逻辑回归模型,使用模型验证数据在逻辑回归模型中进行验证,得到预测 的点击率阈值;
[0016] 模型测试及投放步骤S140:使用最近的广告投放的所述四种数据,利用特征提取 及格式化步骤S120的方法得到所述模型测试数据,将所述模型测试数据输入到逻辑回归模 型中获得的点击率值与预先设定的点击率阈值比较,大于等于所述点击率阈值则进行投 放,小于点击率阈值则不投放。
[0017] 优选地,在数据源清洗及整合步骤S110中,所述将上述四种数据进行数据的整合 与清洗,包括通过验证去除不需要的属性,或者对一些缺失的数据进行补充,整合。
[0018] 优选地,在特征提取及格式化步骤S120中,所述特征提取进一步包括抽取三方面 不同的特征,包括:
[0019] 上下文信息特征,即发生当前广告行为时的上下文环境信息;
[0020] 广告信息特征,即广告素材的描述信息;
[0021] 用户信息特征,即当前用户的基础信息与偏好信息。
[0022]优选地,在特征提取及格式化步骤S120中,所述格式化包括将上述三种特征分两 类不同类别的特征:类别特征与连续特征,分别进行处理,变成适合算法训练的数据格式。 [0023]优选地,在所述模型训练及验证步骤S130中:将逻辑回归模型算法(Logistic Regression)与梯度增强决策树算法(Gradient Boosting Decision Tree,简称GBDT)结 合,得到逻辑回归模型。
[0024] 本发明还公开了一种广告效果优化的离散计算装置,包括如下单元:
[0025] 数据源清洗及整合单元S210:获得四种数据作为点击率优化模型的数据源,所述 四种数据包括:
[0026] 用户信息数据:指的是用户在视频网站内观看和/或点击广告的行为得到的用户 关注行业偏好信息以及视频网站偏好信息,
[0027] 素材信息数据:指的是品牌广告的素材信息,
[0028] 广告展示日志信息:指的是广告展示时记录下的相关信息,
[0029] 广告点击日志信息:用户点击广告时记录下的相关信息,
[0030] 将上述四种数据进行数据的整合与清洗,得到用户的人口属性和偏好信息;
[0031] 特征提取及格式化单元S220:对清洗及整合后的数据进行特征提取与格式化,将 格式化后的数据按照一定的比例进行分配得到模型训练数据和模型验证数据;
[0032]模型训练及验证单元S230:使用模型训练数据利用逻辑回归模型算法(Logistic Regression)得到逻辑回归模型,使用模型验证数据在逻辑回归模型中进行验证,得到预测 的点击率阈值;
[0033] 模型测试及投放单元S240:使用最近的广告投放的所述四种数据,利用特征提取 及格式化单元S220得到模型测试数据,将所述模型测试数据输入到逻辑回归模型中获得的 点击率值与预先设定的点击率阈值比较,大于等于所述点击率阈值则进行投放,小于点击 率阈值则不投放。
[0034] 优选地,在数据源清洗及整合单元S210中,所述将上述四种数据进行数据的整合 与清洗,包括通过验证去除不需要的属性,或者对一些缺失的数据进行补充,整合。
[0035]优选地,在特征提取及格式化单元S220中,所述特征提取进一步包括抽取三方面 不同的特征,包括:
[0036] 上下文信息特征,即发生当前广告行为时的上下文环境信息;
[0037] 广告信息特征,即广告素材的描述信息;
[0038] 用户信息特征,即当前用户的基础信息与偏好信息。
[0039]优选地,在特征提取及格式化单元S220中,所述格式化包括将上述三种特征分两 类不同类别的特征:类别特征与连续特征,分别进行处理,变成适合算法训练的数据格式。
[0040] 优选地,在所述模型训练及验证单元S230中:将逻辑回归模型算法(Logistic Regression)与梯度增强决策树算法(Gradient Boosting Decision Tree,简称GBDT)结 合,得到逻辑回归模型。
[0041] 本发明充分利用了视频网站中被挖掘出的大量用户信息,包括人口基础信息和偏 好,还能够结合素材本身的行业描述,对这些数据整合、清洗;再进行特征抽取与格式化,获 取用于模型训练的特征;通过得到特征数据进行逻辑回归模型训练得到优化模型并验证, 利用随后的测试数据经过与点击率阈值的比较进行广告投放判断。经过实践证明,本发明 提高了对新广告投放的各项指标均有大幅提高,更精准地向用户投放广告,提高点击率。
【附图说明】
[0042] 图1是根据本发明的具体实施例的广告效果优化的离散计算方法的流程图;
[0043] 图2是根据本发明的具体实施例的模型训练与测试体系的示意图;
[0044]图3是根据本发明的具体实施例的特征格式化结果的示例
[0045]图4是根据本发明的具体实施例的广告效果优化的离散计算装置的模块图。
【具体实施方式】
[0046] 下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描 述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便 于描述,附图中仅示出了与本发明相关的部分而非全部结构。
[0047] 参见附图1,公开了根据本发明的广告效果优化的离散计算方法的流程图,包括如 下步骤:
[0048] 数据源清洗及整合步骤S110:获得四种数据作为点击率优化模型的数据源,所述 四种数据包括:
[0049] 用户信息数据(User Profiles):指的是用户在视频网站内观看和/或点击广告的 行为得到的用户关注行业偏好信息以及视频网站偏好信息,进一步优选地,还可以包括用 户性别、年龄等信息;该信息可以位于用户信息库中。
[0050] 素材信息数据:指的是品牌广告的素材信息,示例性的包括该广告所处的行业,子 行业,品类信息与广告素材Id,该信息可以位于素材信息数据库中。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1