广告投放方法及系统、广告筛选方法及装置、服务器的制造方法_2

文档序号:8319752阅读:来源:国知局
以更加深入且具体的了解,然而所附图式仅是提供参考与说明之用,并非用来对本发明加以限制。
[0057]请参见图2,其为本发明实施例的一种广告投放方法的流程图,其包括以下步骤:
[0058]S201,根据广告定向信息及用户基础信息对系统广告数据进行检索。所述广告定向信息是指广告主提供的目标用户信息,即广告主希望看到广告的受众人群的信息,如地区、年龄、性别等。所述用户基础信息是指请求到广告投放系统的受众用户的信息。例如,当一个用户访问一个广告投放的网页时,根据这个用户的基础信息,以及广告定向信息,就可以检索出可以向该用户投放的广告,数量在几千到上万级。
[0059]S202,根据广告点击率、计费信息、用户兴趣行为特征及用户与广告的相关性中的至少一个对检索到的广告进行初选。经过初选,可以缩小步骤S201检索出广告数量。
[0060]S203,对初选后的广告预估点击率。根据用户信息、广告信息、广告位信息、广告历史点击等特征来预估广告的点击率。点击率越高,则说明广告投放效果越好,就越是值得投放。
[0061]S204,根据广告的预估点击率对广告进行收入优化评估,并获取候选广告。收入优化评估是指广告投放效益的评估,其可以包括根据广告点击量和计费对系统产生的收入评估,或者广告投放后对广告主产生的经济效益的评估等。根据收入优化评估可以进一步精选出适合投放给各个受众用户的候选广告。对此,所述的候选广告也即为【背景技术】中经过现有的检索模块、初选模块、点击预估模块及收入优化模块运算后获得的广告。
[0062]S205,提取所有广告的图像特征。
[0063]提取图像特征的对象是系统数据库中的所有广告,以便于可以全面评估广告之间的相似性,可以在广告主上传广告的时候就对素材图像进行特征提取。
[0064]本实施例通过Gist技术提取广告的图像特征,Gist技术是MIT大学教授提出的一类图像特征特征提取方法。
[0065]S206,根据提取的图像特征,获取与各个候选广告相同或相似的广告。
[0066]可以先将图像特征转换成SimHash值(simhash是Google公司提出的一种用来网页去重最常用的hash方法),然后通过对比SimHash值来计算各个广告之间的相似性。请结合参见图3,本实施例首先进行Gist特征提取,然后对每个Gist特征进行64bit的murmurhash(murmurhash是由Austin Appleby创建的一种高运算性能,低碰撞率的hash算法,现已应用到Hadoop、Iibstdc++> nginx、Iibmemcached等开源系统),最后按bit位叠加每个Gist特征hash值,按照simhash值计算方式,bit为I则为+1,bit为O则为-1,最终正的bit位为I,负的bit位为O,以此表示simhash值。作为一种局部敏感hash, simhash能准确的把相同(似)的特征的广告hash到一起,即具有相同指纹(这里所述的指纹即是指图像特征对应的SimHash值)的广告通常具有高度的相似性。从而,通过比对SimHash值,就可以获取与各个候选广告相同或相似的广告。
[0067]S207,获取候选广告对受众用户在一定时间内的曝光量。
[0068]曝光是指广告出现在受众用户浏览的页面上。受众用户在点击或者曝光广告之后,日志数据将实时流入系统,因而可以统计到广告在每个受众用户上的曝光数据。理论上受众用户与广告的曝光数据为用户数量乘以广告数量的笛卡尔积(Descarts),数量庞大。但是在实际广告投放中,每个受众用户能曝光的广告占少数,本实施例统计在一定时间内广告的曝光量,例如可以统计一个星期内广告的曝光量,请结合参见图4,由于系统投放的广告数以亿计,所以可以设定一个预设数量作为统计广告的上限数量,以减小系统的运算量,降低系统负担。本实施例采用流式统计方式,统计时,可以设置一个流式统计列表,用来存放统计结果,本实施例采用如下规则更新统计数据:
[0069]I),如果广告已经曝光,则更新曝光量。
[0070]2),如果广告没有曝光,且统计的广告数量没有达到预设数量的上限,则新增广告并更新数据。
[0071]3),如果广告没有曝光,且广告数量已经达到预设数量的上限,则优先淘汰最近最少更新的广告,因为该广告被认为并不会频繁出现在受众用户的推荐列表中。
[0072]候选广告在一定时间内的曝光量可以直接从该流式统计列表中获取。特别的,当一个候选广告并没有出现在流式统计列表中时,可以认为该候选没有被曝光。
[0073]S208,对候选广告进行筛选,获取曝光量小于第一阈值,或未曝光且相同或相似广告的曝光量小于第二阈值的候选广告,并将所述获取的候选广告作为待投放广告。
[0074]当一个候选广告对于受众用户的曝光量小于第一阈值(第一阈值可以根据需要来设定,如5次),这里是指该候选广告已经曝光过,且其曝光量小于第一阈值,说明该候选广告已经通过相似性审核,并且没有达到预定曝光量,仍然具有投放价值,所以将其作为待投放广告。
[0075]如果一个候选广告没有被曝光过(即曝光量为O或曝光量无法从流式统计列表中获得),则需要审核其与其它广告的相似性。利用步骤S206获得的计算结果,可以得到与该候选广告相同或相似的广告,然后从流式统计列表查找这些相同或相似广告对于受众用户的曝光量并求和(如果某个广告不存在于流式统计列表,则认为该广告的曝光量为0),如果与该候选广告相同或相似广告对于受众用户总的曝光量小于第二阈值(第二阈值可以根据需要来设定,如10次),则认为该候选广告具有投放价值,并将其作为待投放广告。
[0076]具体来说,筛选过程可以分为以下几步:
[0077]1),按照步骤S204给定的候选广告订单循环筛选;
[0078]2),如果候选广告已经曝光,且曝光次数小于第一阈值,则跳转到步骤S209 ;
[0079]3),如果候选广告已经曝光,且曝光次数大于第一阈值,则返回到I ;
[0080]4),如果候选广告没有曝光,且相似或相同的广告的曝光次数小于第二阈值,则跳转到步骤S209 ;
[0081]5),如果候选广告没有曝光,且相似或相同的广告的曝光次数大于第二阈值,则跳转到I。
[0082]S209,投放所述待投放广告。
[0083]本发明实施例的广告投放方法,通过对广告之间相似性的计算,并结合历史统计信息,可以有效控制受众用户对相同或相似素材的广告的观看次数,解决了相同或相似广告重复曝光而对用户造成审美疲劳的问题,以及盗用欺诈投放的问题,从而提高广告投放效果及收益。
[0084]本发明实施例另提出一种广告筛选方法,其可以配合现有的各类广告投放系统,对现有的广告投放系统给出的候选广告进行筛选,剔除其中相同或相似广告曝光次数过多的候选广告,以避免相同素材广告的重复曝光。请参见图5,其为本发明实施例的一种广告筛选方法的流程图,其包括以下步骤:
[0085]S501,提取所有广告的图像特征。
[0086]提取图像特征的对象是系统数据库中的所有广告,以便于可以全面评估广告之间的相似性,可以在广告主上传广告的时候就对素材图像进行特征提取。本实施例通过Gist技术提取广告的图像特征,Gist技术是MIT大学教授提出的一类图像特征特征提取方法。
[0087]S502,根据提取的图像特征,获取与各个候选广告相同或相似的广告。
[0088]可以先将图像特征转换成SimHash值,然后通过对比SimHash值来计算各个广告之间的相似性。从而,通过比对SimHash值,就可以获取与各个候选广告相同或相似的广生口 ο
[0089]S503,获取候选广告对受众用户在一定时间内的曝光量。
[0090]受众用户群在点击或者曝光广告之后,日志数据将实时流入系统,因而可以统计到广告在每个受众用户上的曝光数据。具体来说,可以利用广告投放系统流式统计的预设数量的广告对受众用户在一定时间段内的曝光量,并从统计结果中获取所述候选广告的曝光量。
[0091]S504,对候选广告进行筛选,获取曝光量小于第一阈值,或未曝光且相同或相似广告的曝光量小于第二阈值的候选广告,并将所述获取的候选广告作为待投放广告。
[0092]当一个候选广告的曝光量小于第一阈值(第一阈值可以根据需要来设定,如5次),这里是指该候选广告已经曝光过,且其曝光量小于第一阈值,说明该候选广告已经通过相似性审核,并具有投放价值,所以将其作为待投放广告。
[0093]如果一个候选广告没有被曝光过(即曝光量为O或曝光量无法从系统的
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1