一种确定广告投放媒体的方法及装置与流程

文档序号:17117548发布日期:2019-03-15 23:28阅读:178来源:国知局
一种确定广告投放媒体的方法及装置与流程
本申请涉及计算机领域,尤其涉及一种确定广告投放媒体的方法及装置。
背景技术
:对于投放广告的广告主来说,如果广告的覆盖面广,则说明广告的投放效果好。现实生活中,广告主投放广告时,可能不仅仅将广告投放于一家媒体。特别是对于当前网络发达的环境而言,广告主期望扩大其广告的覆盖面,会在很多网站投放广告。本申请中,各个门户网站、内容提供网站或者其客户端,以及搜索网站,例如百度、360等,都可以称为广告投放媒体。目前广告可以实现网页广告和客户端广告的分离,各个门户网站或者内容提供网站对应的客户端也可以称为广告投放媒体。门户网站例如新浪、搜狐、网易等等,内容提供网站例如优酷、爱奇艺等等,客户端可以包括新浪、搜狐、网易、优酷、爱奇艺、百度、360等客户端。此外,本申请所称的广告投放媒体还可以包括一些新兴的客户端,例如快手、抖音等客户端。随着互联网的发展,通过对用户数据进行挖掘,从而实现精准的广告投放一直是广告主们期望的目标。互联网广告的用户非常广泛,例如微信之类的客户端,其发布的广告的覆盖用户可以达数十亿,具有几百万甚至上千万粉丝的微博用户,如果发布一个广告,其覆盖的用户也可以达数百万、数千万甚至上亿。对于如此多的广告受众,如何利用大数据挖掘的方法来提高广告的效果是亟待解决的问题之一。对于广告主而言,其关心的因素有多个,例如、各个媒体的覆盖面、各个媒体之间的用户重合度、以及投放广告的成本等等。对于覆盖面的计算,需要用到用户标识。对于传统纸质媒体难以通过统计用户标识来计算其覆盖面,但对于数字电视的受众而言,可以通过数字电视标识作为用户标识,因此数字电视也可以称为广告投放媒体。但是,需要说明的是,本申请并不排除传统的纸质媒体作为广告投放媒体。尽管覆盖面是广告主关注的重点之一,但是广告投放的成本也是广告主需要考虑的问题之一。因为如果广告主在不同的广告投放媒体投放广告,而这些广告投放媒体的受众存在大面积重复,这就意味着广告主因为投放广告的支出存在浪费的嫌疑。因此,为了如何平衡覆盖面以及重合度是广告主投放广告时需要解决的问题。技术实现要素:有鉴于此,本申请提出了一种确定广告投放媒体的方法及装置,以提高投放广告的效果,节约广告投放的成本。根据本申请的一个方面,提出了一种确定广告投放媒体的方法,该方法包括:计算各个候选媒体的覆盖面;计算任意两个候选媒体之间的重合度;根据所述覆盖面以及所述重合度从所述候选媒体中确定广告投放媒体。优选地,所述覆盖面根据以下公式计算:其中coverage为覆盖面,uniqueuseriduserid!=0为用户标识不为0的用户标识的数量,recordcountuserid!=0为用户标识不为0的广告数据的记录数量,recordcount为总的广告数据的记录数量。优选地,所述广告数据包括广告曝光数据和/或广告点击数据。优选地,所述覆盖面根据以下公式计算:其中,impressiongrecordcount为广告曝光数据的记录数量,clickrecordcount为广告点击数据的记录数量,impressionuniqueuseriduserid!=0为广告曝光数据中用户标识不为0的用户标识数量,clickuniqueuseriduserid!=0为广告点击数据中用户标识不为0的用户标识数量,impressionrecordcountuserid!=0为广告曝光数据中用户标识不为0的记录数量,impressionrecordcountuserid!=0为广告点击数据中用户标识不为0的记录数量。优选地,所述重合度根据下式计算:其中,overlapi,j为候选媒体i和候选媒体j之间的重合度,uniqueuseridsiteid=iandsiteid=j为候选媒体i和候选媒体j的广告数据中相同的用户标识的数量,uniqueuseridsiteid=i为候选媒体i的广告数据中的用户标识的数量。优选地,计算候选媒体之间的重合度包括:针对各个候选媒体聚合用户标识;计算任意两个候选媒体之间用户标识集合的笛卡尔积;根据笛卡尔积计算交集基数;根据所述交集基数以及所述两个候选媒体中的任意一个用户标识集合的数量计算任意两个候选媒体之间的重合度。根据本申请的另一个方面,提供出一种确定广告投放媒体的装置,该装置包括:覆盖面模块,用于计算各个候选媒体的覆盖面;重合度模块,用于计算任意两个候选媒体之间的重合度;广告投放媒体模块,用于根据所述覆盖面以及所述重合度从所述候选媒体中确定广告投放媒体。优选地,所述覆盖面模块,还用于根据以下公式计算所述覆盖面:其中coverage为覆盖面,uniqueuseriduserid!=0为用户标识不为0的用户标识的数量,recordcountuserid!=0为用户标识不为0的广告数据的记录数量,recordcount为总的广告数据的记录数量。优选地,所述广告数据包括广告曝光数据和/或广告点击数据。优选地,所述覆盖面模块,还用于根据以下公式计算覆盖面:其中,impressiongrecordcount为广告曝光数据的记录数量,clickrecordcount为广告点击数据的记录数量,impressionuniqueuseriduserid!=0为广告曝光数据中用户标识不为0的用户标识数量,clickuniqueuseriduserid!=0为广告点击数据中用户标识不为0的用户标识数量,impressionrecordccountuserid!=0为广告曝光数据中用户标识不为0的记录数量,impressionrecordcountuserid!=0为广告点击数据中用户标识不为0的记录数量。优选地,重合度模块,还用于根据下式计算重合度:其中,overlapi,j为候选媒体i和候选媒体j之间的重合度,uniqueuseridsiteid=iandsiteid=j为候选媒体i和候选媒体j的广告数据中相同的用户标识的数量,uniqueuseridsiteid=i为候选媒体i的广告数据中的用户标识的数量。优选地,重合度模块,还用于针对各个候选媒体聚合用户标识;计算任意两个候选媒体之间用户标识集合的笛卡尔积;根据笛卡尔积计算交集基数;根据所述交集基数以及所述两个候选媒体中的任意一个用户标识集合的数量计算任意两个候选媒体之间的重合度。根据本申请的再一个方面,提供了一种确定广告投放媒体的装置,该装置包括处理器和存储器,所述存储器上存储有程序;所述处理器,用于执行所述程序以实现所述的方法。根据本申请的技术方案,在投放广告时通过综合考虑媒体的覆盖面和重合度,能够使得广告投放在保证覆盖面的同时,节约广告投放的费用,从而为广告主节约了媒体推广的成本,并能够保证广告的投放效果。本申请的其它特征和优点将在随后的具体实施方式部分予以详细说明。附图说明构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施方式及其说明用于解释本申请。在附图中:图1为本申请实施例提供的确定广告投放媒体的方法示意图;图2为本申请实施例提供的计算重合度流程示意图;图3为本申请实施例提供的确定广告投放媒体的装置示意图;图4为本申请实施例提供的确定广告投放媒体的装置示意图。具体实施方式需要说明的是,在不冲突的情况下,本申请中的实施方式及各个实施方式中的特征可以相互组合。下面将参考附图并结合实施方式来详细说明本申请。本申请中,所谓覆盖面是指广告在展示与点击时所覆盖的人数。进一步细分的话,可以分为曝光覆盖面、点击覆盖面、总覆盖面等。通过计算覆盖面,投放广告的广告主可以了解在特定时间内看过广告或者与广告进行互动的用户数量,从而能够帮助广告主清楚地了解其投放广告的效果。本申请中,所谓重合度是指媒体与媒体之间重复覆盖的用户数占媒体覆盖面的百分比。通过计算广告主投放的广告媒体之间重合地,广告主可以了解所投放广告的受众之间的重合情况。如果广告主投放的若干媒体之间存在较大的重合度,广告主可以考虑选择其中的一者或者二者进行投放,从而可以降低广告主投放广告的支出,节省广告预算。本申请实施例提供的确定广告投放媒体的方法如图1所示,具体包括:步骤105,计算各个候选媒体的覆盖面;广告主在准备投放广告时,可能需要在若干个广告投放媒体上进行投放,例如广告主期望投放关于运动鞋的广告,其可能需要在新浪、搜狐、网易、百度、360、淘宝、苏宁、天猫、优酷、爱奇艺等网站或者其对应客户端上进行投放。在确定在某个或者某些广告投放媒体投放广告之前,广告主需要预先了解各个广告投放媒体(简称媒体)覆盖面。具体到如何计算覆盖面,如果该广告主之前在该广告投放媒体上投放过广告,可以使用该广告的相关数据进行计算;或者通过向一些咨询机构或者购买有关的数据然后进行计算,从而得到覆盖面。在计算覆盖面时会存在很多问题,例如,根据cookie来识别用户时,存在很多记录中因为用户禁用cookie、安全策略、浏览模式、广告投放媒体不允许监测曝光数据等原因,导致cookie中的用户标识(userid)不可用,在数据不完整的情况下正确计算出这些覆盖面就变得十分艰难。本申请中,可以采用如下两种方式进行计算。第一种方式:根据以下公式计算覆盖面:其中,coverage为覆盖面,uniqueuseriduserid!=0为用户标识不为0的用户标识的数量,recordconuntuserid!=0为用户标识不为0的广告数据的记录数量,recordcount为总的广告数据的记录数量。可以看出,式(1)没有区分广告数据的类型,例如广告数据为广告曝光数据和/或广告点击数据。在具体应用式(1)计算覆盖面时,可以将广告数据具体化为广告曝光数据或者广告点击数据,从而得到曝光覆盖面或者点击覆盖面。如果不区分广告数据的类型,可以得到总覆盖面的值。式(1)在计算曝光覆盖面、点击覆盖面时,其得到的结果与实际的情况基本上吻合,但是在计算总覆盖面时存在较大的误差。如下例所示,可以看出总覆盖面的值存在错误。uniqueuseriduserid!=0recordcountuserid!=0recordcount曝光记录101001000点击记录100100120总计1102001120用式(1)计算出来的总覆盖面为616,但是分别计算的曝光覆盖面为100,点击覆盖面为120。总覆盖面>曝光覆盖面+点击覆盖面,该结果不合理。通过对式(1)进行优化,本申请提供的第二种方式如下。根据下式计算覆盖面:其中,impressiongrecordcount为广告曝光数据的记录数量,clickrecordcount为广告点击数据的记录数量,impressionuniqueuseriduserid!=0为广告曝光数据中用户标识不为0的用户标识数量,clickuniqueuseriduserid!=0为广告点击数据中用户标识不为0的用户标识数量,impressionrecordcountuserid!=0为广告曝光数据中用户标识不为0的记录数量,impressionrecordcountuserid!=0为广告点击数据中用户标识不为0的记录数量。式(2)中区分了广告曝光数据和广告点击数据,从而使得总覆盖面的计算更加符合实际情况。步骤110,计算任意两个候选媒体之间的重合度;如上所述,广告主在准备投放广告时,可能需要在若干个广告投放媒体上进行投放,例如广告主期望投放关于运动鞋的广告,其可能需要在新浪、搜狐、网易、百度、360、淘宝、苏宁、天猫、优酷、爱奇艺等网站或者其对应客户端上进行投放,但是这些媒体之间的用户可能存在重叠,例如百度的用户和新浪的用户可能存在重叠,爱奇艺和优酷的用户可能存在重叠。相应地,如果广告主已经在多个候选媒体上投放过广告,可以通过对应的广告数据来计算媒体之间的重合度,或者可以通过向咨询机构、公关公司或者广告公司购买数据,从而计算出媒体之间的重合度。一般来说,重合度可以根据下式计算:其中,overlapi,j为候选媒体i和候选媒体j之间的重合度,uniqueuseridsiteid=iandsiteid=j为候选媒体i和候选媒体j的广告数据中相同的用户标识的数量,uniqueuseridsiteid=i为候选媒体i的广告数据中的用户标识的数量。尽管可以按照式(3)来计算媒体之间的重合度,但是具体如何实现仍然是要考虑的问题。本申请中,可以通过图2所示的流程来计算候选媒体之间的重合度。步骤115,根据所述覆盖面以及所述重合度从所述候选媒体中确定广告投放媒体。在选择广告投放媒体时,可以预先设置一定的规则,例如可以根据过去投放广告的经验,选择覆盖面大于10万的媒体,然后在所选择覆盖面大于10万的媒体中,如果两个媒体的重合度大于80%,则只选择其中覆盖面较大的媒体投放广告。当然,也可以利用其它规则来确定广告投放媒体。优选地,针对需要扩大知名度的投放,可以选择覆盖面较大、且与其他媒体重合度较低的媒体进行投放;针对需要重复影响用户的投放,可以选择覆盖面较大且与其他媒体重合度较高的媒体进行投放。如图2所示,本申请实施例提供的计算重合度的流程包括:步骤205,针对各个候选媒体聚合用户标识;本实施例中,以两个候选媒体为例,假设两个媒体为新浪和搜狐;在聚合用户标识时,可以使用thetaskech技术进行聚合,例如针对相同placementid,对收集到的广告数据中包含的用户标识进行聚合,例如聚合的结果为两个集合,新浪用户标识集合和搜狐用户标识集合,示例如下:新浪用户标识集合={sinaid0,sinaid1,……,sinaid99};搜狐用户标识集合={sohuid0,sohuid1,……,sohuid29};需要说明的是,上述两个集合中可能存在相同的元素。本申请实施例中,用户标识可以mac地址、imei、imsi、电话号码、用户名等。步骤210,计算任意两个候选媒体之间用户标识集合的笛卡尔积;笛卡尔积是指两个集合相乘得到,以上述示例为例,将新浪用户标识集合与搜狐用户标识集合相乘以后,得到如下的集合:笛卡尔积={sinaid0,sohuid0},{sinaid1,sohuid0},……,{sinaid99,sohuid0},{sinaid0,sohuid1},{sinaid1,sohuid1},……,{sinaid99,sohuid1},……,{sinaid0,sohuid30},{sinaid1,sohuid30},……,{sinaid99,sohuid30}。步骤215,根据笛卡尔积计算交集基数;笛卡尔积会将两个数组完全展开,完全展开后查询出其中两个数值完全相同的项,该集合即为交集基数;步骤220,根据所述交集基数以及所述两个候选媒体中的任意一个用户标识集合的数量计算任意两个候选媒体之间的重合度。仍参照上例,假设交集基数为20,因此可以得到重合度=20/100=20%。按照预设的规则,该重合度较低,仍然需要在两个媒体上进行投放。相应地,本申请提供了确定广告投放媒体的装置,如图3所示,该装置包括:覆盖面模块,用于计算各个候选媒体的覆盖面;重合度模块,用于计算任意两个候选媒体之间的重合度;广告投放媒体模块,用于根据所述覆盖面以及所述重合度从所述候选媒体中确定广告投放媒体。覆盖面模块可以根据上述式(1)或者式(2)计算各个候选媒体的覆盖面;重合度模块,可以根据式(3)或者图2所示的流程计算两个候选媒体之间的重合度;广告投放媒体模块可以综合考虑覆盖面以及重合度,确定最终需要投放广告的媒体。本申请实施例还提供了一种确定广告投放媒体的装置,如图4所示,该装置包括处理器和存储器,所述存储器上存储有程序;处理器,用于执行程序以实现本申请实施例提供的方法。以上所述仅为本申请的较佳实施方式而已,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1