信息处理方法和装置与流程

文档序号:11063864阅读:253来源:国知局
信息处理方法和装置与制造工艺

本申请涉及信息处理领域,具体而言,涉及一种信息处理方法和装置。



背景技术:

互联网广告就是通过网络平台在网络上投放广告,利用网站上的广告条幅、文本链接、多媒体的方法,在互联网上刊登或发布广告,通过网络传递到互联网用户的一种高科技广告运作方法。与传统的四大媒体(报纸、杂志、电视、广播)广告及户外广告相比,互联网广告具有得天独厚的优势,是一种重要的现代营销方式。

广告的收费依据主要有CPC(Cost Per Click)、CPP(Cost Per Purchase)、CPM(Cost Per Mille)、CPA(Cost Per Action)等。投资回报率ROI(Return on Investment)是衡量互联网广告成功与否的重要标准,而围绕提高ROI这个目的,有很多工作要做,包括人群筛选、优化广告的物料、选取合适的着陆页面等。

广告投放人群的选择是非常重要的。很显然不是任何一个访客都会对广告商投放的广告和广告所推销的产品产生兴趣,对广告商的产品感兴趣的访客比较容易购买产品,带来较高的转化率,而那些不关心广告商的产品的人群肯定是很难带来转化的,或者说要让他们买产品需要花费更多的心思和精力。

目前互联网广告投放盲目,对访客进行筛选的精确度低,因此广告的效果不好。

针对上述的问题,目前尚未提出有效的解决方案。



技术实现要素:

本申请实施例提供了一种信息处理方法和装置,以至少解决现有技术中对访客进行筛选的精确度比较低的技术问题。

根据本申请实施例的一个方面,提供了一种信息处理方法,包括:获取m个访客访问广告的访客数据,其中,每个所述访客数据均包括访客标识和访问所述广告的时间数值,同一个所述访客标识对应至少一个所述时间数值,m≥2;利用m个访客标识和所述m个访客标识对应的时间数值,计算出所述m个访客访问所述广告的访问波动值,其中,所述访问波动值表示访客访问所述广告的波动程度;确定所述m个访客访问广 告的访问波动值的极值;以及根据所述极值,确定第一目标访客,其中,所述第一目标访客为第一目标波动值对应的访客,所述第一目标波动值为按照所述极值确定出的访问波动值。

进一步地,所述m个访客的访客数据为在采样周期内获取到的数据,所述采样周期具有多个时间切片,所述时间数值为访问所述广告的时间所处的时间切片在所述采样周期内的次序,利用m个访客标识和所述m个访客标识对应的时间数值,计算出所述m个访客的访问波动值包括:按照公式计算访客标识Ui所表示的访客访问广告的访问波动值,其中,ni为所述访客标识Ui所表示的访客的时间数值的数量,xij为所述访客标识Ui所表示的访客的第j个时间数值,为所述访客标识Ui所表示的访客访问广告的时间数值的平均值,为所述访客标识Ui所表示的访客访问广告的访问波动值,i依次取1至m,访客标识U1至访客标识Um构成所述m个访客的访客标识。

进一步地,确定所述m个访客的波动值的极值包括:确定具有访客标识Ui的访问数据的数量为所述访客标识Ui表示的访客访问广告的访问量,其中,i依次取1至m,访客标识U1至访客标识Um构成所述m个访客的访客标识;确定访问量大于第一预设数量的访客为第二目标访客;以及计算第二目标波动值的平均值,得到所述极值,其中,所述第二目标波动值为所述第二目标访客的波动值。

进一步地,在根据所述极值,确定第一目标访客之后,所述方法还包括:确定具有访客标识Ui的访问数据的数量为所述访客标识Ui表示的访客的访问量,其中,i依次取1至m,访客标识U1至访客标识Um构成所述m个访客的访客标识;以及提取出访问量大于第二预设数量的所述第一目标访客。

进一步地,每个所述访客数据均包括访问所述广告的IP地址,在根据所述极值,确定第一目标访客之后,所述方法还包括:利用所述第一目标访客的IP地址确定所述第一目标访客的地域分布。

根据本申请实施例的另一方面,提供了一种信息处理装置,包括:获取单元,用于获取m个访客访问广告的访客数据,其中,每个所述访客数据均包括访客标识和访问所述广告的时间数值,同一个所述访客标识对应至少一个所述时间数值,m≥2;计算单元,用于利用m个访客标识和所述m个访客标识对应的时间数值,计算出所述m个访客访问所述广告的访问波动值,其中,所述访问波动值表示访客访问所述广告的波 动程度;第一确定单元,用于确定所述m个访客访问广告的访问波动值的极值;以及第二确定单元,用于根据所述极值,确定第一目标访客,其中,所述第一目标访客为第一目标波动值对应的访客,所述第一目标波动值为按照所述极值确定出的访问波动值。

进一步地,所述m个访客的访客数据为在采样周期内获取到的数据,所述采样周期具有多个时间切片,所述时间数值为访问所述广告的时间所处的时间切片在所述采样周期内的次序,所述计算单元包括:计算子单元,用于按照公式计算访客标识Ui所表示的访客访问广告的访问波动值,其中,ni为所述访客标识Ui所表示的访客的时间数值的数量,xij为所述访客标识Ui所表示的访客的第j个时间数值,为所述访客标识Ui所表示的访客访问广告的时间数值的平均值,为所述访客标识Ui所表示的访客访问广告的访问波动值,i依次取1至m,访客标识U1至访客标识Um构成所述m个访客的访客标识。

进一步地,所述第一确定单元包括:第一确定子单元,用于确定具有访客标识Ui的访问数据的数量为所述访客标识Ui表示的访客访问广告的访问量,其中,i依次取1至m,访客标识U1至访客标识Um构成所述m个访客的访客标识;第二确定子单元,用于确定访问量大于第一预设数量的访客为第二目标访客;以及计算子单元,用于计算第二目标波动值的平均值,得到所述极值,其中,所述第二目标波动值为所述第二目标访客的波动值。

进一步地,所述装置还包括:第三确定单元,用于在所述第二确定单元根据所述极值,确定第一目标访客之后,确定具有访客标识Ui的访问数据的数量为所述访客标识Ui表示的访客的访问量,其中,i依次取1至m,访客标识U1至访客标识Um构成所述m个访客的访客标识;以及提取单元,用于提取出访问量大于第二预设数量的所述第一目标访客。

进一步地,每个所述访客数据均包括访问所述广告的IP地址,所述装置还包括:第四确定单元,用于在所述第二确定单元根据所述极值,确定第一目标访客之后,利用所述第一目标访客的IP地址确定所述第一目标访客的地域分布。

在本申请实施例中,采用获取m个访客访问广告的访客数据,其中,每个所述访客数据均包括访客标识和访问所述广告的时间数值,同一个所述访客标识对应至少一个所述时间数值,m≥2;利用m个访客标识和所述m个访客标识对应的时间数值,计 算出所述m个访客访问所述广告的访问波动值,其中,所述访问波动值表示访客访问所述广告的波动程度;确定所述m个访客访问广告的访问波动值的极值;以及根据所述极值,确定第一目标访客,其中,所述第一目标访客为第一目标波动值对应的访客,所述第一目标波动值为按照所述极值确定出的访问波动值,通过获取访客访问广告的访客数据,利用访客数据包含的访客标识和时间数值计算出访客标识所标识的访客的访问波动值,将访客的访问波动值与阈值进行对比,筛选出访问波动值小于阈值的访客,达到了筛选出访问波动值小于阈值的访客的目的,从而实现了提高访客的筛选精确度的技术效果,进而解决了现有技术中对访客进行筛选的精确度比较低的技术问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1是根据本申请实施例的信息处理方法的流程图;

图2是根据本申请实施例的信息处理方法进行信息处理的流程图;以及

图3是根据本申请实施例的信息处理装置的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本申请实施例,提供了一种信息处理方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且, 虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本申请实施例的信息处理方法的流程图,如图1所示,该方法包括如下步骤:

步骤S102,获取m个访客访问广告的访客数据,其中,每个访客数据均包括访客标识和访问广告的时间数值,同一个访客标识对应至少一个时间数值,m≥2。访问广告商所投放的广告的访客有多个,每个访客的访问数据一般来说也有多个,每个访客数据都包含了访客访问广告的时间信息和访客标识,该访客标识用来唯一标识一个访客。提取出一段时间内访客访问广告的访客数据,这段时间可以为一年,也可以为几个月,等等。本申请实施例以提取一整年时间的访客访问广告的访客数据为例进行说明,对于提取几个月时间访客访问广告的访客数据的情况以此类推。

步骤S104,利用m个访客标识和m个访客标识对应的时间数值,计算出m个访客访问广告的访问波动值,其中,访问波动值表示访客访问广告的波动程度。把一年365天中的每一天均按照属于一年中的第几天计数,不使用月份进行计数,即1月的20号记为第20天,2月的5号记为第36天,3月的7号记为第66天,当一年有366天(闰年)时日期的计数方法以此类推。下面如无特殊说明,都以一年有365天为例进行计算。需要注意的是,本申请实施例中,计算访客访问广告的访问波动值时,无论一个访客在某一天对广告进行了一次访问还是若干次访问,都只计算一次。例如,访客甲在1月5号的13:00:00和18:10:00都访问了广告,在计算访问波动值时,认为访客甲在1月5号访问了广告,至于访客甲在1月5号访问了广告一次还是多次,这个问题并不体现在对访客访问波动值的计算当中。

访客访问广告的访问波动值可以使用方差、标准差、极差等表示。

步骤S106,确定m个访客访问广告的访问波动值的极值。

步骤S108,根据极值,确定第一目标访客,其中,第一目标访客为第一目标波动值对应的访客,第一目标波动值为按照极值确定出的访问波动值。

上述访问波动值的极值是一个阈值,访问波动值小于该阈值的访客是潜在的高质量访客。访问波动值的阈值的确定方式可以有多种,例如,方式一:当计算出b个访客的访问波动值之后,按照访问波动值从小到大进行排序,选取访问波动值排在第30%的访客的访问波动值作为访问波动值的阈值;方式二:当计算出b个访客的访问波动值之后,按照访问波动值从小到大进行排序,选取访问波动值排在前50%的访客的访问波动值的平均值作为访问波动值的阈值。访问波动值的阈值的计算方式很多,不局 限于以上提到的两种。如果想筛选出访问广告的时间较为集中的访客,就可以把访问波动值的阈值设置得低一些。

例如,从广告的监测数据中提取出访客甲、访客乙、访客丙、访客丁访问广告的访客数据。

访客甲的访客数据包含的时间信息分别为2月1号、3月4号、3月12号、6月23号、8月16号、8月25号、10月19号、11月11号、12月12号、12月18号,也就是说,访客甲在这10个日期访问了广告,这10个日期按照天数计数为第32天、第63天、第71天、第174天、第228天、第237天、第292天、第315天、第346天、第352天。

访客乙的访问数据包含的时间信息分别为8月15号、8月19号、8月23号、9月17号、9月24号、9月28号、10月7号、10月9号、11月14号、11月26号、12月27号、12月28号,也就是说,访客乙在这12个日期访问了广告,这12个日期按照天数计算为第227天、第231天、第235天、第260天、第267天、第271天、第280天、第282天、第318天、第330天、第361天、第362天。

访客丙的访问数据包含的时间信息分别为10月28号、10月29号、10月30号、11月17号、11月19号、11月24号、12月24号、12月26号、12月30号,也就是说,访客丙在这9个日期访问了广告,这9个日期按照天数计算为第301天、第302天、第303天、第321天、第323天、第328天、第358天、第360天、第364天。

访客丁的访问数据包含的时间信息分别为11月15号、11月18号、11月22号、12月6号、12月14号、12月15号、12月27号、12月31号,也就是说,访客丁在这8个日期访问了广告,这8个日期按照天数计算为第319天、第322天、第326天、第340天、第348天、第349天、第361天、第365天。

使用极差表示访客的访问波动值,访客甲的访问日期的极差为320;访客乙的访问日期的极差为135;访客丙的访问日期的极差为63;访客丁的访问日期的极差为46。亦即访客甲的访问波动值为320;访客乙的访问波动值为135;访客丙的访问波动值为63;访客丁的访问波动值为46。

假设波动值的极值为200。把访客甲、访客乙、访客丙、访客丁的访问波动值分别与200进行对比,由于访问波动值135、访问波动值63和访问波动值46小于访问波动值的极值200,因此,访问波动值135、访问波动值63和访问波动值46是第一目标波动值。第一目标波动值对应的访客是第一目标访客,故访客乙、访客丙、访客丁是第一目标访客,也就是潜在的高质量访客。

本申请实施例所提供的信息处理方法,通过获取访客访问广告的访客数据,利用访客数据包含的访客标识和时间数值计算出访客标识所标识的访客的访问波动值,将访客的访问波动值与阈值进行对比,筛选出访问波动值小于阈值的访客,达到了筛选出访问波动值小于阈值的访客的目的,从而实现了提高访客的筛选精确度的技术效果,进而解决了现有技术中对访客进行筛选的精确度比较低的技术问题。

可选地,m个访客的访客数据为在采样周期内获取到的数据,采样周期具有多个时间切片,时间数值为访问广告的时间所处的时间切片在采样周期内的次序,利用m个访客标识和m个访客标识对应的时间数值,计算出m个访客的访问波动值包括:按照公式计算访客标识Ui所表示的访客访问广告的访问波动值,其中,ni为访客标识Ui所表示的访客的时间数值的数量,xij为访客标识Ui所表示的访客的第j个时间数值,为访客标识Ui所表示的访客访问广告的时间数值的平均值,为访客标识Ui所表示的访客访问广告的访问波动值,i依次取1至m,访客标识U1至访客标识Um构成m个访客的访客标识。

在本申请实施例中,可以把一年作为一个采样周期,也可以把一个月作为一个采样周期,还可以把一周作为一个采样周期,还可以把几个月作为一个采样周期。当把一年作为一个采样周期时,可以把每一天作为一个时间切片,也可以把每一个月作为一个时间切片。当把一个月作为一个采样周期时,可以把每一天作为一个时间切片。采样周期和时间切片的大小可以依据实际情况而定,不局限于上述几种例子。在本申请实施例中,把一年作为一个采样周期,把一天作为一个时间切片。可以使用方差表示访客的访问日期的波动值。由于一组数据的方差能够反映这组数据偏离平均值的程度,故访客的访问日期的方差能够反映访客的访问日期与访问日期的平均值偏离的程度,很好地反映访客访问广告的访问波动值。

例如,访客甲在10个日期访问了广告,这10个日期分别为第32天、第63天、第71天、第174天、第228天、第237天、第292天、第315天、第346天、第352天。

访客乙在12个日期访问了广告,这12个日期分别为第227天、第231天、第235天、第260天、第267天、第271天、第280天、第282天、第318天、第330天、第361天、第362天。

访客丙在9个日期访问了广告,这9个日期分别为第301天、第302天、第303 天、第321天、第323天、第328天、第358天、第360天、第364天。

访客丁在8个日期访问了广告,这8个日期分别为第319天、第322天、第326天、第340天、第348天、第349天、第361天、第365天。

使用方差计算公式,可以得到访客甲的访问日期的方差是13136.2;访客乙的访问日期的方差是2064.72;访客丙的访问日期的方差是590.77;访客丁的访问日期的方差是269.94。即,访客甲的访问波动值是13136.2;访客乙的访问波动值是2064.72;访客丙的访问波动值是590.77;访客丁的访问波动值是269.94。

在访客甲、访客乙、访客丙、访客丁4位访客中,访客甲的访问日期的方差是最大的,访客丁的访问日期的方差是最小的,访客甲对广告的10次访问分布在2月到12月之间,访客丁对广告的8次访问分布在11月与12月,虽然访客甲在一年中有10天访问了广告,访客丁在一年中仅有8天访问了广告,但是访客丁在11月与12月频繁地访问了广告,说明访客丁对广告产生了浓厚的兴趣,访客丁很有可能对广告所推销的产品有需求,因此相比于访客甲,访客丁是更有购买潜力的顾客。

可选地,确定m个访客的波动值的极值包括:确定具有访客标识Ui的访问数据的数量为访客标识Ui表示的访客访问广告的访问量,其中,i依次取1至m,访客标识U1至访客标识Um构成m个访客的访客标识;确定访问量大于第一预设数量的访客为第二目标访客;以及计算第二目标波动值的平均值,得到极值,其中,第二目标波动值为第二目标访客的波动值。

即,波动值的极值的确定方式可以为以下方式:先找出访问量大于一定数量(即第一预设数量)的访客,即第二目标访客,计算第二目标访客的访问波动值,把第二目标访客的访问波动值的平均值作为上述极值。

可选地,在根据极值,确定第一目标访客之后,本申请实施例所提供的信息处理方法还包括:确定具有访客标识Ui的访问数据的数量为访客标识Ui表示的访客的访问量,其中,i依次取1至m,访客标识U1至访客标识Um构成m个访客的访客标识;以及提取出访问量大于第二预设数量的第一目标访客。

例如,访客甲在10个日期访问了广告,这10个日期分别为第32天、第63天、第71天、第174天、第228天、第237天、第292天、第315天、第346天、第352天。

访客乙在12个日期访问了广告,这12个日期分别为第227天、第231天、第235天、第260天、第267天、第271天、第280天、第282天、第318天、第330天、第361天、第362天。

访客丙在9个日期访问了广告,这9个日期分别为第301天、第302天、第303天、第321天、第323天、第328天、第358天、第360天、第364天。

访客丁在8个日期访问了广告,这8个日期分别为第319天、第322天、第326天、第340天、第348天、第349天、第361天、第365天。

访客戊在2个日期访问了广告,这2个日期分别为第73天、第75天。

访客甲的访问日期的方差是13136.2;访客乙的访问日期的方差是2064.72;访客丙的访问日期的方差是590.77;访客丁的访问日期的方差是269.94;访客戊的访问日期的方差是1。即,访客甲的访问波动值是13136.2;访客乙的访问波动值是2064.72;访客丙的访问波动值是590.77;访客丁的访问波动值是269.94;访客戊的访问波动值是1。

将访问波动值的极值设置为1000,由于访客丙、访客丁、访客戊的访问波动值小于1000,因此,访客丙、访客丁、访客戊是第一目标访客,也就是说,访客丙、访客丁、访客戊是潜在的高质量客户。然而,分析访客的访问数据,可以发现,访客戊仅在第73天和第74天访问了广告,之后一直没有访问广告,可以推测访客戊已经对广告推销的产品失去兴趣,因此访客戊不应该成为广告的重点推广对象。为了解决这一问题,需要对第一目标访客进行过滤,具体方法为设置一个第二预设数量,只有访问量超过该第二预设数量的第一目标访客才能被提取出来。例如,把第二预设数量设置为5,在访客丙、访客丁、访客戊3位第一目标访客中,由于访客丙、访客丁的访问量均大于第二预设数量5,因此,提取出访客丙、访客丁,把访客丙和访客丁作为广告的重点推广对象。由于访客戊的访问量小于第二预设数量5,因此,即使访客戊的波动值小于阈值,也不会作为广告的重点推广对象。

通过提取出访问量大于第二预设数量的第一目标访客,得到了那些波动值小且访问量大的访客,这部分访客访问广告的访问时间集中且访问量大,是对广告商的产品有很强的需求的客户,也容易产生购买行为,应该把这部分人群作为广告的重点推广对象。过滤掉那些波动值小且访问量小的访客,这些访客对广告商的产品的需求并不强烈,这部分人群不应该作为广告的重点推广对象。

可选地,每个访客数据均包括访问广告的IP地址,在根据极值,确定第一目标访客之后,本申请实施例所提供的信息处理方法还包括:利用第一目标访客的IP地址确定第一目标访客的地域分布。

即,当筛选出第一目标访客之后,利用第一目标访客的IP地址分析第一目标访客的地域分布特点。例如,经过筛选,得到1000个第一目标访客,即得到1000个潜在 的高质量访客,其中,550个第一目标访客位于北京,360个第一目标访客位于河北省,其余的90个第一目标访客零散地分布于其他省市。这些潜在的高质量访客对该广告商的产品有兴趣,可能会带来较高的转化率和投资回报率。因此,广告商在投放广告时,可以对北京和河北省加大投放广告的力度。

图2是根据本申请实施例的信息处理方法进行信息处理的流程图,如图2所示,在进行信息处理过程中,主要包括以下步骤:

步骤S202,在广告平台部署广告商广告监测代码。

步骤S204,获取第三方广告监测数据。

步骤S206,选定有限时间段访客数据。即,从广告的监测数据中提取一段时间内访客访问广告的访客数据,步骤S204和步骤S206的具体实施方式与上述步骤S102相同,此处不再赘述。

步骤S208,选取访问量前30%的访客数据。此实施例中,也可以选取访问量为前A%的访客数据,A可以根据实际需要选取。

步骤S210,由选取的访客数据确定波动值的阈值。计算选取出来的访问量前30%的访客的访问日期的方差的平均值,该平均值即为波动值的阈值。步骤S208和步骤S210的具体实施方式与上述步骤S106相同。

步骤S212,对访客的访问日期进行方差分析。即,利用多个访客标识和多个时间信息计算出每个访客的访问日期的方差,步骤S212的具体实施方式与上述步骤S104相同。

步骤S214,判断访客访问日期的方差是否在波动值的阈值内。即通过对比多个波动值与波动值的阈值的大小,筛选出第一目标访客。步骤S214的具体实施方式与上述步骤S108相同。

步骤S216,如果判断出访客访问日期的方差在波动值的阈值内,存储高质量访客地域标签和时间标签。即,访问日期的方差在波动值的阈值之内的访客是第一目标访客,也就是潜在的高质量访客。

在定位互联网广告所推销的产品的潜在顾客时,访客的年龄、性别、收入情况、兴趣爱好、职位等参数都可以作为互联网广告投放的筛选条件。但是这样的筛选是不够的,因为虽然可以知道潜在人群具有这样的特性,但不能保证具有这样特性的人群就一定会对产品感兴趣。所以最好的筛选方式是跟踪广告平台上的实际操作情况,通过人们的搜索、阅读、点击等行为来判断是不是某类广告、产品的潜在用户。通过这 样的方式进行人群筛选效果是最好的。

通过上述步骤,可以实现筛选出波动值低于阈值的访客的筛选方式,解决了现有技术中对访客的筛选精确度比较低的技术问题,达到了提高访客的筛选精确度的技术效果。

根据本申请实施例,还提供了一种信息处理装置,该信息处理装置可以执行上述信息处理方法,上述信息处理方法也可以通过该信息处理装置实施。

图3是根据本申请实施例的信息处理装置的示意图。如图3所示,该装置包括:获取单元30、计算单元32、第一确定单元34和第二确定单元36。

获取单元30用于获取m个访客访问广告的访客数据,其中,每个访客数据均包括访客标识和访问广告的时间数值,同一个访客标识对应至少一个时间数值,m≥2。访问广告商所投放的广告的访客有多个,每个访客的访问数据一般来说也有多个,每个访客数据都包含了访客访问广告的时间信息和访客标识,该访客标识用来唯一标识一个访客。提取出一段时间内访客访问广告的访客数据,这段时间可以为一年,也可以为几个月,等等。本申请实施例以提取一整年时间的访客访问广告的访客数据为例进行说明,对于提取几个月时间访客访问广告的访客数据的情况以此类推。

计算单元32用于利用m个访客标识和m个访客标识对应的时间数值,计算出m个访客访问广告的访问波动值,其中,访问波动值表示访客访问广告的波动程度。把一年365天中的每一天均按照属于一年中的第几天计数,不使用月份进行计数,即1月的20号记为第20天,2月的5号记为第36天,3月的7号记为第66天,当一年有366天(闰年)时日期的计数方法以此类推。下面如无特殊说明,都以一年有365天为例进行计算。需要注意的是,本申请实施例中,计算访客访问广告的访问波动值时,无论一个访客在某一天对广告进行了一次访问还是若干次访问,都只计算一次。例如,访客甲在1月5号的13:00:00和18:10:00都访问了广告,在计算访问波动值时,认为访客甲在1月5号访问了广告,至于访客甲在1月5号访问了广告一次还是多次,这个问题并不体现在对访客访问波动值的计算当中。

访客访问广告的访问波动值可以使用方差、标准差、极差等表示。

第一确定单元34用于确定m个访客访问广告的访问波动值的极值。

第二确定单元36用于根据极值,确定第一目标访客,其中,第一目标访客为第一目标波动值对应的访客,第一目标波动值为按照极值确定出的访问波动值。

上述访问波动值的极值是一个阈值,访问波动值小于该阈值的访客是潜在的高质 量访客。访问波动值的阈值的确定方式可以有多种,例如,方式一:当计算出b个访客的访问波动值之后,按照访问波动值从小到大进行排序,选取访问波动值排在第30%的访客的访问波动值作为访问波动值的阈值;方式二:当计算出b个访客的访问波动值之后,按照访问波动值从小到大进行排序,选取访问波动值排在前50%的访客的访问波动值的平均值作为访问波动值的阈值。访问波动值的阈值的计算方式很多,不局限于以上提到的两种。如果想筛选出访问广告的时间较为集中的访客,就可以把访问波动值的阈值设置得低一些。

例如,从广告的监测数据中提取出访客甲、访客乙、访客丙、访客丁访问广告的访客数据。

访客甲的访客数据包含的时间信息分别为2月1号、3月4号、3月12号、6月23号、8月16号、8月25号、10月19号、11月11号、12月12号、12月18号,也就是说,访客甲在这10个日期访问了广告,这10个日期按照天数计数为第32天、第63天、第71天、第174天、第228天、第237天、第292天、第315天、第346天、第352天。

访客乙的访问数据包含的时间信息分别为8月15号、8月19号、8月23号、9月17号、9月24号、9月28号、10月7号、10月9号、11月14号、11月26号、12月27号、12月28号,也就是说,访客乙在这12个日期访问了广告,这12个日期按照天数计算为第227天、第231天、第235天、第260天、第267天、第271天、第280天、第282天、第318天、第330天、第361天、第362天。

访客丙的访问数据包含的时间信息分别为10月28号、10月29号、10月30号、11月17号、11月19号、11月24号、12月24号、12月26号、12月30号,也就是说,访客丙在这9个日期访问了广告,这9个日期按照天数计算为第301天、第302天、第303天、第321天、第323天、第328天、第358天、第360天、第364天。

访客丁的访问数据包含的时间信息分别为11月15号、11月18号、11月22号、12月6号、12月14号、12月15号、12月27号、12月31号,也就是说,访客丁在这8个日期访问了广告,这8个日期按照天数计算为第319天、第322天、第326天、第340天、第348天、第349天、第361天、第365天。

使用极差表示访客的访问波动值,访客甲的访问日期的极差为320;访客乙的访问日期的极差为135;访客丙的访问日期的极差为63;访客丁的访问日期的极差为46。亦即访客甲的访问波动值为320;访客乙的访问波动值为135;访客丙的访问波动值为63;访客丁的访问波动值为46。

假设波动值的极值为200。把访客甲、访客乙、访客丙、访客丁的访问波动值分别与200进行对比,由于访问波动值135、访问波动值63和访问波动值46小于访问波动值的极值200,因此,访问波动值135、访问波动值63和访问波动值46是第一目标波动值。第一目标波动值对应的访客是第一目标访客,故访客乙、访客丙、访客丁是第一目标访客,也就是潜在的高质量访客。

本申请实施例所提供的信息处理装置,通过获取单元30获取访客访问广告的访客数据,计算单元32利用访客数据包含的访客标识和时间数值计算出访客标识所标识的访客的访问波动值,第一确定单元34确定出访客访问广告的访问波动值的阈值,第二确定单元36将访客的访问波动值与阈值进行对比,筛选出访问波动值小于阈值的访客,达到了筛选出访问波动值小于阈值的访客的目的,从而实现了提高访客的筛选精确度的技术效果,进而解决了现有技术中对访客进行筛选的精确度比较低的技术问题。

可选地,m个访客的访客数据为在采样周期内获取到的数据,采样周期具有多个时间切片,时间数值为访问广告的时间所处的时间切片在采样周期内的次序,计算单元包括计算子单元。该计算子单元用于按照公式计算访客标识Ui所表示的访客访问广告的访问波动值,其中,ni为访客标识Ui所表示的访客的时间数值的数量,xij为访客标识Ui所表示的访客的第j个时间数值,为访客标识Ui所表示的访客访问广告的时间数值的平均值,为访客标识Ui所表示的访客访问广告的访问波动值,i依次取1至m,访客标识U1至访客标识Um构成m个访客的访客标识。

在本申请实施例中,可以把一年作为一个采样周期,也可以把一个月作为一个采样周期,还可以把一周作为一个采样周期,还可以把几个月作为一个采样周期。当把一年作为一个采样周期时,可以把每一天作为一个时间切片,也可以把每一个月作为一个时间切片。当把一个月作为一个采样周期时,可以把每一天作为一个时间切片。采样周期和时间切片的大小可以依据实际情况而定,不局限于上述几种例子。在本申请实施例中,把一年作为一个采样周期,把一天作为一个时间切片。可以使用方差表示访客的访问日期的波动值。由于一组数据的方差能够反映这组数据偏离平均值的程度,故访客的访问日期的方差能够反映访客的访问日期与访问日期的平均值偏离的程度,很好地反映访客访问广告的访问波动值。

例如,访客甲在10个日期访问了广告,这10个日期分别为第32天、第63天、第71天、第174天、第228天、第237天、第292天、第315天、第346天、第352 天。

访客乙在12个日期访问了广告,这12个日期分别为第227天、第231天、第235天、第260天、第267天、第271天、第280天、第282天、第318天、第330天、第361天、第362天。

访客丙在9个日期访问了广告,这9个日期分别为第301天、第302天、第303天、第321天、第323天、第328天、第358天、第360天、第364天。

访客丁在8个日期访问了广告,这8个日期分别为第319天、第322天、第326天、第340天、第348天、第349天、第361天、第365天。

使用方差计算公式,可以得到访客甲的访问日期的方差是13136.2;访客乙的访问日期的方差是2064.72;访客丙的访问日期的方差是590.77;访客丁的访问日期的方差是269.94。即,访客甲的访问波动值是13136.2;访客乙的访问波动值是2064.72;访客丙的访问波动值是590.77;访客丁的访问波动值是269.94。

在访客甲、访客乙、访客丙、访客丁4位访客中,访客甲的访问日期的方差是最大的,访客丁的访问日期的方差是最小的,访客甲对广告的10次访问分布在2月到12月之间,访客丁对广告的8次访问分布在11月与12月,虽然访客甲在一年中有10天访问了广告,访客丁在一年中仅有8天访问了广告,但是访客丁在11月与12月频繁地访问了广告,说明访客丁对广告产生了浓厚的兴趣,访客丁很有可能对广告所推销的产品有需求,因此相比于访客甲,访客丁是更有购买潜力的顾客。

可选地,第一确定单元34包括第一确定子单元、第二确定子单元和计算子单元。第一确定子单元用于确定具有访客标识Ui的访问数据的数量为访客标识Ui表示的访客访问广告的访问量,其中,i依次取1至m,访客标识U1至访客标识Um构成m个访客的访客标识。第二确定子单元用于确定访问量大于第一预设数量的访客为第二目标访客。计算子单元用于计算第二目标波动值的平均值,得到极值,其中,第二目标波动值为第二目标访客的波动值。

即,波动值的极值的确定方式可以为以下方式:先找出访问量大于一定数量(即第一预设数量)的访客,即第二目标访客,计算第二目标访客的访问波动值,把第二目标访客的访问波动值的平均值作为上述极值。

可选地,本申请实施例所提供的信息处理装置还包括第三确定单元和提取单元。第三确定单元用于在第二确定单元根据极值,确定第一目标访客之后,确定具有访客标识Ui的访问数据的数量为访客标识Ui表示的访客的访问量,其中,i依次取1至m,访客标识U1至访客标识Um构成m个访客的访客标识。提取单元用于提取出访问量大 于第二预设数量的第一目标访客。

例如,访客甲在10个日期访问了广告,这10个日期分别为第32天、第63天、第71天、第174天、第228天、第237天、第292天、第315天、第346天、第352天。

访客乙在12个日期访问了广告,这12个日期分别为第227天、第231天、第235天、第260天、第267天、第271天、第280天、第282天、第318天、第330天、第361天、第362天。

访客丙在9个日期访问了广告,这9个日期分别为第301天、第302天、第303天、第321天、第323天、第328天、第358天、第360天、第364天。

访客丁在8个日期访问了广告,这8个日期分别为第319天、第322天、第326天、第340天、第348天、第349天、第361天、第365天。

访客戊在2个日期访问了广告,这2个日期分别为第73天、第75天。

访客甲的访问日期的方差是13136.2;访客乙的访问日期的方差是2064.72;访客丙的访问日期的方差是590.77;访客丁的访问日期的方差是269.94;访客戊的访问日期的方差是1。即,访客甲的访问波动值是13136.2;访客乙的访问波动值是2064.72;访客丙的访问波动值是590.77;访客丁的访问波动值是269.94;访客戊的访问波动值是1。

将访问波动值的极值设置为1000,由于访客丙、访客丁、访客戊的访问波动值小于1000,因此,访客丙、访客丁、访客戊是第一目标访客,也就是说,访客丙、访客丁、访客戊是潜在的高质量客户。然而,分析访客的访问数据,可以发现,访客戊仅在第73天和第74天访问了广告,之后一直没有访问广告,可以推测访客戊已经对广告推销的产品失去兴趣,因此访客戊不应该成为广告的重点推广对象。为了解决这一问题,需要对第一目标访客进行过滤,具体方法为设置一个第二预设数量,只有访问量超过该第二预设数量的第一目标访客才能被提取出来。例如,把第二预设数量设置为5,在访客丙、访客丁、访客戊3位第一目标访客中,由于访客丙、访客丁的访问量均大于第二预设数量5,因此,提取出访客丙、访客丁,把访客丙和访客丁作为广告的重点推广对象。由于访客戊的访问量小于第二预设数量5,因此,即使访客戊的波动值小于阈值,也不会作为广告的重点推广对象。

通过提取出访问量大于第二预设数量的第一目标访客,得到了那些波动值小且访问量大的访客,这部分访客访问广告的访问时间集中且访问量大,是对广告商的产品有很强的需求的客户,也容易产生购买行为,应该把这部分人群作为广告的重点推广 对象。过滤掉那些波动值小且访问量小的访客,这些访客对广告商的产品的需求并不强烈,这部分人群不应该作为广告的重点推广对象。

可选地,每个访客数据均包括访问广告的IP地址,本申请实施例所提供的信息处理装置还包括第四确定单元。该第四确定单元用于在第二确定单元根据极值,确定第一目标访客之后,利用第一目标访客的IP地址确定第一目标访客的地域分布。

即,当筛选出第一目标访客之后,利用第一目标访客的IP地址分析第一目标访客的地域分布特点。例如,经过筛选,得到1000个第一目标访客,即得到1000个潜在的高质量访客,其中,550个第一目标访客位于北京,360个第一目标访客位于河北省,其余的90个第一目标访客零散地分布于其他省市。这些潜在的高质量访客对该广告商的产品有兴趣,可能会带来较高的转化率和投资回报率。因此,广告商在投放广告时,可以对北京和河北省加大投放广告的力度。

所述信息处理装置包括处理器和存储器,上述获取单元30、计算单元32、第一确定单元34和第二确定单元36等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来提高信息处理的精确度。

存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。

本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:获取m个访客访问广告的访客数据,其中,每个访客数据均包括访客标识和访问广告的时间数值,同一个访客标识对应至少一个时间数值,m≥2;利用m个访客标识和m个访客标识对应的时间数值,计算出m个访客访问广告的访问波动值,其中,访问波动值表示访客访问广告的波动程度;确定m个访客访问广告的访问波动值的极值;根据极值,确定第一目标访客,其中,第一目标访客为第一目标波动值对应的访客,第一目标波动值为按照极值确定出的访问波动值。

上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它 的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1