一种确定访问页面的终端数量的方法及装置的制作方法

文档序号:7549722阅读:140来源:国知局
专利名称:一种确定访问页面的终端数量的方法及装置的制作方法
技术领域
本发明涉及互联网技术领域和计算机技术领域,尤其涉及一种确定访问页面的终端数量的方法及装置。
背景技术
在目前的互联网应用中,为了有针对性的对网站进行管理,经常需要统计网站被用户访问时,访问网站的用户量,也即访问网站的终端数量,也可以统计访问网站页面的终
端数量。现有技术中,当终端访问某一网站的页面时,网站服务器会记录访问日志,日志中可以包括该终端的标识,如IP地址,C00KIE,该终端使用的操作系统,该终端上安装的浏览器的版本,访问时间,以及该终端浏览的上一个页面的域名等信息,终端浏览的上一个页面也可以称作是页面本次被访问时的来源页面。在记录的访问日志所包括的信息中,IP和COOKIE属于能够辨别终端身份的主要信息,具有唯一性。鉴于其唯一性,IP或COOKIE作为终端标识信息,可以用来统计访问网站的终端数量,即基于每条访问日志中记录的终端标识信息,可以统计一段时间内访问一个网站的终端数量,也可以统计一段时间内访问一个或多个页面的终端的数量。然而,在用户通过终端访问网站时,经常会在短时间内多次访问一个页面或同一网站的多个页面,此时在统计访问网站的终端数量时,如果仅仅是根据访问日志中的终端标识信息进行简单叠加进行统计,显然是不准确的,而是需要对访问日志中的终端标识信息进行比对,以及对相同的终端标识信息进行排重,才能够得到准确的统计结果。然而,对于一些访问量很大的网站,例如,每天数十亿次的页面访问,在基于对终端标识信息的比对和排重处理,对访问网站的终端数量进行统计时,需要消耗大量的处理资源,且由于数据量较大仍然需要很长的时间才能得到统计结果,实际中,往往需要数组服务器共同运算数十小时才能得到结果。

发明内容
本发明实施例提供一种确定访问页面的终端数量的方法及装置,用以解决现有技术中存在的确定访问页面的终端数量所消耗的处理资源较多,效率较低的问题。本发明实施例提供一种确定访问页面的终端数量的方法,包括:获取历史时间段内访问页面集合中的页面的终端数量,以及所述历史时间段内所述页面集合中的页面被访问的次数;确定所述终端数量与所述次数的比值;基于所述比值,根据统计的评估时间段内所述页面集合中的页面被访问的次数,确定所述评估时间段内访问所述页面集合中的页面的终端数量。本发明实施例还提供一种确定访问页面的终端数量的装置,包括:获取单元,用于获取历史时间段内访问页面集合中的页面的终端数量,以及所述历史时间段内所述页面集合中的页面被访问的次数;第一确定单元,用于确定所述终端数量与所述次数的比值;第二确定单元,用于基于所述比值,根据统计的评估时间段内所述页面集合中的页面被访问的次数,确定所述评估时间段内访问所述页面集合中的页面的终端数量。本发明有益效果包括:本发明实施例提供的方法中,在确定访问页面的终端数量时,首先获取历史时间段内访问页面集合中的页面的终端数量,以及该历史时间段内该页面集合中的页面被访问的次数,然后确定获取的该终端数量与该次数的比值,并基于确定的该比值,根据统计的评估时间段内该页面集合中的页面被访问的次数,确定该评估时间段内访问该页面集合中的页面的终端数量。本发明实施例提供的方案中,不再需要对访问日志中记录的终端标识信息进行比对和排重处理,只需要统计页面被访问的次数,并基于通过历史统计结果得到的访问页面的终端数量与页面被访问的次数的比值,即可以确定评估时间段内访问页面的终端数量,从而减少了处理资源的消耗,并且提高了处理效率。本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。


附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:图1为本发明实施例提供的确定访问页面的终端数量的方法的流程图;图2为本发明实施例1提供的确定访问页面的终端数量的方法的流程图;图3为本发明实施例2提供的确定访问页面的终端数量的方法的流程图;图4为本发明实施例3提供的确定访问页面的终端数量的装置的结构示意图。
具体实施例方式为了给出减少确定访问页面的终端数量时消耗的处理资源,以及提高处理效率的实现方案,本发明实施例提供了一种确定访问页面的终端数量的方法及装置,以下结合说明书附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。本发明实施例提供一种确定访问页面的终端数量的方法,如图1所示,包括:步骤101、获取历史时间段内访问页面集合中的页面的终端数量,以及该历史时间段内该页面集合中的页面被访问的次数。步骤102、确定获取的该终端数量与该次数的比值。步骤103、基于确定的该比值,根据统计的评估时间段内该页面集合中的页面被访问的次数,确定该评估时间段内访问该页面集合中的页面的终端数量。其中,在上述步骤101中,可以获取多个历史时间段内访问页面集合中的页面的终端数量,以及该历史时间段内该页面集合中的页面被访问的次数,后续可以基于获取的多个终端数量和多个次数确定后续步骤103中使用的比值,基于获取的多个历史访问结果确定比值,能够进一步提高最终所确定的访问页面的终端数量的准确性。本发明实施例中,也可以针对作为来源页面的指定页面,获取历史时间段内从该指定页面出发访问页面集合中的页面的终端数量,以及该历史时间段内从该指定页面出发该页面集合中的页面被访问的次数,从而后续也可以针对该指定页面,根据统计的评估时间段内从该指定页面出发该页面集合中的页面被访问的次数,确定该评估时间段内从该指定页面出发访问该页面集合中的页面的终端数量,进而使得所确定的访问页面的终端数量更有针对性。下面结合附图,用具体实施例对本发明提供的方法及装置进行详细描述。实施例1:图2为本发明实施例1中提供的确定访问页面的终端数量的方法的流程图,具体包括如下处理步骤:步骤201、获取历史时间段内访问页面集合中的页面的终端数量。优选的,本步骤中可以获取多个历史时间段内访问页面集合中的页面的终端数量,例如,获取η个时间段内访问页面集合中的页面的终端数量,η的取值可以根据实际需要进行灵活设置,η个时间段可以为时间长度相同的时间段,如每个时间段的时间长度为一天24小时。本步骤中所获取的历史时间段内访问页面集合中的页面的终端数量,可以是按照现有技术基于该历史时间段内的访问日志进行统计得到的统计结果,也可以是按照本发明实施例提供的方法所确定的终端数量。本发明实施例1中,页面集合中所包括的页面可以是一个,也可以是多个,可以根据实际需要进行灵活设置,例如,可以设置为一个网站所包括的所有页面,也可以设置为一个网站的主页面,也可以设置为一个网站的某一个栏目所对应的多个页面。步骤202、获取该历史时间段内该页面集合中的页面被访问的次数。优选的,当上述步骤201中,获取了多个历史时间段内访问页面集合中的页面的终端数量时,相应的,本步骤中也可以获取该多个历史时间段内该页面集合中的页面被访问的次数。本步骤中所获取的该历史时间段内该页面集合中的页面被访问的次数,可以是基于该历史时间段内的访问日志进行统计得到的统计结果,在统计该次数时,只需要针对该页面集合中的页面,对访问的次数进行简单叠加即可,不需要进行对比和排重处理。步骤203、确定获取的终端数量与次数的比值。该比值可以是终端数量除以次数得到的比值,也可以是次数除以终端数量得到的比值。优选的,当上述步骤201和步骤202中,分别获取了多个历史时间段内访问页面集合中的页面的终端数量,以及该多个历史时间段内该页面集合中的页面被访问的次数时,本步骤中,可以依次针对该多个历史时间段中的每个历史时间段,确定该历史时间段内访问该页面集合中的页面的终端数量,与该历史时间段内该页面集合中的页面被访问的次数的比值,然后,确定针对该多个历史时间段分别确定的各比值的平均值,具体见如下公式:
权利要求
1.种确定访问页面的终端数量的方法,其特征在于,包括: 获取历史时间段内访问页面集合中的页面的终端数量,以及所述历史时间段内所述页面集合中的页面被访问的次数; 确定所述终端数量与所述次数的比值; 基于所述比值,根据统计的评估时间段内所述页面集合中的页面被访问的次数,确定所述评估时间段内访问所述页面集合中的页面的终端数量。
2.权利要求1所述的方法,其特征在于,获取历史时间段内访问页面集合中的页面的终端数量,以及所述历史时间段内所述页面集合中的页面被访问的次数,具体包括: 获取多个历史时间段内访问页面集合中的页面的终端数量,以及所述多个历史时间段内所述页面集合中的页面被访问的次数; 确定所述终端数量与所述次数的比值,具体包括: 依次针对所述多个历史时间段中的每个历史时间段,确定该历史时间段内访问所述页面集合中的页面的终端数量,与该历史时间段内所述页面集合中的页面被访问的次数的比值; 确定针对所述多个历史时间段分别确定的各比值的平均值。
3.权利要求1所述的方法,其特征在于,获取历史时间段内访问页面集合中的页面的终端数量,以及所述历史时间段内所述页面集合中的页面被访问的次数,具体包括: 获取历史时间段内从指定页面出发访问页面集合中的页面的终端数量,以及所述历史时间段内从所述指定页面出 发所述页面集合中的页面被访问的次数; 基于所述比值,根据统计的评估时间段内所述页面集合中的页面被访问的次数,确定所述评估时间段内访问所述页面集合中的页面的终端数量,具体为: 基于所述比值,根据统计的评估时间段内从所述指定页面出发所述页面集合中的页面被访问的次数,确定所述评估时间段内从所述指定页面出发访问所述页面集合中的页面的终端数量。
4.权利要求3所述的方法,其特征在于,获取历史时间段内从指定页面出发访问页面集合中的页面的终端数量,以及所述历史时间段内从所述指定页面出发所述页面集合中的页面被访问的次数,具体包括: 获取多个历史时间段内从指定页面出发访问页面集合中的页面的终端数量,以及所述多个历史时间段内从所述指定页面出发所述页面集合中的页面被访问的次数; 确定所述终端数量与所述次数的比值,具体包括: 依次针对所述多个历史时间段中的每个历史时间段,确定该历史时间段内从指定页面出发访问所述页面集合中的页面的终端数量,与该历史时间段内从所述指定页面出发所述页面集合中的页面被访问的次数的比值; 确定针对所述多个历史时间段分别确定的各比值的平均值。
5.权利要求3或4所述的方法,其特征在于,还包括: 确定所述历史时间段内页面集合中的页面被访问时的各来源页面; 将所述各来源页面之一作为所述指定页面,并记录所述评估时间段内从该来源页面出发访问所述页面集合中的页面的终端数量;或者,依次将所述各来源页面中的每个来源页面作为所述指定页面,并针对每个来源页面记录所述评估时间段内从该来源页面出发访问所述页面集合中的页面的终端数量。
6.种确定访问页面的终端数量的装置,其特征在于,包括: 获取单元,用于获取历史时间段内访问页面集合中的页面的终端数量,以及所述历史时间段内所述页面集合中的页面被访问的次数; 第一确定单元,用于确定所述终端数量与所述次数的比值; 第二确定单元,用于基于所述比值,根据统计的评估时间段内所述页面集合中的页面被访问的次数,确定所述评估时间段内访问所述页面集合中的页面的终端数量。
7.权利要求6所述的装置,其特征在于,所述获取单元,具体用于获取多个历史时间段内访问页面集合中的页面的终端数量,以及所述多个历史时间段内所述页面集合中的页面被访问的次数; 所述第一确定单元,具体用于依次针对所述多个历史时间段中的每个历史时间段,确定该历史时间段内访问所述页面集合中的页面的终端数量,与该历史时间段内所述页面集合中的页面被访问的次数的比值;并确定针对所述多个历史时间段分别确定的各比值的平均值。
8.权利要求6所述的装置,其特征在于,所述获取单元,具体用于获取历史时间段内从指定页面出发访问页面集合中的页面的终端数量,以及所述历史时间段内从所述指定页面出发所述页面集合中的页面被访问的次数; 所述第二确定单元,具体用于基于所述比值,根据统计的评估时间段内从所述指定页面出发所述页面集合中的页面被访问的次数,确定所述评估时间段内从所述指定页面出发访问所述页面集合中的页面的终端数量。
9.权利要求8所述的装置,其 特征在于,所述获取单元,具体用于获取多个历史时间段内从指定页面出发访问页面集合中的页面的终端数量,以及所述多个历史时间段内从所述指定页面出发所述页面集合中的页面被访问的次数; 所述第一确定单元,具体用于依次针对所述多个历史时间段中的每个历史时间段,确定该历史时间段内从指定页面出发访问所述页面集合中的页面的终端数量,与该历史时间段内从所述指定页面出发所述页面集合中的页面被访问的次数的比值;并确定针对所述多个历史时间段分别确定的各比值的平均值。
10.权利要求8或9所述的装置,其特征在于,还包括: 页面确定单元,用于确定所述历史时间段内页面集合中的页面被访问时的各来源页面; 记录单元,用于将所述各来源页面之一作为所述指定页面,并记录所述评估时间段内从该来源页面出发访问所述页面集合中的页面的终端数量;或者,依次将所述各来源页面中的每个来源页面作为所述指定页面,并针对每个来源页面记录所述评估时间段内从该来源页面出发访问所述页面集合中的页面的终端数量。
全文摘要
本发明公开了一种确定访问页面的终端数量的方法及装置,包括获取历史时间段内访问页面集合中的页面的终端数量,以及该历史时间段内该页面集合中的页面被访问的次数;并确定获取的该终端数量与该次数的比值;以及基于确定的该比值,根据统计的评估时间段内该页面集合中的页面被访问的次数,确定该评估时间段内访问该页面集合中的页面的终端数量。采用本发明实施例提供的方案,减少了确定访问页面的终端数量时消耗的处理资源,并提高了处理效率。
文档编号H04L29/08GK103095820SQ20131000145
公开日2013年5月8日 申请日期2013年1月4日 优先权日2013年1月4日
发明者刘洋 申请人:新浪网技术(中国)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1