页面访问数据的处理方法、装置及系统的制作方法

文档序号:6538628阅读:193来源:国知局
页面访问数据的处理方法、装置及系统的制作方法
【专利摘要】本发明公开了一种页面访问数据的处理方法、装置及系统。其中,该处理方法包括:在页面结束时生成页面的心跳数据,其中,心跳数据中携带着页面的页面标识和页面加载时长;获取保存有页面的页面浏览数据的数据表,其中,页面浏览数据中携带着页面标识;通过页面标识建立心跳数据与数据表的关联关系;依据关联关系将页面加载时长导入数据表。采用本发明,解决了现有技术中统计的页面加载时长的数据不完整的问题,实现了完整获取页面加载时长的效果,从而可以保证对用户访问行为分析的准确性和完整性。
【专利说明】页面访问数据的处理方法、装置及系统
【技术领域】
[0001]本发明涉及互联网领域,具体而言,涉及一种页面访问数据的处理方法、装置及系统。
【背景技术】
[0002]现有技术中在对网站的用户访问行为进行统计分析时,往往需要统计用户所浏览网页的加载时长,现有技术中获取页面的加载时长一般是通过PV数据获取的,可是PV数据一般是在页面加载完成之后服务器才可以获取到的数据。用户在浏览页面时,由于页面加载时间很长,很多用户在页面还没有完全打开时就关闭了页面,在这种情况下,该页面不会产生PV数据,因此,通过该种方式就会漏掉很多页面加载时长的数据,得到的数据是不完整的。
[0003]另外,在现有技术中统计用户的网站访问行为时,往往还需要获取用户网页浏览的停留时间,在传统的停留时间的统计方法中,如果用户在访问网站的会话中访问了 N个页面,我们可以获取前N-1个页面的停留时间,具体地:将后一个页面的开始时间减去当前页面的开始时间,即为当前页面的停留时间,然而无法对末PV的停留时间做计算,因为末PV已经是最后一个浏览页面,在该页面之后没有后一个页面了,无法使用上述的后一个页面的开始时间减去当前页面的开始时间,也即现有技术中无法获得末PV的停留时间。
[0004]上述的PV (page view,即页面浏览量),是评价网站流量的指标之一。
[0005]末PV,即为用户访问网站的会话中,会存在一连串的页面浏览(即PV),最后一条页面浏览即为末PV。
[0006]针对现有技术中统计的页面加载时长的数据不完整的问题,目前尚未提出有效的
解决方案。

【发明内容】

[0007]针对相关技术中统计的页面加载时长的数据不完整的问题,目前尚未提出有效的解决方案,为此,本发明的主要目的在于提供一种页面访问数据的处理方法、装置及系统,以解决上述问题。
[0008]为了实现上述目的,根据本发明的一个方面,提供了一种页面访问数据的处理方法,该处理方法包括:在页面结束时生成页面的心跳数据,其中,心跳数据中携带着页面的页面标识和页面加载时长;获取保存有页面的页面浏览数据的数据表,其中,页面浏览数据中携带着页面标识;通过页面标识建立心跳数据与数据表的关联关系;依据关联关系将页面加载时长导入数据表。
[0009]进一步地,在通过页面标识建立心跳数据与数据表的关联关系之后,该处理方法包括:从页面浏览数据中提取页面的开始时间;根据心跳数据获取页面的最后活跃时间;将最后活跃时间与开始时间作差得到页面的浏览时长。
[0010]进一步地,根据心跳数据获取页面的最后活跃时间包括:将用户访问会话中的所有页面的心跳数据保存入心跳表中;提取对应一个页面的心跳数据得到心跳集合;将心跳集合中时间最晚的心跳数据对应的发送时间作为最后活跃时间。
[0011]进一步地,获取页面的心跳数据包括:监测页面的运行状态;在运行状态发生变化时生成心跳数据,其中,运行状态发生变化包括:页面的结束、浏览器关闭、页面请求超时以及页面加载完成;和/或获取页面每隔预设时间发送的心跳数据。
[0012]为了实现上述目的,根据本发明的另一方面,提供了一种页面访问数据的处理装置,该处理装置包括:数据获取模块,用于获取页面的心跳数据,其中,心跳数据中携带着页面的页面标识和页面加载时长;数据表获取装置,用于获取保存有页面的页面浏览数据的数据表,其中,页面浏览数据中携带着页面标识;关系建立模块,用于通过页面标识建立心跳数据与数据表的关联关系;导入模块,用于依据关联关系将页面加载时长导入数据表。
[0013]进一步地,处理装置包括:第一提取模块,用于从页面浏览数据中提取页面的开始时间;时间获取模块,用于根据心跳数据获取页面的最后活跃时间;计算模块,用于将最后活跃时间与开始时间作差得到页面的浏览时长。
[0014]进一步地,时间获取模块包括:保存模块,用于将用户访问会话中的所有页面的心跳数据保存入心跳表中;第二提取模块,用于提取对应一个页面的心跳数据得到心跳集合;确定模块,用于将心跳集合中时间最晚的心跳数据对应的发送时间作为最后活跃时间。
[0015]进一步地,数据获取模块包括:监测模块,用于监测页面的运行状态;生成模块,用于在运行状态发生变化时生成心跳数据,其中,运行状态发生变化包括:页面的结束、浏览器关闭、页面请求超时以及页面加载完成;和/或数据获取子模块,用于获取页面每隔预设时间发送的心跳数据。
[0016]为了实现上述目的,根据本发明的另一方面,提供了一种页面访问数据的处理系统,该处理系统包括:客户端,用于在接收到心跳命令之后生成并发送心跳数据;服务器,与客户端连接,用于发送心跳命令,并在接收到心跳数据之后,获取保存有页面的页面浏览数据的数据表,然后通过页面标识建立心跳数据与数据表的关联关系,并依据关联关系将页面加载时长导入数据表;其中,心跳数据中携带着页面的页面标识和页面加载时长,页面浏览数据中携带着页面标识。
[0017]采用本发明,通过获取携带着页面加载时长的心跳数据,然后通过页面标识建立心跳数据与数据表的关联关系,并将心跳数据中的页面加载时长导入数据表,从而可以将包含页面加载时长的数据表展现给用户,由于控制着在页面结束时生成心跳数据,从而可以将每个页面结束的时间通过心跳数据来获取,从而解决了现有技术中统计的页面加载时长的数据不完整的问题,实现了完整获取页面加载时长的效果,从而可以保证对用户访问行为分析的准确性和完整性。
【专利附图】

【附图说明】
[0018]此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0019]图1是根据本发明实施例的页面访问数据的处理装置的结构示意图;以及
[0020]图2是根据本发明实施例的页面访问数据的处理方法的流程图。【具体实施方式】
[0021]首先,在对本发明实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
[0022]为了使本【技术领域】的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0023]需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0024]图1是根据本发明实施例的页面访问数据的处理装置的结构示意图。如图1所示,该装置可以包括:数据获取模块10,用于获取页面的心跳数据,其中,心跳数据中携带着页面的页面标识和页面加载时长;数据表获取装置20,用于获取保存有页面的页面浏览数据的数据表,其中,页面浏览数据中携带着页面标识;关系建立模块30,用于通过页面标识建立心跳数据与数据表的关联关系;导入模块40,用于依据关联关系将页面加载时长导入数据表。
[0025]采用本发明,通过获取携带着页面加载时长的心跳数据,然后通过页面标识建立心跳数据与数据表的关联关系,并将心跳数据中的页面加载时长导入数据表,从而可以将包含页面加载时长的数据表展现给用户,由于控制着在页面结束时生成心跳数据,从而可以将每个页面结束的时间通过心跳数据来获取,从而解决了现有技术中统计的页面加载时长的数据不完整的问题,实现了完整获取页面加载时长的效果,从而可以保证对用户访问行为分析的准确性和完整性。
[0026]根据本发明的上述实施例,处理装置可以包括:第一提取模块,用于从页面浏览数据中提取页面的开始时间;时间获取模块,用于根据心跳数据获取页面的最后活跃时间;计算模块,用于将最后活跃时间与开始时间作差得到页面的浏览时长。
[0027]其中,活跃时间是页面还活着的时间,即心跳数据发送的时间,最后活跃时间即为对应该页面的最后一条心跳数据的发送时间;心跳数据的发送时间可以为客户端生成心跳数据的时间,还可以为服务器接收到该心跳数据的时间。
[0028]上述实施例中的页面加载时长是表示用户浏览的页面的加载完成所需的时间;页面加载时长是由心跳命令中通过JavaScript在客户端的网页上获取的心跳数据提供的。
[0029]具体地,在每个页面浏览开始之时生成页面浏览数据,从页面浏览数据中提取页面的开始时间,然后再发送心跳数据,页面的运行状态每变化一次就生成一个心跳数据,以表示该页面还活着,在对应该页面的最后一个心跳数据中提取页面的最后活跃时间,将最后活跃时间与开始时间作差得到页面的浏览时长。[0030]在本发明的上述实施例中,时间获取模块可以包括:保存模块,用于将用户访问会话中的所有页面的心跳数据保存入心跳表中;第二提取模块,用于提取对应一个页面的心跳数据得到心跳集合;确定模块,用于将心跳集合中时间最晚的心跳数据对应的发送时间作为最后活跃时间。
[0031]其中,心跳数据仅用于表示心跳,即此页面还活着,也就是用户还在看的意思。心跳数据中可以包含页面标识字段(唯一标识页面浏览的数据),页面加载时长(LoadingDuration),心跳数据的发送时间标志着页面还活着的时间,即还有心跳的时间。
[0032]具体地,客户端接收到服务器的心跳命令之后,发送心跳数据,在页面加载完成时或浏览器关闭时或页面请求超时时均可以发送心跳数据。其中,在页面加载完成时发送的心跳数据用于获取页面加载时长,在页面结束时或是浏览器关闭或是超时时,发送的心跳数据,用于计算末PV的浏览时长。
[0033]在本发明的上述实施例中,数据获取模块可以包括:监测模块,用于监测页面的运行状态;生成模块,用于在运行状态发生变化时生成心跳数据,其中,运行状态发生变化包括:页面的结束、浏览器关闭、页面请求超时以及页面加载完成;和/或数据获取子模块,用于获取页面每隔预设时间发送的心跳数据。
[0034]其中,服务器通过心跳命令启动客户端生成并发送心跳数据,客户端每隔预设时间(如上述实施例中的第一间隔和第二间隔)发送一次心跳数据,并且在页面的运行状态发送变化时,生成并发送心跳数据。
[0035]具体地,服务器将所有页面的心跳数据(其中携带有页面加载时长)插入到心跳表E_ S H B中,并将所有的页面浏览数据插入到数据表E _PV中;然后将心跳表里的心跳数据进行去重,仅选取相同PVID的最后一个心跳数据作为最终的心跳数据,该心跳数据包含该页面的最后活跃时间以及页面加载时长;通过PVID将心跳表以及数据表进行关联,将页面加载时导入数据表中,并用最后心跳活跃时间减去浏览页面的开始时间,从而得出浏览页面的浏览时长。
[0036]图2是根据本发明实施例的页面访问数据的处理方法的流程图,如图2所示该方法包括如下步骤:
[0037]步骤S202,获取页面的心跳数据,其中,心跳数据中携带着页面的页面标识和页面加载时长。
[0038]步骤S204,获取保存有页面的页面浏览数据的数据表,其中,页面浏览数据中携带着页面标识。
[0039]步骤S206,通过页面标识建立心跳数据与数据表的关联关系。
[0040]步骤S208,依据关联关系将页面加载时长导入数据表。
[0041]采用本发明,通过获取携带着页面加载时长的心跳数据,然后通过页面标识建立心跳数据与数据表的关联关系,并将心跳数据中的页面加载时长导入数据表,从而可以将包含页面加载时长的数据表展现给用户,由于控制着在页面结束时生成心跳数据,从而可以将每个页面结束的时间通过心跳数据来获取,从而解决了现有技术中统计的页面加载时长的数据不完整的问题,实现了完整获取页面加载时长的效果,从而可以保证对用户访问行为分析的准确性和完整性。
[0042]在本发明的上述实施例中,在通过页面标识建立心跳数据与数据表的关联关系之后,处理方法可以包括:从页面浏览数据中提取页面的开始时间;根据心跳数据获取页面的最后活跃时间;将最后活跃时间与开始时间作差得到页面的浏览时长。
[0043]其中,活跃时间是页面还活着的时间,即心跳数据发送的时间,最后活跃时间即为对应该页面的最后一条心跳数据的发送时间;心跳数据的发送时间可以为客户端生成心跳数据的时间,还可以为服务器接收到该心跳数据的时间。
[0044]上述实施例中的页面加载时长是表示用户浏览的页面的加载完成所需的时间;页面加载时长是由心跳命令中通过JavaScript在客户端的网页上获取的心跳数据提供的。
[0045]具体地,在每个页面浏览开始之时生成页面浏览数据,从页面浏览数据中提取页面的开始时间,然后再发送心跳数据,页面的运行状态每变化一次就生成一个心跳数据,以表示该页面还活着,在对应该页面的最后一个心跳数据中提取页面的最后活跃时间,将最后活跃时间与开始时间作差得到页面的浏览时长。
[0046]根据本发明的上述实施例,根据心跳数据获取页面的最后活跃时间可以包括:将用户访问会话中的所有页面的心跳数据保存入心跳表中;提取对应一个页面的心跳数据得到心跳集合;将心跳集合中时间最晚的心跳数据对应的发送时间作为最后活跃时间。
[0047]其中,心跳数据仅用于表示心跳,即此页面还活着,也就是用户还在看的意思。心跳数据中可以包含页面标识字段(唯一标识页面浏览的数据),页面加载时长(LoadingDuration),心跳数据的发送时间标志着页面还活着的时间,即还有心跳的时间。
[0048]在本发明的上述实施例中,获取页面的心跳数据包括:监测页面的运行状态;在运行状态发生变化时生成心跳数据,其中,运行状态发生变化包括:页面的结束、浏览器关闭、页面请求超时以及页面加载完成;和/或获取页面每隔预设时间发送的心跳数据。
[0049]具体地,客户端接收到服务器的心跳命令之后,发送心跳数据,在页面加载完成时或浏览器关闭时或页面请求超时时均可以发送心跳数据。其中,在页面加载完成时发送的心跳数据用于获取页面加载时长,在页面结束时或是浏览器关闭或是超时时,发送的心跳数据,用于计算末PV的浏览时长。
[0050]具体地,心跳命令中可以包含如下的心跳数据获取规则:
[0051](I)在超过预设页面浏览时长之后,不再生成并发送心跳数据;其中,预设页面浏览时长可以为2个小时,在超过2小时之后确定用户对于该页面的浏览访问是非正常的页面浏览,不再发心跳数据。
[0052](2)对应同一个页面可以生成并发送多个心跳数据,可选地可以只保存该次用户访问网站的会话的最后一次接收到心跳数据的时间(该时间即为最后活跃时间)。
[0053](3)在页面浏览的开始阶段,心跳数据发送间隔为第一间隔,在页面浏览开始预设时间段之后,可以每隔第二间隔发送一次心跳数据,其中,第二间隔大于第一间隔。可选地,第一间隔可以为5秒钟,第二间隔可以为15秒。
[0054]由于用户的常规行为是几秒钟或几十秒钟便会离开,因页面浏览的时间不同设定不同的心跳数据发送间隔,可以节约数据存储空间,并可以使得通讯更加通畅。
[0055]根据本发明的上述实施例,获取页面的心跳数据包括:监测页面的运行状态;在运行状态发生变化时生成心跳数据,其中,运行状态发生变化包括:页面的结束、浏览器关闭、页面请求超时以及页面加载完成。
[0056]其中,服务器通过心跳命令启动客户端生成并发送心跳数据,客户端每隔预设时间(如上述实施例中的第一间隔和第二间隔)发送一次心跳数据,并且在页面的运行状态发送变化时,生成并发送心跳数据。
[0057]具体地,服务器将所有页面的心跳数据(其中携带有页面加载时长)插入到心跳表E_ S H B中,并将所有的页面浏览数据插入到数据表E _PV中;然后将心跳表里的心跳数据进行去重,仅选取相同PVID的最后一个心跳数据作为最终的心跳数据,该心跳数据包含该页面的最后活跃时间以及页面加载时长;通过PVID将心跳表以及数据表进行关联,将页面加载时导入数据表中,并用最后心跳活跃时间减去浏览页面的开始时间,从而得出浏览页面的浏览时长。
[0058]需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0059]从以上的描述中,可以看出,本发明实现了如下技术效果:
[0060]采用本发明,通过获取携带着页面加载时长的心跳数据,然后通过页面标识建立心跳数据与数据表的关联关系,并将心跳数据中的页面加载时长导入数据表,从而可以将包含页面加载时长的数据表展现给用户,由于控制着在页面结束时生成心跳数据,从而可以将每个页面结束的时间通过心跳数据来获取,从而解决了现有技术中统计的页面加载时长的数据不完整的问题,实现了完整获取页面加载时长的效果,从而可以保证对用户访问行为分析的准确性和完整性。
[0061]显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
[0062]以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【权利要求】
1.一种页面访问数据的处理方法,其特征在于,包括: 在页面结束时生成所述页面的心跳数据,其中,所述心跳数据中携带着所述页面的页面标识和页面加载时长; 获取保存有所述页面的页面浏览数据的数据表,其中,所述页面浏览数据中携带着所述页面标识; 通过所述页面标识建立所述心跳数据与所述数据表的关联关系; 依据所述关联关系将所述页面加载时长导入所述数据表。
2.根据权利要求1所述的处理方法,其特征在于,在通过所述页面标识建立所述心跳数据与所述数据表的关联关系之后,所述处理方法包括: 从所述页面浏览数据中提取所述页面的开始时间; 根据所述心跳数据获取所述页面的最后活跃时间; 将所述最后活跃时间与所述开始时间作差得到所述页面的浏览时长。
3.根据权利要求2所述的处理方法,其特征在于,根据所述心跳数据获取所述页面的最后活跃时间包括: 将用户访问会话中的所有所述页面的所述心跳数据保存入心跳表中; 提取对应一个所述页面的所述心跳数据得到心跳集合; 将所述心跳集合中时`间最晚的所述心跳数据对应的发送时间作为所述最后活跃时间。
4.根据权利要求1至3中任意一项所述的处理方法,其特征在于,获取页面的心跳数据包括: 监测所述页面的运行状态;在所述运行状态发生变化时生成所述心跳数据,其中,所述运行状态发生变化包括:所述页面的结束、浏览器关闭、页面请求超时以及页面加载完成;和/或 获取所述页面每隔预设时间发送的所述心跳数据。
5.一种页面访问数据的处理装置,其特征在于,包括: 数据获取模块,用于获取页面的心跳数据,其中,所述心跳数据中携带着所述页面的页面标识和页面加载时长; 数据表获取装置,用于获取保存有所述页面的页面浏览数据的数据表,其中,所述页面浏览数据中携带着所述页面标识; 关系建立模块,用于通过所述页面标识建立所述心跳数据与所述数据表的关联关系; 导入模块,用于依据所述关联关系将所述页面加载时长导入所述数据表。
6.根据权利要求5所述的处理装置,其特征在于,所述处理装置包括: 第一提取模块,用于从所述页面浏览数据中提取所述页面的开始时间; 时间获取模块,用于根据所述心跳数据获取所述页面的最后活跃时间; 计算模块,用于将所述最后活跃时间与所述开始时间作差得到所述页面的浏览时长。
7.根据权利要求6所述的处理装置,其特征在于,所述时间获取模块包括: 保存模块,用于将用户访问会话中的所有所述页面的所述心跳数据保存入心跳表中; 第二提取模块,用于提取对应一个所述页面的所述心跳数据得到心跳集合; 确定模块,用于将所述心跳集合中时间最晚的所述心跳数据对应的发送时间作为所述最后活跃时间。
8.根据权利要求5至7中任意一项所述的处理装置,其特征在于,所述数据获取模块包括: 监测模块,用于监测所述页面的运行状态;生成模块,用于在所述运行状态发生变化时生成所述心跳数据,其中,所述运行状态发生变化包括:所述页面的结束、浏览器关闭、页面请求超时以及页面加载完成;和/或 数据获取子模块,用于获取所述页面每隔预设时间发送的所述心跳数据。
9.一种页面访问数据的处理系统,其特征在于,包括: 客户端,用于在接收到心跳命令之后生成并发送心跳数据; 服务器,与所述客户端连接,用于发送所述心跳命令,并在接收到所述心跳数据之后,获取保存有所述页面的页面浏览数据的数据表,然后通过页面标识建立所述心跳数据与所述数据表的关联关系,并依据所述关联关系将页面加载时长导入所述数据表; 其中,所述心跳数据中携带着所述页面的所述页面标识和所述页面加载时长,所述页面浏览数据中携带着所述页面标识。`
【文档编号】G06F17/30GK103778254SQ201410062764
【公开日】2014年5月7日 申请日期:2014年2月24日 优先权日:2014年2月24日
【发明者】洪超, 杨基彬 申请人:北京国双科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1