一种基于终端访问的页面停留时长确定方法及装置的制造方法

文档序号:9618781阅读:246来源:国知局
一种基于终端访问的页面停留时长确定方法及装置的制造方法
【技术领域】
[0001] 本发明涉及计算机网络技术领域,具体涉及一种基于终端访问的页面停留时长确 定方法及装置。
【背景技术】
[0002] 页面停留时长,简单来讲就是用户在某个网站页面上所花的时间,它在一定程度 上反映了该网站页面对用户的粘性。准确的测量用户页面停留时长,可以帮助网站运营人 员了解网站页面的内容质量,作为页面改进的依据,也可以帮助网站推广人员了解推广流 量的质量,从而进一步优化推广策略。
[0003] 目前,测量用户页面停留时长主要有2种数据获取方式:Web服务日志和 JavaScript页面嵌码。这2种方法使用的数据来源不同,但是在测量页面停留时长时的基 本思路是相同的,即通过计算2个相邻访问页面的请求时间戳之差,来作为第1个页面的停 留时长。例如,某用户依次访问了某个网站的3个页面后离开,若用户在11点02分访问了 Pagel,11点04分访问了 Page2,11点09分访问了 Page3,那么该用户在Pagel上的停留时 长为2分钟,在Page2上的停留时长为5分钟,而Page3由于是最后一个页面无法计算,因 此停留时长被忽略。
[0004] 显然,这种停留时长的测量方法存在明显缺陷:对于用户访问的最后一个页面,月艮 务端无法获知用户是何时离开的,这样也就无法计算这个页面昀停留时长,因此只能选择 忽略,这导致在后续计算页面平均停留时长时,测量结果与实际情况会有较大的偏差。对于 一些视频网站页面来说,这个问题尤为严重。
[0005] 此外,现有的页面停留时长测量方法还有一个问题,即测量结果无法真实反映用 户的实际浏览行为。用户在使用浏览器浏览网页时,往往会打开多个窗口 /标签页,而用 户在同一时间内一般只会浏览一个网页。这就意味着一些网页虽然被打开了,但是它们都 被隐藏在顶端窗口 /标签页的背后,并没有真正被用户浏览。无论是通过Web服务日志还 是JavaScript页面嵌码,服务端都无法获取这样的用户行为细节,因此在测量停留时长时 也就无法将其考虑在内,这导致测量结果可能比用户实际浏览某个页面的停留时长要大一 止匕 -、〇
[0006] 可以看到,现有的页面停留时长测量方法存在一定的缺陷,使得测量结果与用户 实际浏览行为之间存在一定的偏差。
[0007] 并且随着互联网的飞速发展,网络终端数量迅猛增加,使得终端产生的数据量呈 现指数级增长,现有的页面停留时长测量方法,无法解决针对海量数据的分析和挖掘问题。 根据用户终端采集的海量数据,自动分析用户的上网行为信息,是当今智能决策支持系统 的迫切需要。
[0008] 大数据时代的到来,对数据挖掘和分析领域了严峻的挑战。云计算技术,为海量 的、非结构化的多样数据提供了高效稳定的运算平台。结合人工智能的数据挖掘技术,如何 有效地利用这些云计算平台,从大数据中发现知识、规律和趋势,为决策提供信息参考,成 为了当今众多学者和企业研究的重点问题。

【发明内容】

[0009] 本发明所要解决的技术问题是现有的页面停留时长测量方法,无法解决针对海量 数据的分析和挖掘问题。
[0010] 为此目的,第一方面,本发明提出一种基于终端访问的页面停留时长确定方法,包 括:
[0011] 采集终端的浏览器进程信息及非浏览器进程信息;
[0012] 基于所述浏览器进程信息及非浏览器进程信息,确定所述终端针对目标网页的访 问开始时间及访问结束时间;
[0013] 基于所述访问开始时间及访问结束时间,确定所述终端在目标网页的页面停留时 长。
[0014] 可选的,所述采集终端的浏览器进程信息及非浏览器进程信息,包括:
[0015] 采集终端的浏览器进程创建时间、浏览器进程结束时间、浏览器进程激活时间、浏 览器进程非激活时间、浏览器进程访问网页的地址、浏览器进程访问网页的时间;
[0016] 采集终端的非浏览器进程创建时间、非浏览器进程结束时间、非浏览器进程激活 时间、非浏览器进程非激活时间。
[0017] 可选的,基于所述浏览器进程信息及非浏览器进程信息,确定所述终端针对目标 网页的访问开始时间及访问结束时间,包括:
[0018] 基于所述浏览器进程创建时间、所述浏览器进程非激活时间、所述非浏览器进程 创建时间及所述非浏览器进程非激活时间,确定所述终端创建的各进程的最后一次非激活 时间;
[0019] 基于所述浏览器进程访问网页的地址及所述浏览器进程访问网页的时间,确定目 标网页的访问开始时间以及所述目标网页之后的下一个访问网页的访问开始时间;
[0020] 基于所述最后一次非激活时间、所述目标网页的访问开始时间、所述非浏览器进 程激活时间以及预设的网页访问时长阈值,确定所述目标网页的关闭时间;
[0021] 基于所述浏览器进程激活时间、所述目标网页的访问开始时间、所述目标网页之 后的下一个访问网页的访问开始时间以及所述目标网页的关闭时间,确定所述终端针对目 标网页的访问结束时间。
[0022] 可选的,所述基于所述最后一次非激活时间、所述目标网页的访问开始时间、所述 非浏览器进程激活时间以及预设的网页访问时长阈值,确定所述目标网页的关闭时间,包 括:
[0023] 判断从所述目标网页的访问开始时间之后的所述网页访问时长阈值内是否存在 非浏览器进程激活时间;
[0024] 若存在至少一个非浏览器进程激活时间,则确定所述目标网页的关闭时间为所述 至少一个非浏览器进程激活时间中最先激活的时间;
[0025] 若不存在非浏览器进程激活时间,则判断从所述目标网页的访问开始时间起经过 所述网页访问时长阈值之后是否存在非浏览器进程激活时间;
[0026] 若存在非浏览器进程激活时间,则确定所述目标网页的关闭时间为所述目标网页 的访问开始时间与所述网页访问时长阈值之和;
[0027] 若不存在非浏览器进程激活时间,则确定所述目标网页的关闭时间为所述最后一 次非激活时间。
[0028] 可选的,所述基于所述浏览器进程激活时间、所述目标网页的访问开始时间、所述 目标网页之后的下一个访问网页的访问开始时间以及所述目标网页的关闭时间,确定所述 终端针对目标网页的访问结束时间,包括:
[0029] 判断从所述目标网页的访问开始时间至所述目标网页之后的下一个访问网页的 访问开始时间是否包含于所述浏览器进程激活时间至所述目标网页的关闭时间内;
[0030] 若包含于,则确定所述终端针对目标网页的访问结束时间为所述目标网页之后的 下一个访问网页的访问开始时间;
[0031] 若不包含于,则判断条件是否成立,所述条件为:所述目标网页的访问开始时间 属于所述浏览器进程激活时间至所述目标网页的关闭时间内,且所述目标网页之后的下一 个访问网页的访问开始时间不属于所述浏览器进程激活时间至所述目标网页的关闭时间 内;
[0032] 若条件成立,则确定所述终端针对目标网页的访问结束时间为所述目标网页的关 闭时间。
[0033] 第二方面,本发明还提出一种基于终端访问的页面停留时长确定装置,包括:
[0034] 采集单元,用于采集终端的浏览器进程信息及非浏览器进程信息;
[0035] 第一确定单元,用于基于所述浏览器进程信息及非浏览器进程信息,确定所述终 端针对目标网页的访问开始时间及访问结束时间;
[0036] 第二确定单元,用于基于所述访问开始时间及访问结束时间,确定所述终端在目 标网页的页面停留时长。
[0037] 可选的,所述采集单元,用于采集终端的浏览器进程创建时间、浏览器进程结束时 间、浏览器进程激活时间、浏览器进程非激活时间、浏览器进程访问网页的地址、浏览器进 程访问网页的时间;采集终端的非浏览器进程创建时间、非浏览器进程结束时间、非浏览器 进程激活时间、非浏览器进程非激活时间。
[0038] 可选的,所述第一确定单元,包括:
[0039] 第一处理子单元,用于基于所述浏览器进程创建时间、所述浏览器进程非激活时 间、所述非浏览器进程创建时间及所述非浏览器进程非激活时间,确定所述终端创建的各 进程的最后一次非激活时间;
[0040] 第二处理子单元,用于基于所述浏览器进程访问网页的地址及所述浏览器进程访 问网页的时间,确定目标网页的访问开始时间以及所述目标网页之后的下一个访问网页的 访问开始时间;
[0041] 第三
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1